Структура папок

Верхний уровень

  • app - код приложения
  • bootstrap - конфигурация (коннект к БД, начальные константы, способы логгирования), роутинг
  • datasets - готовые валидированные датасеты для обработки
  • docs - эта документация в mk-docs
  • logs - логи. По умолчанию в конфиге вместо логгирования в файлы стоит вывод на экран (в консоль), см. папку bootstrap
  • resourses - фронтэнд для браузера
  • seeds - сиды баз данных
  • temp - папка закачивания документов и прочей информации для парсинга. По умолчанию после успешного парсинга отпарвшенные документы удаляются, но в демо версии сохраняются для всесторонней проверки

App

  • controller - контроллеры приложения
  • libraries - библиотеки приложения
  • models - модели работы с БД

Controller

  • в корне контроллеры, НЕ наслеюдущие ни один из интерфейсов
  • Api - контроллеры, реализующие интерфейс Api
  • Crons - контроллеры, реализующие интерфейс кронов
  • Parsers - контроллеры, реализующие интерфейс парсеров

Libraries - библиотеки именно этого сервиса, самописные

  • Dataparser - библиотека разбора всех видов электронных таблиц и массивов строк и данных, приводимых к табличным, по аналитическому шаблону
  • Lexicon - библиотека синтаксической обработки и анализа текстов, выборки и генерации стэммов, перевода частей речи
  • ods-php-parser - переписанный парсер ods файлов авторства
  • Parsers - папка с библиотеками парсинга
  • Regions - библиотека работы с русскими названия стран и регионов и сведениями о них (инкапсулирована, не требует БД) и валидации названий
  • Statistic - библиотека статистической обработки на основе метода моментов по российскому ГОСТУ (смещенная дисперсия, коэффициенты для Стьюдента и Фишера по ГОСТу, а не из википедии и т д), реализущая дополнительные функции поиска псевдо-квартилей и корреляций
  • в корне папки набор статических методов - хелпер и логгер

Parsers - специализированные инкапсулированные библиотеки парсинга

  • EcoCrop - парсинг базы ecocrop (исходник базы лежит в папке datasets) - базы приживаемости растений по экоиндикаторам
  • Elenberg - парсинг наиболее актуального набора эко-индикаторов по Эленбергу (так же лежит в datasets)
  • impdb - парсер базы растений с сайта impdb.ru "на лету" - формирует БД
  • Lecar - парсер датасета лекарственных растений
  • Narodmon - сбор данных с сервиса narodmon (лицензия соблюдается)
  • OptionsPlus - парсер op файлов (используется для хранения данных наблюдений со времен телетайпов) + парсер файлов метеостанций из архивов op с их разбором.
  • RusGidro - прямой парсер информеров русгидро + отдельный парсер сведений о ГЭС, с информеров которых собираются данные.