Поисковый модуль
Материал из Semograph
Версия от 10:41, 21 февраля 2017; Belousov (обсуждение | вклад)
Поисковый модуль осуществляет поиск контента в сети Интернет с помощью фреймворка Scrapy и библиотеки скриптов. После извлечения, структурированные данные отправляются на сервер Solr. Дальнейший доступ к полученным данным осуществляется через специальный интерфейс, встроенный в ИС “Семограф”, с возможностью непосредственного импорта данных из Solr в проект “Семографа”. Поисковый модуль также позволяет выполнить следующие действия:
- используя платформу Solr, осуществлять поиск по ключевым словам;
- формировать таблицу статистических данных по ключевым словам;
- осуществлять кластерный анализ на основе статистических данных;
- формировать графическое представление результата кластерного анализа;
- передавать данные в Проект Семографа.