Поисковый модуль
Материал из Semograph
Поисковый модуль осуществляет поиск контента в сети Интернет с помощью фреймворка Scrapy и библиотеки скриптов. После извлечения, структурированные данные отправляются на сервер Solr. Дальнейший доступ к полученным данным осуществляется через специальный интерфейс, встроенный в ИС “Семограф”, с возможностью непосредственного импорта данных из Solr в проект “Семографа”. Поисковый модуль также позволяет выполнить следующие действия:
- Используя платформу Solr, осуществлять поиск по ключевым словам;
- Формировать таблицу статистических данных по ключевым словам;
- Осуществлять кластерный анализ на основе статистических данных;
- Формировать графическое представление результата кластерного анализа;
- Передавать данные в Проект Семографа.