Поисковый модуль

Материал из Semograph
Версия от 20:02, 14 июля 2014; Belousov (обсуждение | вклад)

(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к: навигация, поиск

Поисковый модуль осуществляет поиск контента в сети Интернет с помощью фреймворка Scrapy и библиотеки скриптов. После извлечения, структурированные данные отправляются на сервер Solr. Дальнейший доступ к полученным данным осуществляется через специальный интерфейс, встроенный в ИС “Семограф”, с возможностью непосредственного импорта данных из Solr в проект “Семографа”. Поисковый модуль также позволяет выполнить следующие действия: 1) используя платформу Solr, осуществлять поиск по ключевым словам; 2) формировать таблицу статистических данных по ключевым словам; 3) осуществлять кластерный анализ на основе статистических данных; 4) формировать графическое представление результата кластерного анализа; 5) передавать данные в Проект Семографа.