Поисковый модуль — различия между версиями

Материал из Semograph
Перейти к: навигация, поиск
 
Строка 3: Строка 3:
 
Дальнейший доступ к полученным данным осуществляется через специальный интерфейс, встроенный в ИС “Семограф”, с возможностью непосредственного импорта данных из Solr в проект “Семографа”.  
 
Дальнейший доступ к полученным данным осуществляется через специальный интерфейс, встроенный в ИС “Семограф”, с возможностью непосредственного импорта данных из Solr в проект “Семографа”.  
 
Поисковый модуль также позволяет выполнить следующие действия:
 
Поисковый модуль также позволяет выполнить следующие действия:
# используя платформу Solr, осуществлять поиск по ключевым словам;
+
# Используя платформу Solr, осуществлять поиск по ключевым словам;
# формировать таблицу статистических данных по ключевым словам;
+
# Формировать таблицу статистических данных по ключевым словам;
# осуществлять кластерный анализ на основе статистических данных;
+
# Осуществлять кластерный анализ на основе статистических данных;
# формировать графическое представление результата кластерного анализа;
+
# Формировать графическое представление результата кластерного анализа;
# передавать данные в Проект Семографа.
+
# Передавать данные в Проект Семографа.

Текущая версия на 10:42, 21 февраля 2017

Поисковый модуль осуществляет поиск контента в сети Интернет с помощью фреймворка Scrapy и библиотеки скриптов. После извлечения, структурированные данные отправляются на сервер Solr. Дальнейший доступ к полученным данным осуществляется через специальный интерфейс, встроенный в ИС “Семограф”, с возможностью непосредственного импорта данных из Solr в проект “Семографа”. Поисковый модуль также позволяет выполнить следующие действия:

  1. Используя платформу Solr, осуществлять поиск по ключевым словам;
  2. Формировать таблицу статистических данных по ключевым словам;
  3. Осуществлять кластерный анализ на основе статистических данных;
  4. Формировать графическое представление результата кластерного анализа;
  5. Передавать данные в Проект Семографа.