Поиск

Полнотекстовый поиск:
Где искать:
везде
только в названии
только в тексте
Выводить:
описание
слова в тексте
только заголовок

Рекомендуем ознакомиться

'Документ'
Акт провозглашения независимости Украины, принятие Конституции обусловили необходимость дальнейшего укрепления правовой основы государственной и обще...полностью>>
'Лекция'
Прокариоты. Все прокариоты объединены в надцарство Прокариоты, царство Дробянки в котором выделяют три подцарства – архебактерии, эубактерии (настоящи...полностью>>
'Книга'
Прежде чем начать речь о приемах преподавания Закона Божия, необходимо сказать несколько слов о пользе и необходимости знать эти приемы не только для...полностью>>
'Самостоятельная работа'
Назначение мониторинга и классификация видов мониторинга; система методов наблюдения и наземного обеспечения; обратные связи и управление; методы кон...полностью>>

Дударь З. В., Церковный А. К

Главная > Документ
Сохрани ссылку в одной из сетей:

Методы кластеризации информационных ресурсов

Дударь З.В., Церковный А.К.

Современные поисковые системы зачастую выдают бесчисленное множество совершенно не относящихся к запросу документов, обрекая пользователя на длительный ручной отбор материала. Предназначенное, в конечном счете, для практического использования содержание Web-ресурсов вышло за рамки обозримости и операбельности, а задача исследования и обработки массивов, рассредоточенных по Интернету данных, стала превращаться из естественной составляющей нормального информационного процесса в сверхсложную, а то и вовсе неразрешимую проблему. Особенно остро эта проблема стоит при автоматизированном формировании электронных библиотек (ЭБ). Кластеризация и классификация текстовых документов для электронных библиотек рассматривается как один из возможных вариантов решения данной проблемы.

Кластеризация текстовых коллекций – это вычислительное определение наличия и состава тематически (содержательно) однородных групп в текстовой коллекции в случае, когда априорное описание групп отсутствует. В результате кластеризации для каждой из найденных тематических групп определяются состав группы (список входящих в группу документов), ключевые слова и аннотация группы, дающие пользователю агрегированную информацию о тематике документов группы. Основные тематические группы могут быть по запросу пользователя дополнительно объединены в более крупные группы, а внутри каждой из групп могут быть выделены более мелкие тематические подгруппы (проведена вторичная кластеризация).

Рассматриваемые в докладе методы ориентированы на использование в рамках специализированных электронных библиотек с сервисами высокоточного семантического поиска и анализа текстовой информации. Также показаны возможности использования результатов кластеризации текстовых коллекций (состава тематически однородных групп, их ключевых слов и аннотаций) в организации эффективных диалоговых процедур формирования и уточнения запросов, адекватных информационной потребности пользователя.

Вычислительное распределение соответствующих запросу пользователя документов по тематическим группам, выявленным в результате кластеризации всех документов текстовой коллекции, дает достоверную оценку тематических и семантических контекстов, на основании которых формируются группы документов, релевантных запросу пользователя и обладающих высокими показателями качества данных.



Скачать документ

Похожие документы:

  1. Дудар Н. П., Филипович Л. О. Д81 Нові релігійні течії: український контекст (огляд, документи, переклади)

    Книга
    Рекомендовано до друку вченою радою Відділення реліг­ієзнавства Інституту філософії ім. Г.С. Сковороди НАН Ук­раїни (протокол №8 від 2.06.2 р.) та вченою радою Украї­нського інституту соціальних досліджень (протокол №1(12) від 14.
  2. Ли Волинь знаходилась в складі Російської імперії, в селі існувала церковно-приходська школа, яка знаходилась у звичайному будинку недалеко Михайлівської церкви

    Документ
    До 1918 року, коли Волинь знаходилась в складі Російської імперії, в селі існувала церковно-приходська школа, яка знаходилась у звичайному будинку недалеко Михайлівської церкви.
  3. Александр фаминцын и история русской музыки

    Документ
    Александр Сергеевич Фаминцын, автор книг «Скоморохи на Руси», «Гусли, русский народный музыкальный инстру­мент», «Домра и сродные ей музыкальные инструменты рус­ского народа», «Божества древних славян», множества статей и переводов,
  4. История Северного Кавказа в печатных изданиях. Библиографический справочник

    Справочник
    – 1 . - № 39. Главнейшие узаконения и распоряжения за 189 -1893 гг. – СПб.,1894. Дедюлин С.А. Недостатки порядка отчуждения земель на государственные и общественные надобности (Приложение к Сборнику Узаконений по отчуждению земель).
  5. Ахмад сулейманов топонимия чечни

    Книга
    Автор настоящей книги, А. С. Сулейманов, краевед, историк и поэт, посвятил десятки лет сбору и обработке топонимических названий на территории исторического проживания чеченского народа.

Другие похожие документы..