Головная страница ИПМ Библиотеки, издания  •  Поиск публикаций  English 
Публикация

Препринт ИПМ № 106, Москва, 2017 г.
Авторы: Борисов Л.А., Ивченко А.Ю., Митин Н.А., Орлов Ю.Н.
Тематическая классификация текстов с помощью спектральных портретов
Аннотация:
В работе рассмотрены примеры применения метода спектрального анализа несимметричных матриц для построения классификационных индикаторов при структурировании текстовой информации большого объема. Обнаружилась возможность классификации текстов по тематике на основе анализа структуры инвариантных подпространств стохастической матрицы условных вероятностей парных буквосочетаний. Выяснилось, что тексты весьма достоверно могут быть классифицированы как литературные, научные по психологии, философии, а также по естественным наукам. Индикатором разделения служит величина близости к нулю косинуса угла между левым и правым собственными векторами, отвечающими соответственно минимальному и максимальному действительным собственным значениям стохастической матрицы условных вероятностей пар буквосочетаний.
Ключевые слова:
стохастическая матрица, спектральный портрет, классификация текстов
Язык публикации: русский, страниц: 22
Направление исследований:
Математическое моделирование в актуальных проблемах науки и техники
Полный текст: Сведения об авторах:
  • Борисов Леонид Андреевич,  ,  ИПМ им. М.В. Келдыша РАН
  • Ивченко Анастасия Юрьевна,  ,  ИПМ им. М.В. Келдыша РАН
  • Митин Николай Алексеевич,  ,  ИПМ им. М.В. Келдыша РАН
  • Орлов Юрий Николаевич,  ,  ИПМ им. М.В. Келдыша РАН