Стохастическая роевая кластеризация в задачах автоматизированной обработки данных, представленных на естественном языке

By | 07.11.2018

В журнале Экспериментальная психология, 2018. Том. 11, № 3 опубликована статья авторов Юрьев Г.А., Верховская Е.К.,  Юрьева Н.Е. «Стохастическая роевая кластеризация в задачах автоматизированной обработки данных, представленных на естественном языке».

В статье рассматривается метод обработки данных, представленных на естественном языке, использующий стохастический алгоритм нелинейного снижения размерности многомерных данных, учитывающий дискриминирующую силу найденного решения для заданных значений категориальной переменной, связанной с каждым наблюдением. Для поиска характеристик, обеспечивающих наилучшее разделение наблюдений в смысле заданного функционала качества, предлагается использовать численную процедуру, основанную на методе оптимизации, известном как «Метод роя частиц». В основе оценки качества решения лежит чистота кластеров, полученных в найденном пространстве методом k-средних, либо с использованием самоорганизующихся карт Кохонена. С полным тестом статьи можно ознакомиться на сайте журнала.

Работа выполнена при финансовой поддержке Министерства образования и науки Российской федерации в рамках соглашения о предоставлении субсидии от «26» сентября 2017 г. № 14.579.21.0092 (Уникальный идентификатор соглашения — RFMEFI57617X0092) на выполнение прикладных научных исследований и экспериментальных разработок по теме: «Разработка нейросетевой системы прогнозирования авиа происшествий и управления рисками безопасности полетов на основе ретроспективных данных, включающих множество параметров и текстовых описаний событий».