Оcтавить заявку (495) 981-63-11
 

Лингвистика

В нашей компании работает очень сильный коллектив лингвистов и прикладных математиков, специализирующихся на обработке естественно-языковых данных.

Морфология

Для учета словоизменения мы используем в своих проектах два типа морфологических модулей — словарные и «нечеткие» (бессловарные).

Морфологические модули обоих типов имеются для русского, английского и украинского языков, модули нечеткой морфологии — для ряда других европейских языков. В случае необходимости учет словоизменения практически любого нового языка может быть обеспечен в кратчайшие сроки.

Выделение объектов

Основу технологии Гиперпоиск составляет выделение в текстах новостей разного рода «объектов» — имен, названий фирм и организаций, торговых марок, географических названий и т. п. Причем многие из них распознаются в нескольких вариантах (Аз-Заркави и Аль-Заркауи, Мосгордума и Московская городская дума), и для каждого может быть получена начальная форма.

Дайджесты

В настоящее время проходит тестирование технология реферирования текстов, позволяющая автоматически порождать, например, для новостного сюжета в Новотеке краткое связное изложение заданной длины — дайджест.