R Автоматическое извлечение лексико-семантических отношений из русскоязычных текстов » Обсуждения

Студент

Текущие результаты проекта

сен 29, 2013 | 15:09

Краткое описание паттернов и сводку результатов можно посмотреть здесь.

С текущими результатами проекта вы можете ознакомиться здесь.

Перед Вами откроются извлеченные гипо-гиперонимические отношения по результатам запуска паттернов на тексте DBPedia (1,325,858 sentences, ~47,000,000 tokens).
Числа — ссылки на полный текст из корпуса (на них можно не обращать внимание). Вквадратных скобках стоят размеченные слова, справа от них — категория (в данном случае гипоним или гипероним), в фигурные скобки включается более широкий контекст. В конце указывается по какому шаблону была произведена разметка.Пример из последней версии разметки:

{этнический[ язык]=HYPER}:{[ бейсик-инглиш]=HYPO},{[ латино]=HYPO}[PATTERN=3]

Т.е. можно выделить более общий гипероним «язык», ниже «этнический язык», еще ниже 2 когипонима «бейсик-инглиш» и «латино»

Нет комментариев

Вам необходимо зайти или зарегистрироваться для комментирования