R Автоматическое извлечение лексико-семантических отношений из русскоязычных текстов » Обсуждения

Студент

Bookmark and Share




Текущие результаты проекта

сен 29, 2013 | 15:09

Краткое описание паттернов и сводку результатов можно посмотреть здесь.

С текущими результатами проекта вы можете ознакомиться здесь.

Перед Вами откроются извлеченные гипо-гиперонимические отношения по результатам запуска паттернов на тексте DBPedia (1,325,858 sentences, ~47,000,000 tokens).
Числа  — ссылки на полный текст из корпуса (на них можно не обращать внимание). Вквадратных скобках стоят размеченные слова, справа от них — категория (в данном случае гипоним или гипероним), в фигурные скобки включается более широкий контекст. В конце указывается по какому шаблону была произведена разметка.Пример из последней версии разметки: 

{этнический[ язык]=HYPER}:{[ бейсик-инглиш]=HYPO},{[ латино]=HYPO}[PATTERN=3]
 
Т.е. можно выделить более общий гипероним «язык», ниже «этнический язык», еще ниже 2 когипонима «бейсик-инглиш» и «латино»


Нет комментариев  

Вам необходимо зайти или зарегистрироваться для комментирования