Курсы » Автоматическая обработка естественного языка
Материалы для семинаров:
- Лингвистический автомат
Вопросы:- Архитектура лингвистического автомата.
- Принципы функционирования модуля машинного перевода.
- Устройство обучающего лингвистического автомата.
- Два подхода к описанию обучающего лингвистического автомата.
- Лингвистический автомат и человеко-машинный обучающий диалог.
- Пиотровский Р.Г. Лингвистический автомат (в исследовании и непрерывном обучении): 2-е дополненное и исправленное издание. - СПб.: Издательство РГПУ им. А. И. Герцена, 2008. - Главы 6 и 7.
- Пиотровская К.Р. Обучающий лингвистический автомат. Учебное пособие к спецкурсу «Основы квантитативной лингводидактики» - СПб.: Изд-во ИНТЕРЛАЙН, 2002. – С. 5-11.
- Фреймы в системах АПТ
Вопросы:- Фреймы в системах машинного перевода
- Фреймы и семантика понимания
- Концептуальный подход к обработке языка
- Теория концептуальной зависимости
- Элементы теория концептуальной зависимости: роли, правила, действия, состояния
- Пиотровский Р.Г. Новые горизонты машинного перевода // НТИ/2, 2002, №1
- Филлмор Ч. Фреймы и семантика понимания // Новое в зарубежной лингвистике. Вып. XXIII. Когнитивные аспекты языка: Пер. с англ. — М.: Прогресс, 1988. С. 52-93.
- Шенк Р. Обработка концептуальной информации. Пер. с англ. — М.: Энергия, 1980. — С. 7-68.
- Переводческая память
- Конечные преобразователи (КП)
Вопросы:- Устройство конечного преобразователя.
- КП для морфологической обработки.
- Орфографические правила в КП.
- Лексикон и правила в КП, стеммер Портера.
- Выделение слов и предложений (токенизация).
- Коррекция орфографии на примере алгоритма минимального расстояния.
- Информационный поиск
Вопросы:- Определение лексикона терминов.
- Словопозиции с координатами и фразовые запросы.
- Криптография
Вопросы:- История русской тайнописи
- Шифр "Магический квадрат"
- Метод Юлия Цезаря
- Квадрат Полибия
- Метод Гронсфельда
- Метод Порта
- Симметричный алгоритм DES
- Ассиметричный алгоритм RSA
- Системы автоматического синтеза речи
- Искусственные нейронные сети для обработки естественного языка
Вопросы:- Семантико-синтаксическое представление информации с помощью простых рекуррентных сетей.
- Автоматическая рубрикация документов с использованием самооргани-зующихся карт Кохонена. Формализмы WebSOM и TopSOM.
- Автоматическая обработка ЕЯ с использованием субсимвольных нейронных сетей.
- Stolcke, A. Learning Feature-based Semantics with Simple Recurrent Networks / Andreas Stolcke. — ICSI Technical Report tr-90-015, April 1990.
- Browsing digital libraries with the aid of self-organizing maps / K. Lagus, S. Kaski, T. Honkela, T. Kohonen // Proceedings of the Fifth International World Wide Web Conference WWW5, May 6–10, Paris, France, volume Poster Proceed-ings, 1996. — P. 71–79.
- Плешко, В.В. TopSOM: визуализация информационных массивов с применением самоорганизующихся тематических карт / В.В. Плешко, А.Е. Ермаков, Г.В. Липинский // Информационные технологии. — 2001. — № 8. — С. 8–11.
- Miikkulainen, R. Natural Language Processing with Subsymbolic Neural Networks / Risto Mikkulainen // A. Browne (editor), Neural Network Perspectives on Cognition and Adaptive Robotics. Institute of Physics Publishing, 1997.
Дополнительные материалы:
- Семинар: Natural Language Processing
http://mathlingvo.ru/nlpseminar - Видео-курс Hands-on Natural Language Processing for Information Access Applications (Horacio Saggion, Department of Molecular Biology and Biotechnology, University of Sheffield) // RuSSIR'2008
http://videolectures.net/russir08_saggion_nlpiaa/