English (United Kingdom) 
Русский (Россия) 
Український (Україна) 

Міжнародна наукова конференція MEGALING

  • Збільшення розміру шрифта
  • Звичайний розмір шрифта
  • Зменшити розмір шрифта
Головна сторінка > MEGALING`2012 - тези > БАЛАБІН ВІКТОР ВОЛОДИМИРОВИЧ ЗАМАРУЄВА ІРИНА ВІКТОРІВНА. ПОБУДОВА МОДЕЛІ ЗНАНЬ ПРО ПРЕДМЕТНУ ОБЛАСТЬ НА ОСНОВІ КОРПУСА РІЗНОМОВНИХ ТЕКСТІВ ПЕВНОЇ ТЕМАТИЧНОЇ СПРЯМОВАНОСТІ

БАЛАБІН ВІКТОР ВОЛОДИМИРОВИЧ ЗАМАРУЄВА ІРИНА ВІКТОРІВНА. ПОБУДОВА МОДЕЛІ ЗНАНЬ ПРО ПРЕДМЕТНУ ОБЛАСТЬ НА ОСНОВІ КОРПУСА РІЗНОМОВНИХ ТЕКСТІВ ПЕВНОЇ ТЕМАТИЧНОЇ СПРЯМОВАНОСТІ

Військовий інститут Київського національного університету імені Тараса Шевченка
Київ, Україна

e-mail: Ця електронна адреса захищена від спам-ботів, Вам потрібно включити JavaScript для перегляду

В доповіді висвітлюються особливості побудови формальної моделі знань про предметну область на основі різномовних текстів заданої тематичної спрямованості та її використання для усунення синтаксичної і лексико-граматичної омонімії в багатомовних системах машинного перекладу. Під формальною моделлю знань про фрагменти навколишнього світу (предметну область) будемо розуміти предикатну структуру, що включає поняття, відношення та характеристики понять і відношень. Процес побудови моделі знань відбувається у декілька етапів. На першому етапі фахівцем (експертом) укладаються базові поняття із заданої предметної області. Системні відношення між базовими поняттями формуються в результаті аналізу відповідних текстів однієї мови (в нашому випадку – української) і представляються у вигляді тезауруса. Призначення даного тезауруса – преставити так звані «вертикальні» відношення між базовими поняттями, що існують в предметній області, і які не залежать від їх контекстного вживання. Визначаються наступні відношення, які зафіксовані в тезаурусі: частина-ціле, рід-вид, синонімії, антонімії. На другому етапі за усіма дискрипторами, що увійшли до тезауруса, формується корпус різномовних текстів відповідної заданої тематики. На цьому етапі корегується тезаурус, побудований на попередньому етапі. Це пов’язане з тим, що класифікація знань про предметну область в різних мовах, як правило, не співпадають. На третьому етапі за корпусом різномовних текстів формуються так звані «горизонтальні» відношення, тобто ті відношення, які проявляються безпосередньо в контексті. Результати третього етапу представляються у вигляді так званої матриці істиності, кожний рядок якої є предикатна формула.

Запропонована модель представлення знань про предметну область дозволяє усувати синтаксичну омонімію при автоматичному перекладі, а також у разі появи у тексті нового поняття, відсутнього у перекладному словнику, автоматично добрати контекстний синонім до нового слова.

ВКЛАДЕННЯ:
FileОписFile size
Download this file (Zamarueva_tezy.pdf)Zamarueva_tezy.pdfPDF246 Kb
 


ПОШУК ПО САЙТУ

Наші партнери

http://www.ulif.org.ua - Український мовно-інформаційний фонд НАН України

http://nbuv.gov.ua - Національна бібліотека імені В.І. Вернадського

http://www.tnu.crimea.ua/ - Таврійський Національний Університет ім. В.І.Вернадського

КОНТАКТИ

Український мовно-інформаційний фонд НАН України (www.ulif.org.ua), тел.: (+38-044) 525-86-75

Заїка Наталія Михайлівна (e-mail: zayika.n@nas.gov.ua, тел.: (+38) 050-072-83-37)

Остапова Ірина Вадимівна (e-mail: irinaostapova@gmail.com, тел.: (+38) 095-886-37-82)

Єрошенко Олександр Русланович (e-mail: alexandr.yeroshenko@hotmail.com, тел.: (+38-044) 466-74-08