СОВРЕМЕННЫЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ. Программное обеспечение

Романишин С.О.

Хмельницкий национальный университет, Украина

Система автоматизированного перевода с флективных языков на жестовый язык глухих

Жестовый язык (ЖЯ) – это естественный язык, передающий информацию при помощи движения рук и пальцев, выражения лица, положения корпуса тела человека. Используется как составная часть для общения людей и служит основным коммуникационным средством для глухих людей [1,2]. Жестовые языки не являются визуальной интерпретацией обычных языков; они обладают своей грамматикой, могут быть использованы для обсуждения самых различных тем: от простых и конкретных - до возвышенных или абстрактных. Лексика разговорного ЖЯ еще недостаточно изучена, особенно идиоматика, фразеология, морфология. Автоматическое приписывание разговорного ЖЯ всем формам словесной и письменной речи неверно. Нельзя рассматривать разговорный ЖЯ глухих в традиционных моделях лингвистики. В силу этого проблемы, возникающие при построении систем автоматизированного перевода произвольного текста в ЖЯ можно подать как нахождение взаимно однозначных пар конструкций вербального и жестового языков, которые передают смысл информации.

Для реализации автоматизированного перевода исходной текстовой информации в ЖЯ будем предполагать, что возможно представить пары: предложение на исходном языке – аналог на ЖЯ, в виде некоторых обобщенных конструкций, построенных, в частности, на простых предложениях. Если проанализировать наборы полученных при переводе пар, то можно, зафиксировав порядок следования слов в предложении, получить некоторую обобщенную форму, где вместо конкретных слов в предложении будут выписаны наборы слов, которые могут использоваться (находиться) на этих зафиксированных местах. Таким образом будет получен достаточно небольшой (относительно общего количества предложений некоторого языка) список обобщенных грамматических конструкций для перевода [3].

Учитывая особенности флективных языков, словарь флективного языка представляется в виде:

              (1)

где  - параметры слова флективного языка (,  – количество слов в словаре);  – множество всех возможных окончаний слов (флексий); k - номер позиции в слове инфинитиве, с которой начинается конкатенироваться флексия; In – множество параметров словоизменения слова (для украинского языка параметрам словоизменения является число, род, падеж, лицо, время, состояние, способ), I - множество слов-инфинитивов вербального языка:

,              (2)

где - множество частей речи; - слово-инфинитив.

Для ЖЯ, в связи с отсутствием в нем словоизменения, структура словаря будет несколько проще. Множество жестов подается как

,       (3)

где - обозначение жеста,  - жестовая часть речи, - множество эмоциональных окрасок жестов; .- повествовательная эмоциональная окраска, .- вопросительная эмоциональная окраска,  - другие эмоциональные окраски.

После получения инфологического представления словарей вербального и жестового языка нужно построить связанные обобщенные грамматические конструкции предложений [4]. Под предложением будем понимать последовательность слов языка и знаков препинания. Под грамматической конструкцией предложения будем понимать последовательность слов языка, относящихся к частям речи, которые передают смысл (в предложении отбрасываются служебные слова). Будем различать грамматические конструкции по количеству слов, которые в них входят. Элементами грамматических конструкций будут множества слов, встречающихся в предложениях, составляющих обучающую выборку:

   (4)

где num – номер элемента в структуре предложения украинского языка, gesnum – номер элемента в структуре предложения жестового языка, In - множество параметров словоизменения слова, P - множество частей вербального языка, PGes – множество частей жестового языка, W – множество слов вербального языка, Ges – множество жестов,

            (5)

где n – номер слова в последовательности,

,         (6)

де n – номер жеста в последовательности.

Для представления грамматических конструкций (4) предложена следующая инфологическая модель (рис. 3).

Рис.1. Инфологическая модель связей между структурами предложений и структурами жестовых предложений

Для обеспечения автоматизированного перевода с украинского на ЖЯ было построено модели словарей украинского и ЖЯ. На их основе создано множество конструкций для украинского и ЖЯ, позволяющих производить перевод фиксированного множества предложений, используемых глухими в повседневной жизни. Произведено обобщение полученных конструкций для перевода на основе структуры категорий словоизменения элементов предложений.

Дальнейшие исследования направлены на создание на основе предложенной информационной технологии веб-приложения, которое бы позволило выполнять перевод в режиме online, тестирование предложенной технологии большим количеством предложений, сбор статистики использования конструкций для перевода.

 

Литература

1.                Stokoe, W. Sign language structure: An outline of the visual communication systems of the American Deaf. Studies in linguistics, occasional papers 8. Silver Spring, MD: Linstok Press., 1960.  94 p.

2.                Зайцева Г.Л. Жестовая речь. Дактилология: Учеб. для студ. высш. учеб. заведений. - М.: Гуманит. изд. центр ВЛАДОС, 2000. 192 с.

3.                Бармак А.В. Компьютерная технология для перевода с украинского на жестовый язык / Бармак А.В., Романишин С.А. // Вестник Тернопольского национального технического университета.- 2012. №1(65).-с.195-208.(на украинском языке).

4.                Крак Ю.В. Метод обобщенных грамматических конструкций для автоматизированного перевода текстовой информации в жестовые аналоги / Крак Ю.В., Бармак А.В., Романишин С.А.// Кибернетика и системный анализ. – 2014. – № 1. – С.130-138.