Cовременные информационные технологии / 3.Программное обеспечение

Романишин С.О.

Хмельницкий национальный университет, Украина

Создание словарей украинского и жестового языков для системы автоматизированного перевода с украинского на жестовый язык

Современное состояние мирового сообщества продуцирует определенное отношение к людям с особыми потребностями. Важной становится проблема увеличения степени участия людей с особыми потребностями в социуме.

Важной на сегодня является проблема создания современных информационных технологий, включающих методы, с помощью которых можно было бы создавать новые компьютерные системы обучения и коммуникации для людей с нарушениями слуха. Для решения этой проблемы предложена концепция информационной технологии невербального общения людей с недостатками слуха [1]. Одним из направлений концепции является создание автоматизированной системы перевода с украинского на жестовый язык.

Жестовый язык – это самостоятельный, естественно возникший язык, состоящий из комбинации жестов, каждый из которых производится руками в сочетании с мимикой, формой или движением рта и губ, а также в сочетании с положением корпуса тела.

Лексика разговорного жестового языка еще недостаточно изучена, особенно идиоматика, фразеология, морфология. Автоматическое приписывание разговорного жестового языка всем формам словесной и письменной речи неверно. Для описания фактов морфологии разговорной жестовой речи больше подходит описание по принципу: от значения - к форме. Значение «множественности», «времени», «принадлежности», «окончание действия» передаются в жестовом речи своими способами. В зависимости от значения меняется и способ выполнения жеста (качество движения). Разговорный жестовый язык - это самобытный язык, позволяющий выразить любые смыслы и отношения между смыслами.

Для обеспечения перевода с украинского на жестовый язык необходимо реализовывать систему автоматизированного перевода предложений на украинском языке на соответствующие конструкции-предложения украинского жестового языка.

Предлагается решение поставленной задачи со следующими ограничениями:

1) учитываются только простые предложения;

2) смысл жестового языка ограничивается фиксированным перечнем тем и ситуаций;

3) система переводит (без последующих поправок) только обученные жестко заданные структуры фраз и предложений и не искажает смысла;

4) возможно постоянное расширение (обучение) перечень структур перевода.

Для достижения цели перевода было построено грамматический словарь украинского языка. Украинский язык относится к флективным языкам - языкам синтетического типа, в котором доминирует словоизменение с помощью флексий - формантов, сочетающих сразу несколько значений. Флективное строение языка противостоит агглютинативному, в котором каждый формант несет только одно значение. Для разработки грамматического словаря использовалась теория лексикографических систем [2-3].

Украинскому языку присущи следующие грамматические категории, определяющие словоизменение: - множественность,  - род,  - обобщенная категория, включающая падеж, лицо, время, состояние, способ. Так же каждое слово украинского языка классифицируем за частями речи () [4].

Исходя из того, что украинский язык является флективным языком (т.е. грамматические значения передаются флексиями), слова языка моделируются в виде комбинации неизменной и переменной составляющих:

                                                                                           (1)

где – часть лексемы х, которая в процессе словоизменения остается неизменной (квазиоснова), – ее переменная составляющая (квазифлексия), & – конкатенация.

Реализация такой модели хранения слова обретает излишнюю избыточность, имея в виду, что в украинском языке несколько миллионов слов (во всех словоизменениях) и только у 100 000 базовых слов - инфинитивов. То есть вместо полного текста слова в таблице хранится номер слова-инфинитива с соответствующего множества инфинитивов, номер позиции в слове к которой слово-инфинитив неизменное и номер флексии (переменной части слова) с соответствующего множества.

То есть, слова украинского языка подаются:

                        ,                    (2)

где  - параметры слова украинского языка (,  количество слов в словаре);  - множество всех возможных окончаний слов (флексий);  - номер позиции в слове инфинитиве, с которой начинается конкатенуватся флексия (возможны случаи, когда  - для словоформы, полностью отменной от инфинитива); ; ;  - множество слов-инфинитивов украинского языка (для глаголов - инфинитивы, для существительных - слова в именительном падеже, числе и т.д.):

                                       ,                                  (3)

где ; - слово-инфинитив [4].

Формирование множеств  происходит следующим образом (для всех слов-инфинитивов языка):

·         Вход: слово-инфинитив и все его словоформы (грамматические значения)

·          Длина (общая часть для слова-инфинитива и всех его словоформ)

·         Для всех словоформ определяем окончания (отличная часть) и добавляем его к множеству  (если такого окончания там нет)

·         Добавляем слово-инфинитив множеству

·         Формируем множество  (2)

Задачей для такой модели (2) есть простая задача воспроизведения полного текста слова по трем параметрам , реализуемая соответствующим оператором ():

                                     ,                                (4)

где  - функция получения первых  символов из слова ; & - конкатенация.

Для жестового языка, в связи с отсутствием в нем словоизменений, структура словаря будет несколько проще.  Инфологическую модель украинского и  жестового языков можно отобразить следующим образом:

Рис. Инфологическая модель словарей украинского и жестового языков

В таблице «Словарь украинского языка» содержится множество слов украинского языка (W), множества флексий (F) и инфинитивов (I) – в таблицах «Флексии» и «Инфинитивы соответственно». Для каждого из слов хранятся ссылки на грамматические категории, определяющие словоизменение и часть речи. Множество жестов содержится в таблице «Словарь жестов» и содержит ссылки на слово, которым обозначается данный жест и тематику, в которой он чаще всего используется.

         Такая структура словарей украинского и жестового языков позволяет создать систему автоматизированного перевода с украинского на жестовый язык.

Литература:

1.   Кривонос Ю.Г. Інформаційна технологія для моделювання української мови жестів / Кривонос Ю.Г., Крак Ю.В., Бармак О.В. [та ін.] // Штучний інтелект. – 2009. №3 – с. 186-197.

2.   Широков В.А. Інформаційна теорія лексикографічних систем / Широков В.А. // – К.: Довіра, - 1998. – 331с.

3.   Широков В.А. та ін. Корпусна лінгвістика: Монографія / Широков В.А., Бугаков О.В., Грязнухіна Т.О.,[та ін.] // Український мовно-інформаційний фонд НАН України. – К.: Довіра, 2005. – 472 с.

4.   Бармак О, Романишин С. Комп’ютерна технологія для перекладу з української на жестову мову / Бармак О, Романишин С. // Вісник Тернопільського національного технічного університету.- 2012. №1(65).-с.195-208.