Cовременные информационные
технологии / 3.Программное
обеспечение
Романишин С.О.
Хмельницкий национальный
университет, Украина
Создание словарей украинского и жестового языков для системы
автоматизированного перевода с украинского на жестовый язык
Современное состояние мирового сообщества продуцирует
определенное отношение к людям с особыми потребностями. Важной становится
проблема увеличения степени участия людей с особыми потребностями в социуме.
Важной на сегодня является проблема
создания современных информационных технологий, включающих методы, с помощью
которых можно было бы создавать новые компьютерные системы обучения и
коммуникации для людей с нарушениями слуха. Для решения этой проблемы
предложена концепция информационной технологии невербального общения людей с
недостатками слуха [1]. Одним из направлений концепции
является создание автоматизированной системы перевода с украинского на жестовый
язык.
Жестовый язык – это самостоятельный,
естественно возникший язык,
состоящий из комбинации жестов,
каждый из которых производится руками в сочетании с мимикой, формой или движением рта и губ, а также в сочетании с
положением корпуса тела.
Лексика разговорного жестового языка еще
недостаточно изучена, особенно идиоматика, фразеология, морфология.
Автоматическое приписывание разговорного жестового языка всем формам словесной
и письменной речи неверно. Для описания фактов морфологии разговорной жестовой
речи больше подходит описание по принципу: от значения - к форме. Значение
«множественности», «времени», «принадлежности», «окончание действия» передаются
в жестовом речи своими способами. В зависимости от значения меняется и способ
выполнения жеста (качество движения). Разговорный жестовый язык - это
самобытный язык, позволяющий выразить любые смыслы и отношения между смыслами.
Для обеспечения перевода с украинского на
жестовый язык необходимо реализовывать систему автоматизированного перевода
предложений на украинском языке на соответствующие конструкции-предложения
украинского жестового языка.
Предлагается решение поставленной задачи со следующими
ограничениями:
1) учитываются только простые предложения;
2) смысл жестового языка ограничивается фиксированным
перечнем тем и ситуаций;
3) система переводит (без последующих поправок) только
обученные жестко заданные структуры фраз и предложений и не искажает смысла;
4) возможно постоянное расширение
(обучение) перечень структур перевода.
Для достижения цели перевода было
построено грамматический словарь украинского языка. Украинский язык относится к
флективным языкам - языкам синтетического типа, в котором доминирует
словоизменение с помощью флексий - формантов, сочетающих сразу несколько
значений. Флективное строение языка противостоит агглютинативному, в котором
каждый формант несет только одно значение. Для разработки грамматического
словаря использовалась теория лексикографических систем [2-3].
Украинскому
языку присущи следующие грамматические категории, определяющие словоизменение:
- множественность,
- род,
- обобщенная
категория, включающая падеж, лицо, время, состояние, способ. Так же каждое
слово украинского языка классифицируем за частями речи (
) [4].
Исходя из того, что украинский язык является
флективным языком (т.е. грамматические значения передаются флексиями), слова
языка моделируются в виде комбинации неизменной и переменной составляющих:
(1)
где
– часть лексемы х, которая в процессе словоизменения остается неизменной
(квазиоснова),
– ее переменная составляющая (квазифлексия), & –
конкатенация.
Реализация такой модели хранения слова обретает
излишнюю избыточность, имея в виду, что в украинском языке несколько миллионов
слов (во всех словоизменениях) и только у 100 000 базовых слов - инфинитивов.
То есть вместо полного текста слова в таблице хранится номер слова-инфинитива с
соответствующего множества инфинитивов, номер позиции в слове к которой
слово-инфинитив неизменное и номер флексии (переменной части слова) с
соответствующего множества.
То есть, слова украинского языка подаются:
, (2)
где
- параметры слова украинского языка (
,
– количество слов в словаре);
- множество всех возможных окончаний слов (флексий);
- номер позиции в слове инфинитиве, с которой начинается
конкатенуватся флексия (возможны случаи, когда
- для словоформы, полностью отменной от инфинитива);
;
; ![]()
- множество слов-инфинитивов украинского языка (для
глаголов - инфинитивы, для существительных - слова в именительном падеже, числе
и т.д.):
, (3)
где
;
- слово-инфинитив [4].
Формирование множеств
происходит следующим образом (для всех
слов-инфинитивов языка):
·
Вход: слово-инфинитив и все его словоформы
(грамматические значения)
·
Длина (общая часть для слова-инфинитива и всех его
словоформ)
·
Для всех словоформ
определяем окончания (отличная часть) и добавляем его к множеству
(если такого окончания
там нет)
·
Добавляем
слово-инфинитив множеству ![]()
·
Формируем множество
(2)
Задачей для такой модели (2) есть простая задача
воспроизведения полного текста слова по трем параметрам
, реализуемая
соответствующим оператором (
):
, (4)
где
- функция получения первых
символов из слова
; & - конкатенация.
Для жестового языка, в связи с отсутствием в нем
словоизменений, структура словаря будет несколько проще. Инфологическую модель украинского
и жестового языков можно отобразить
следующим образом:

Рис. Инфологическая
модель словарей украинского и жестового языков
В таблице «Словарь украинского языка» содержится
множество слов украинского языка (W), множества флексий (F) и инфинитивов (I) – в
таблицах «Флексии» и «Инфинитивы соответственно». Для каждого из слов хранятся
ссылки на грамматические
категории, определяющие словоизменение и часть речи. Множество жестов
содержится в таблице «Словарь жестов» и содержит ссылки на слово, которым
обозначается данный жест и тематику, в которой он чаще всего используется.
Такая
структура словарей украинского и жестового языков позволяет создать систему
автоматизированного перевода с украинского на жестовый язык.
Литература:
1.
Кривонос Ю.Г.
Інформаційна технологія для моделювання української мови жестів / Кривонос
Ю.Г., Крак Ю.В., Бармак О.В. [та ін.] // Штучний інтелект. – 2009. №3 – с.
186-197.
2.
Широков В.А.
Інформаційна теорія лексикографічних систем / Широков В.А. // – К.: Довіра, -
1998. – 331с.
3.
Широков В.А. та
ін. Корпусна лінгвістика: Монографія / Широков В.А., Бугаков О.В., Грязнухіна
Т.О.,[та ін.] // Український мовно-інформаційний фонд НАН України. – К.:
Довіра, 2005. – 472 с.
4.
Бармак О, Романишин С. Комп’ютерна технологія для перекладу з української
на жестову мову / Бармак О, Романишин С. // Вісник Тернопільського
національного технічного університету.- 2012. №1(65).-с.195-208.