Филологические науки / 3. Теоретические и методологические проблемы исследования языка
К.ф.н. Кійко С.В.
Чернівецький національний
університет, Україна
Принципи виділення морфологічних омонімів
у сучасній німецькій мові
У більшості праць з омонімії як явища збігу в одному звучанні різних за значенням слів дослідники обмежуються розглядом формально-смислових відношень на рівні лексем, тобто ігнорують факти словозміни, здатності слова виступати в декількох формах, які розрізняються за граматичним значенням і звучанням (написанням). Це зумовлено в першу чергу тим, що омоформи, які репрезентують омонімію форм всередині парадигми й омонімію між формами різних лексем, не фіксуються в словниках. Про складність виділення та повної фіксації омоформів говорять багато лінгвістів, які були свідомі того, що процес укладання таких списків надзвичайно трудомісткий і не може забезпечити достатньої повноти реєстру омоформів [1, с. 358; 6, с. 157-170]. Загалом проблема омонімії на рівні словоформ не є новою: питання морфологічної неоднозначності словоформ розглядалися багатьма лінгвістами як в теоретичному, так і в практичному плані в площині “розуміння” текстів природної мови комп’ютером [5, с. 164-192; 6, с. 101-102]. Проте даних про поширеність омоформів у різних мовах практично нема, за винятком ґрунтовних розвідок Л.В. Малахівського на матеріалі англійської мови [6, с. 103-141] і О.О. Шипнівської на матеріалі української мови [8]. Дослідження кількісних та якісних особливостей граматичної омонімії в німецькій мові на основі суцільної вибірки омоформів досі не проводилося, що й зумовлює актуальність нашої розвідки.
Формування
реєстру омоформів вимагає розробки спеціальної методики. У нашій роботі для укладання повного списку
морфологічних омонімів німецької мови запропоновано методику виділення
омонімів за словником словоформ. Джерельною базою для виявлення омоформів
став електронний словник словоформ, сформований на основі створеної в
Інституті автоматичної обробки мови при Штуттгартському університеті в
Німеччині граматичної лексикографічної системи, реєстр якої сягає
близько 50 600 лексем. За допомогою програми синтезу парадигм Morphy її було розгорнуто в список обсягом 431 165
словоформ, який достатньо репрезентативний для вирішення поставленого
завдання. Принципи морфологічного розгортання лексем до словоформ
детально описаний авторами програми Morphy В. Леціусом, Р.Рапом та М. Веттлером у низці публікацій
[12; 13; 14]. Для кожної із словоформ списку проставлено відповідні їй граматичні
коди, тобто позначення словозмінних частиномовних характеристик слів. Прийнята
в системі автоматичного морфологічного аналізу граматична класифікація
частин мови, незважаючи на існування різних думок про їх природу та
кількість [2, с. 169; 4, с. 415-524], збігається з традиційною класифікацією,
прийнятою в граматиці німецької мови [11, с. 85-87], а також у тлумачних
словниках сучасної німецької мови [10]. До списку граматичних класів прийнятої
в роботі класифікації входять: іменник, прикметник, дієслово, прислівник,
числівник, займенник, прийменник, сполучник, частка, вигук, артикль.
У граматичній лексикографічній
системі на інформацію про належність словоформ до певної вихідної форми
вказує символ <form>, а самі словоформи подані між символами <lemma ... /lemma> разом з їх граматичними
показниками, наприклад:
<form>Abfahrt</form>
<lemma wkl=SUB kas=NOM num=SIN gen=FEM>Abfahrt</lemma>
<lemma wkl=SUB kas=GEN num=SIN
gen=FEM>Abfahrt</lemma>
<lemma wkl=SUB kas=DAT num=SIN
gen=FEM>Abfahrt</lemma>
<lemma wkl=SUB kas=AKK num=SIN
gen=FEM>Abfahrt</lemma>
<lemma wkl=VER pers=2 num=PLU modtemp=PRÄ
konj=NON gebrauch = NEB>(ab)fahren</lemma>
Перший
символ граматичного коду вказує на частиномовну приналежність словоформи,
як-от: wkl=SUB; wkl=VER тощо. Другий і подальші
символи передають конкретне
граматичне значення словоформи: kas=AKK num=SIN gen= FEM. У
цій граматичній класифікації для іменників і прикметників наведені відмінок,
рід і число. Іменники Pluralia tantum виділяються як окремий граматичний
підклас за допомогою граматичного коду NOG (ohne Genus
– без роду).
Для дієслів граматичне значення представлене вказівкою на особу, число,
спосіб, час, сильну ча слабку дієвідміну. Якщо у списку наведена початкова
форма дієслова, то диференціюється лише дієвідміна, наприклад:
<lemma wkl=ZUS>stehen</lemma>
<lemma wkl=VER pers=1 num=PLU modtemp=PRÄ
konj=NON>stehen</lemma>
<lemma wkl=VER pers=3 num=PLU modtemp=PRÄ
konj=NON>stehen</lemma>
<lemma wkl=VER pers=1 num=PLU modtemp=KJ1
konj=NON>stehen</lemma>
<lemma wkl=VER pers=3 num=PLU modtemp=KJ1
konj=NON>stehen</lemma>
<lemma wkl=VER form=INF konj=NON>stehen</lemma>
Для займенників ураховується як характер їх значень, так і специфіка
словозміни. Відповідно, розрізняються
особові, присвійні, вказівні, модальні, питальні, відносні, неозначені
займенники та звороний займеник sich. Для особових, вказівних, присвійних, питальних та відносних займенників
наводяться також рід, число, відмінок і особа. Крім того, відбувається
розмежуваня займенників за граматичними функціями на субстантивні, або
займенники-заміщувачі (stellvertretend), й атрибутивні, або супровідні займенники (begleitend).
Незмінні частини мови подаються без підкласів. Проте прийменники диференціюються
за їх властивістю в поєднанні з головним словом керувати різними відмінками,
а сполучники класифікуються відповідно до їх виду як прості (durch, für, mit тощо) або парні (um … willen, von … an, von … wegen та інші).
Процедурне
виокремлення реєстру граматичних омонімів німецької мови та встановлення списку
відповідних їм моделей здійснювалося з опорою на алгоритм, описаний О.О.
Шипнівською та С.В Стариковим для української мови [8; 9, с. 188-194]. При
цьому словник словоформ, одержаний з граматичного лексикографічного
словника, розглядається нами як вихідний текст з морфологічним маркуванням
його одиниць.
На першому етапі ми звели весь список словоформ у таблицю, відштовхуючись від морфологічного маркування <form>...</form>, напр., <form>Abfall</form>. Всі словоформи такого типу зведені в ліву колонку таблиці. На другому етапі ми скоротили морфологічне маркування і отримали список суто граматичних показників. У такий спосіб ми кваліфікували всі одиниці словника словоформ. У результаті словник набуває такого вигляду (див. табл. 1).
Фрагмент словника словоформ німецької мови
|
Словоформа |
Граматичні показники |
|
Abfalle |
SUB DAT SIN MAS>Abfall VER 1 SIN PRÄ NON NEB>(ab)fallen VER 1 SIN KJ1 NON NEB>(ab)fallen VER 3 SIN KJ1 NON NEB>(ab)fallen |
|
Abfallen |
SUB NOM SIN NEU INF>Abfallen SUB DAT SIN NEU INF>Abfallen SUB AKK SIN NEU INF>Abfallen VER 1 PLU PRÄ NON NEB>(ab)fallen VER 3 PLU PRÄ NON NEB>(ab)fallen VER 1 PLU KJ1 NON NEB>(ab)fallen VER 3 PLU KJ1 NON NEB>(ab)fallen VER form=INF NON>(ab)fallen |
У списку з 431165 словоформ 24148 словоформи виявилися
однозначними та 407017 словоформ одержали омонімічні коди. Прикладами
однозначних словоформ є Adjutant (SUB NOM SIN MAS>Adjutant), Adressant (SUB NOM SIN MAS>Adressant) тощо. Серед омонімічних словоформ виділяються групи
словоформ, що є представниками омонімічних форм у межах одного граматичного
класу, як-от: Abfahrten, Abfall, і словоформи –
репрезентанти міжчастиномовних омонімів, як-от: Abfahrt, Abfalle, Abfallen тощо. Шляхом зведення в отриманому списку графічно
тотожних словоформ ми нарахували в сучасній німецькій мові 307480 оморядів
внутрішньочастиномовних омоформів і 99537 оморядів міжчастиномовних
граматичних омонімів. Останні стали основою для
створення словника міжчастиномовних омоформ, який після певної обробки
вказаний словник набув такого вигляду: у першому стовпчику таблиці подано омонімічну форму, в другому – модель
міжчастиномовних омонімів, у третьому – ланцюжок граматичних показників для
омонімічних словоформ. Далі розшифровано словоформу і вказано її
частиномовну приналежність (див. табл. 2).
Таблиця
2
Фрагмент списку міжчастиномовних
граматичних омонімів
|
Омонім |
Модель |
Модель ММО |
Форма |
Частина мови |
|
HOLZEN |
SUB/VER |
SUB NOM SIN NEU INF SUB DAT SIN NEU INF SUB AKK SIN NEU INF VER 1 PLU PRÄ SFT VER 3 PLU PRÄ SFT VER 1 PLU KJ1 SFT VER 3 PLU KJ1 SFT VER INF SFT |
das Holzen dem Holzen das Holzen holzen holzen holzen holzen holzen |
іменник сер. р. іменник сер. р. іменник сер. р. слабке дієсл. слабке дієсл. слабке дієсл. слабке дієсл. слабке дієсл. |
Так, у наведеному
фрагменті форма HOLZEN, яка демонструє як морфологічну омонімію всередині
лексико-граматичного класу, так і міжчастиномовну омонімію, може
виражати вісім граматичних значень: значення називного, давального і
знахідного відмінків однини, 1-ї і 3-ї осіб множини теперішнього часу дійсного
способу, 1-ї і 3-ї осіб множини аналітичних форм кон’юнктива І та початкову
форму дієслова. Як бачимо, ця
словоформа в тексті може реалізувати значення двох граматичних класів
(іменника і дієслова).
Серед усіх
омонімічних рядів на міжчастиномовні граматичні омоніми припадає 24,5 %
(99537 оморядів) від загальної кількості реєстрових одиниць, а решту
75,5 % (307480 оморядів) становлять омоніми всередині парадигми окремих
граматичних класів. Отримані дані суттєво відрізняються від показників,
отриманих на матеріалі української мови О.О. Шипнівською: 2 % (10 203 омонімічних
рядів) міжчастиномовних граматичних омонімів і 98 % (600 409 омонімічних
рядів) внутрішньочастиномовних омоформів [8, с. 5]. Як бачимо, збіги словоформ
різних слів у німецькій мові більш частотні, ніж в українській. Це зумовлено, очевидно, ступенем синтетичності/аналітичності обох мов. Українська мова як мова синтетична
характеризується великою кількістю морфем, які несуть граматичне навантаження.
Відповідно, можливість графічного збігу різночастиномовних слів досить
низька. Німецька мова як більш аналітична порівняно з українською (ступінь синтетизму 2,02) виражає деякі граматичні
категорії, зокрема, рід, відмінок, частково число в іменників, за допомогою
службових слів (пор. [7, с. 120; 3, с. 102]). Це відчутно збільшує можливість
графічного збігу слів у різних граматичних формах.
Дослідження і
детальний опис явища омоформії – це один з можливих шляхів вивчення
концептуальних засад виділення частин мови, а також розмежування їх первинних
і вторинних значень. Детальний семантичний аналіз, з одного боку,
деномінативних і деад’єктивних дієслів, а з іншого – віддєслівних або
відприкметникових імен і віддієслівних або відіменникових прикметників за умови
відсутності в їх морфолого-дериваційній структурі спеціального матеріального
показника акту словотвору дає підстави вбачати в них особливі когнітивні
структури. Ці структури відображають знання про відношення, що існують між
об’єктом і процесом, об’єктом і його ознаками, об’єктом та іншим об’єктом
тощо. Їх дослідженню будуть присвячені наші наступні розвідки.
Література:
1.
Ахманова
О. С. Словарь омонимов русского языка. – М.: Сов. энциклопедия, 1974. – 448 с.
2.
Кацнельсон
С.Д. Типология языка и речевое мышление. – Л.: Наука, 1972. – 216 с.
3.
Кочерган М.П. Вступ до мовознавства. – К.: Академія‚ 2006. – 368с.
4.
Кривоносов А.Т. Система классов слов как
отражение структуры языкового сознания. – М.: ЧеРо, 2001. – 848 с.
5.
Лаптева
О.А. Речевые возможности текстовой омонимии. – 2-е изд. – М.: УРСС, 2003. – 415
с.
6.
Малаховский
Л.В. Теория лексической и грамматической омонимии. – М.: Наука, 1990. – 238 с.
7. Тулдава Ю.А.
Проблемы и методы квантитативно-системного исследования лексики. – Таллинн:
Валгус, 1987. – 205 с.
8.
Шипнівська О.О. Структурно-семантичні та
функціональні характеристики міжчастиномовної морфологічної омонімії сучасної
української мови. – Ав. дис. … канд. філ. наук. – 10.02.01. – Київ, 2007. – 21
с.
9.
Шипнівська О. О., Стариков С. В. Формування лінгвістичної
бази даних граматичних омонімів на матеріалі Українського національного
лінгвістичного корпусу // Лексикографічний бюлетень:
Зб. наук. праць / Відпов. ред. д. філол. н., проф. В. В. Німчук.
– К., 2006. – Вип. 14. – С. 188-194.
10. Duden. Deutsches
Universalwörterbuch / Hrsg. von G. Drosdowski. – 6. völlig neu bearb.
Aufl. – Mannheim / Wien / Zürich: Dudenverlag, 2006. – 1816 S.
11.
Duden. Die Grammatik der deutschen
Gegenwartssprache. – Mannheim / Wien / Zürich: Dudenverlag, 1995. – Bd.
4. – 864 S.
12. Lezius
W. Morphologiesystem Morphy // Linguistische Verifikation. – Hrsg. von R.
Hausser. – Tübingen: Niemeyer, 1996. – S. 25-35.
13. Lezius W., Rapp R., Wettler M. A
Morphology-System and Part-of-Speech Tagger for German // Natural Language
Processing. Results of the 3rd KONVENS Conference. – Hrsg. Von D.
Gibbon. – Mouton: de Gruyter, 1996. – S. 369-378.
14. Rapp
R., Lezius W. Statistische Wortartenanotierung für das Deutsche // Sprache
und Datenverarbeitung. – Nr. 25. – 2001. – S. 5-21.