Самойлова Светлана Петровна

Кандидат филологических наук.

РУДН, г. Москва

 

swyti@mail.ru

 

Количественный способ измерения передаваемого сообщения

 

В настоящей работе представлен анализ принципов передачи языковой информации и заложенного в ней смысла на основе количественного измерения этой информации.

 Для подтверждения гипотезы об истинности передачи смысла сообщения, проведенный анализ базировался на основных положениях и понятиях теории информации, а именно, энтропии текстов тождественных переводов немецкого и русского языков.

Информация, заложенная в текстах тождественных переводов, изучалась на глубинном уровне языка путем вычисления относительных частот повторяемости знаков с последующим определением количества энтропии.

Соотношение энтропий языков оригинала и перевода использовалось в качестве поправочного коэффициента при сравнении текстов в знаковом распределении.  В результате анализа немецко-русских и русско-немецких текстов было установлено, что некоторые переводы оказались несколько «короче» оригиналов, т.е., в них присутствовали упрощения в изложении, пропуски и сокращения. Перевод с одного языка на другой – это процесс замены (перекодирования) текстового материала на одном языке, эквивалентным текстовым материалам на другом языке.

    Согласно Р.О.Якобсону  [1], в процессе межсемиотического перевода используется та же самая или принципиально другая семиотическая система, в случае межъязыкового перевода применяется семиотическая система того же типа – другой естественный язык.

Так как языки отличаются друг от друга и их информационные потери неизбежны, то их необходимо каким-то образом компенсировать. «Хороший» перевод всегда несколько длиннее исходного оригинального текста, так как переводчик должен эксплицировать понятия, отсутствующие в языке перевода [3]. Однако, единого представления о том, что такое «хороший» перевод не существует, причем требования могут меняться в зависимости от установленных языковых норм, стилистических правил, а также от типа переводимого текста [2].

В связи с этим в ходе анализа переводов оригинальных  текстов и их соответствия и для передачи смысла сообщения была использована теория вероятностей, а именно измерение длины текстов в знаках.

В разных языках для передачи одинаковых по смыслу сообщений используются разные слова, длина которых может быть как близкой, так и различной. Эти слова могут употребляться в различных грамматических формах, для чего используются морфемы или служебные слова, длины которых также различны. Кроме того, если в языке имеются артикли, что характерно для немецкого языка, то количество употребления слов в сообщении на этом языке будет, как правило, больше, чем в переводе этого же сообщения на безартикльевый язык. Таким образом, для передачи одной и той же информации в разных языках могут порождаться сообщения разной длины.  Для проведения нашего исследования были использованы образцы  тождественных переводов немецко-русских и русско-немецких текстов, объём корпуса которых составил 568471 знаков на каждом из языков. Вероятность встречи знаков выводилась по формуле:

,

где n – количество каждой буквы, а N – количество всех букв. Сравнение длин исходных текстов и их переводов в знаках показало, что соотношение длин в значительной степени определяется парой языков. Полученные статистические данные по параллельным текстам не подтвердили гипотезу о том, что хороший перевод всегда несколько длиннее исходного текста [3]. Для решения этого вопроса был применен подход, базирующийся на теории информации, который отличается от традиционных методов по количеству альтернатив при выборе очередности элемента сообщения.

В качестве меры количества информации была использована энтропия, степень свободы выбора на каждом шаге порождения сообщения. Таким образом, энтропия тесно связана с вероятностью. Для сообщения с алфавитом из n-букв энтропия (Н) вычисляется по формуле:

Н= -[p1log2(p1) + p1log2(p2) +…+ pnlogn(pn)] ,

 

где p1,p2pn – вероятности появления различных символов в сообщении [4]. Для различных языков понятие энтропии различается, так как даже, если используется один и тот же алфавит (хотя полное совпадение алфавитов наблюдается довольно редко, например, почти во всех языках, использующих латиницу, либо есть дополнительные буквы, либо отсутствуют какие-либо из стандартных букв), частота букв и иных знаков (например, знаков препинания), а также их сочетаемость, различается. Энтропия немецкого оригинального текста составила: −243,64, а его перевод на русский: −221,85;  в коротких сообщениях: −249,20,  русский язык: −220,84;  перевод реакций с немецкого языка: −249,60; перевод реакций с русского языка: −217,85. В разных языках отличие по энтропиям составило 1,1раза. Сравнение длин исходного текста и перевода с учетом энтропии позволяет судить, насколько перевод соответствует тексту оригинала.

Представленные данные такого поверхностного сравнения показывают общую тенденцию в сравниваемых переводах, т.е. разностью между энтропиями множества знаков, представленных на длинных отрезках текстов и одним знаком можно передать смысл всего предложения.   Использованный метод анализа через энтропию с формальной точки зрения позволил характеризовать информационную нагрузку текста. Анализ энтропии формально соотнесенных знаков в двух языках выявил изменения в статистике употребляемых знаков, что имело большое значение для определения категории текстов. Вопрос об определении количества потерь при передаче смысла и возможности их минимизации остается открытым.

 

Литература:

1.     Якобсон Р.О. «О лингвистических аспектах перевода» В сборнике: Избранные работы. Москва, Прогресс, 1985, с. 361-368

2.     Chesterman A., 1997: Memes of translation: the spread of ideas in translation theory. Amsterdam/ Philadelphia: John Benjamins

3.     Nida E.A., Taber C.R., 1974: The Theory and Practice of Translation. Leiden: E.J. Brill

4.     Oakes M., 1998: Statistics for Corpus Linguistics. Edinburgh University Press.