Самойлова Светлана Петровна
Кандидат филологических наук.
РУДН, г. Москва
Количественный
способ измерения передаваемого сообщения
В настоящей работе представлен анализ
принципов передачи языковой информации и заложенного в ней смысла на основе
количественного измерения этой информации.
Для подтверждения гипотезы об истинности передачи смысла
сообщения, проведенный анализ базировался на основных положениях и понятиях
теории информации, а именно, энтропии текстов тождественных переводов немецкого
и русского языков.
Информация, заложенная в текстах
тождественных переводов, изучалась на глубинном уровне языка путем вычисления
относительных частот повторяемости знаков с последующим определением количества
энтропии.
Соотношение энтропий языков оригинала и
перевода использовалось в качестве поправочного коэффициента при сравнении
текстов в знаковом распределении. В
результате анализа немецко-русских и русско-немецких текстов было установлено,
что некоторые переводы оказались несколько «короче» оригиналов, т.е., в них
присутствовали упрощения в изложении, пропуски и сокращения. Перевод с одного
языка на другой – это процесс замены (перекодирования) текстового материала на
одном языке, эквивалентным текстовым материалам на другом языке.
Согласно Р.О.Якобсону [1],
в процессе межсемиотического перевода используется та же самая или
принципиально другая семиотическая система, в случае межъязыкового перевода
применяется семиотическая система того же типа – другой естественный язык.
Так как языки отличаются друг от друга и
их информационные потери неизбежны, то их необходимо каким-то образом
компенсировать. «Хороший» перевод всегда несколько длиннее исходного
оригинального текста, так как переводчик должен эксплицировать понятия, отсутствующие
в языке перевода [3]. Однако, единого представления о том, что такое «хороший»
перевод не существует, причем требования могут меняться в зависимости от
установленных языковых норм, стилистических правил, а также от типа переводимого
текста [2].
В связи с этим в ходе анализа переводов
оригинальных текстов и их соответствия
и для передачи смысла сообщения была использована теория вероятностей, а именно
измерение длины текстов в знаках.
В разных языках для передачи одинаковых по
смыслу сообщений используются разные слова, длина которых может быть как
близкой, так и различной. Эти слова могут употребляться в различных
грамматических формах, для чего используются морфемы или служебные слова, длины
которых также различны. Кроме того, если в языке имеются артикли, что
характерно для немецкого языка, то количество употребления слов в сообщении на
этом языке будет, как правило, больше, чем в переводе этого же сообщения на
безартикльевый язык. Таким образом, для передачи одной и той же информации в
разных языках могут порождаться сообщения разной длины. Для проведения нашего исследования были
использованы образцы тождественных
переводов немецко-русских и русско-немецких текстов, объём корпуса которых
составил 568471 знаков на каждом из языков. Вероятность встречи знаков
выводилась по формуле:
,
где n – количество каждой буквы, а N – количество всех букв. Сравнение длин исходных
текстов и их переводов в знаках показало, что соотношение длин в значительной
степени определяется парой языков. Полученные статистические данные по параллельным
текстам не подтвердили гипотезу о том, что хороший перевод всегда несколько
длиннее исходного текста [3]. Для решения этого вопроса был применен подход,
базирующийся на теории информации, который отличается от традиционных методов
по количеству альтернатив при выборе очередности элемента сообщения.
В качестве меры количества информации была
использована энтропия, степень свободы выбора на каждом шаге порождения сообщения.
Таким образом, энтропия тесно связана с вероятностью. Для сообщения с алфавитом
из n-букв энтропия (Н) вычисляется по формуле:
Н= -[p1log2(p1) + p1log2(p2) +…+ pnlogn(pn)] ,
где p1,p2…pn –
вероятности появления различных символов в сообщении [4]. Для различных языков
понятие энтропии различается, так как даже, если используется один и тот же
алфавит (хотя полное совпадение алфавитов наблюдается довольно редко, например,
почти во всех языках, использующих латиницу, либо есть дополнительные буквы, либо
отсутствуют какие-либо из стандартных букв), частота букв и иных знаков
(например, знаков препинания), а также их сочетаемость, различается. Энтропия
немецкого оригинального текста составила: −243,64, а его перевод на
русский: −221,85; в коротких
сообщениях: −249,20, русский язык:
−220,84; перевод реакций с
немецкого языка: −249,60; перевод реакций с русского языка: −217,85.
В разных языках отличие по энтропиям составило 1,1раза. Сравнение длин
исходного текста и перевода с учетом энтропии позволяет судить, насколько
перевод соответствует тексту оригинала.
Представленные данные такого
поверхностного сравнения показывают общую тенденцию в сравниваемых переводах,
т.е. разностью между энтропиями множества знаков, представленных на длинных
отрезках текстов и одним знаком можно передать смысл всего предложения. Использованный метод анализа через энтропию с формальной точки
зрения позволил характеризовать информационную нагрузку текста. Анализ энтропии
формально соотнесенных знаков в двух языках выявил изменения в статистике
употребляемых знаков, что имело большое значение для определения категории
текстов. Вопрос об определении количества потерь при передаче смысла и
возможности их минимизации остается открытым.
Литература:
1.
Якобсон Р.О. «О
лингвистических аспектах перевода» В сборнике: Избранные работы. Москва,
Прогресс, 1985, с. 361-368
2. Chesterman A.,
1997: Memes of translation: the spread of ideas in translation theory.
Amsterdam/ Philadelphia: John Benjamins
3. Nida E.A., Taber
C.R., 1974: The Theory and Practice of Translation. Leiden: E.J. Brill
4. Oakes M., 1998:
Statistics for Corpus Linguistics. Edinburgh University Press.