К.б.н. Атамбаева Ш.А., д.б.н. Иващенко А.Т., д.б.н. Карпенюк Т.А.

к.б.н. Гончарова А.В., Хайленко В.А.

 НИИ проблем биологии и биотехнологии Казахского национального университета имени аль-Фараби, Казахстан

Свойства интронов и экзонов в генах из различных участков хромосом Сaenorhabditis elegans

 

В настоящее время проблема выяснения функциональной роли интронов и их свойств в различных генах и геномах активно разрабатывается. В генах эукариотических клеток экзоны и интроны имеют много особенностей, которые способствуют выяснению биологической функции интронов [1-3]. Соотношение длин интронов и экзонов, а также число интронов в гене могут существенно влиять на время сплайсинга пре-мРНК и, соответственно, на экспрессию генов [4]. Представляется важным выяснить, наблюдается ли изменение свойств экзонов и интронов в зависимости от хромосомной локализации и числа интронов в генах ядерного генома C. elegans.

Нуклеотидные последовательности хромосом I-V и Х хромосом ядерного генома C. elegans были получены из базы данных (http://www.wormbase.org). Из каждой хромосомы формировали группы генов содержащих 1-5 интронов, а также группы генов с 6-9 и с 15 и более интронами. Анализ частоты встречаемости длины интронов и экзонов проводили в интервалах 1 – 20 н., 21 – 40 н., 41 - 60 н. и так далее до 400 н., а также более 400 н. Для анализа свойств генов в зависимости от плотности генов были выбраны четыре участка с низкой плотностью генов (УНПГ). Наиболее высокой средней плотностью генов на участок обладает хромосома II – 75 генов, а наиболее низкой плотностью хромосома Х – 49 генов.

В генах C. elegans, содержащих различное число интронов, средняя длина экзонов в генах I-V хромосом независимо от числа интронов в генах была близкой: для хромосом I и II - 241±21 н., III - 227±26 н., IV - 228±33 н. и V - 237±33 н. В генах хромосомы Х средняя длина экзонов была меньше, чем в остальных хромосомах - 194±21 н. Средняя длина интронов в генах не зависела от числа интронов в гене. Так, в хромосомах I и II она равнялась 386±60 н., в III, IV и Х хромосомах она составляла соответственно 338±38 н., 336±53 н. и 251±49 н. В хромосоме V средняя длина интронов в генах была ниже, чем в других хромосомах - 201±13 н. Таким образом, средние длины интронов и экзонов в генах C. elegans не зависели от числа интронов в генах каждой хромосомы, но отличались для генов из некоторых хромосом. Сумма экзонов в генах с одним интроном варьировала от 469 н. (хромосома Х) до 579 н. (хромосома V). По мере увеличения числа интронов в генах сумма длин экзонов в них возрастала в несколько раз и равнялась для генов указанных выше хромосом соответственно 3908 и 5693 н. Общая длина гена в каждой из хромосом генома C. elegans увеличивалась в 12,1-15,8 раз с увеличением количества интронов в гене. Доля экзонов и интронов, различающихся по длине в интервалах 1 - 400 н. и более 400 н., во всех группах генов изменялась специфично. В генах всех хромосом C. elegans доля экзонов с длиной более 400 н. уменьшалась с увеличением числа интронов в гене до 5. При этом доля экзонов с длиной в интервале 60-180 н. одновременно увеличивалась (рис.1).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


Рисунок 1. Изменения длин экзонов (1, 2) в генах ядерного генома C. elegans. Экзоны в генах с одним (1) и пятью интронами (2). Ось абсцисс – номер интервала длиной 20 н.; ось ординат – доля экзонов соответствующей длины в каждом из интервалов в процентах. Обозначения: гены из хромосом: I и II (–); III (–); IV (–ж–) ; V (–○–); Х (–∆–).

 

Отметим, что гены с одинаковым числом интронов, но из разных хромосом, отличались по количеству интронов с длиной более 400 н. В разных группах генов хромосомы V доля таких интронов варьировала от 9,6 до 14,4%, тогда как в хромосомах I и II от 25,6 до 38,8%. В генах с разным количеством интронов, независимо от хромосомной локализации генов, наблюдалось больше всего интронов с длиной в интервале 40-60 н., с максимумом их числа при длине 47-48 н. В интервале длин 40-60 н. доля интронов в генах хромосом I и II в среднем составляла 38%, в III - 41%, в IV - 38%, в V - 53% и в Х - 44%. То есть, значительная доля интронов имела длину в этом интервале. Доля интронов с длиной в интервале 140-400 н. в генах всех хромосом была близкой: 19,7±2,8 % - 26,9±2,3 %. Таким образом, перераспределение длин интронов при увеличении числа экзонов в генах происходит путем уменьшения доли интронов с длиной более 400 н. и увеличения их числа в интервале 40-60 н., без изменения доли интронов в промежуточных интервалах длин. Полученные данные свидетельствуют, что гены с различным количеством интронов и локализованные в разных хромосомах, отличаются друг от друга по своей экзон-интронной организации. Тенденция увеличения числа интронов в гене, при увеличении суммы длины экзонов, свидетельствует о корректирующей роли интронов на пока неизвестные характеристики генов.

Длина экзонов и интронов в генах не зависела от GC-содержания участка. Так, в участках 300 т.п.н. хромосом I и V, содержащих близкое число генов (63÷65), но имеющих разное GC-содержание (39% и 34%), средняя длина генов и соотношения длин экзонов и интронов в них не отличались. В генах, локализованных в участках хромосом I и V с равным GC-содержанием (35%), но с различной их плотностью, выявлено отличие по свойствам экзонов и интронов. Четыре участка с высокой плотностью генов (УВПГ) содержали в среднем по 99 генов, а 4 УНПГ по 38. В хромосомах I и V средняя плотность генов составляла соответственно 61 и 73 гена на участок длиной 300 т.п.н.

Средняя длина генов с одним интроном равнялась в УВПГ и УНПГ 746 и 1106 н. при доле экзонов равной соответственно 81 и 35%. В генах с двумя интронами средняя длина генов составляла соответственно 1157 и 1896 н., а доли экзонов были 71 и 35%. В генах с 6÷9 интронами длина генов равнялась 2855 и 7696 н., а экзоны составляли 53 и 23% от длины генов. Для генов с 10 и более интронами отмеченная тенденция сохранялась. Несмотря на значительное отличие в плотности генов в участках, доля ДНК занимаемой белок-кодирующими генами в УВПГ и УНПГ была близкой и составляла в среднем соответственно 47 и 49%. Средняя длина интронов в генах УВПГ была меньше таковой в генах УНПГ в 4,3 раза. Несмотря на значительные отличия длины интронов в генах C. еlegans, локализованных в участках ДНК с различной плотностью генов, длина суммы экзонов была близкой в группах генов с одинаковым числом интронов. Таким образом, экзон-интронная организация генов C. еlegans зависит от плотности генов в участках ДНК ядерного генома.

Одно из свойств интронов заключается в более низком GC-содержании по сравнению с GC-содержанием в экзонах, что приводит к уменьшению его в генах (таблица 1). Другой характеристикой генов является разность отношений частот использования нуклеотидов: fA/fT–fC/fG. Этот показатель отражает отклонение fA, fT, fC, fG от отношений fA=fT и fC=fG, характерных согласно второму правилу Чаргаффа для протяженной однонитевой ДНК. В экзонах величина fA/fT–fC/fG является положительной для генов, кодирующих гидрофильные белки (fR-0,5>0), и отрицательной для генов, кодирующих гидрофобные белки (fR-0,5<0), причем она существенно отличается от нуля. На наш взгляд интроны, приближая величину fA/fT–fC/fG к нулю, оптимизируют нуклеотидный состав гена. В генах без интронов величина fA/fT–fC/fG для генов гидрофильных и гидрофобных белков равнялась соответственно 0,342 и -0,357. В генах с разным числом интронов происходило снижение абсолютной величины fA/fT–fC/fG под влиянием интронов. Наиболее ярко это видно для генов кодирующих гидрофильные белки, у которых величина fA/fT–fC/fG положительна. Для генов гидрофобных белков заметное уменьшение величины fA/fT–fC/fG проявлялось в УВПГ.

Таблица 1. Изменения GC-содержания и величины fA/fTfC/fG в экзонах и генах в УВПГ и УНПГ из хромосом I и V C. еlegans

Число интронов

 

fR

Длина

экзоновн.

 

fS

 

fR-0,5

fA/fT–fC/fG

Длина

гена, н.

 

fS

 

fR-0,5

fA/fT–fC/fG

Гены без интронов

>0,5

<0,5

780

652

0,437

0,470

0,041

-0,037

0,342

-0,357

 

 

 

 

Гены из УНПГ

1-2

>0,5

<0,5

608

469

0,456

0,443

0,040

-0,038

0,322

-0,312

1911

1159

0,396

0,387

0,015

-0,019

0,110

-0,130

3-5

>0,5

<0,5

1015

903

0,451

0,420

0,036

-0,025

0,302

-0,192

3352

2171

0,377

0,389

0,014

-0,020

0,110

-0,191

6-9

>0,5

<0,5

1750

2148

0,451

0,478

0,031

-0,006

0,296

-0,054

6953

11162

0,368

0,342

0,007

-0,004

0,046

-0,069

≥10

>0,5

<0,5

4835

2535

0,454

0,470

0,030

-0,008

0,248

-0,047

19948

24121

0,355

0,359

0,010

-0,012

0,083

-0,082

 

Интроны уменьшали и относительное содержание пуриновых нуклеотидов (fR-0,5) в генах. В УНПГ интроны значительно уменьшали величину fA/fT–fC/fG (таблица 1). В генах гидрофильных белков из УВПГ интроны тоже существенно снижали величину fA/fT–fC/fG: с 0,398 до 0,205. Для всех генов гидрофобных белков из УНПГ средняя длина равнялась 4532 н. и величина fA/fT–fC/fG была равна -0,146. Соответствующие длины и величины fA/fT–fC/fG для экзонов этих генов равнялись 1100 н. и –0,212. Интроны в генах гидрофобных белков из УВПГ изменяли величину fA/fT–fC/fG с –0,305 до –0,224. Средняя длина генов и суммы экзонов составляла соответственно 1670 и 1043 н.

В протяженных участках однонитевой ДНК (более 100 т.н.) различных эукариот величина fA/fT–fC/fG близка нулю. Такой баланс соотношения частот встречаемости нуклеотидов (fA ≈ fT и fC ≈ fG) в протяженных участках достигается за счет определенного сочетания частот встречаемости нуклеотидов в экзонах, интронах и межгенных участках. Так, для хромосом I и V C. elegans, нами были проанализированы частоты встречаемости нуклеотидов однонитевой ДНК разделенной последовательно на участки по 3, 30 или 300 т.н. Показано, что средняя величина fA/fT–fC/fG для этих участков ДНК хромосомы I равна соответственно 0,0002, 0,003 и 0,004, а хромосомы V равна 0,0002, 0,004 и 0,004. Таким образом, интроны, составляя существенную долю генов уменьшают величину fA/fT–fC/fG и тем самым оптимизируют нуклеотидный состав ДНК.

 

Литература:

1. Bultrini E., Pizzi E., Giudice P., Frontani C. Pentamer vocabularies characterizing introns and intro-like intergenic tracts from Caenorhabditis elegans and Drosophila melanogaster // Gene. 2003. V. 304. P. 183-192.

2. Castillo-Davis C.I., Mekhedov S.L., Hart D.L., Koonin E.V., Kondrashov F.A. Selection for short introns in highly expressed genes // Nature genetics. 2002. V.31. №4. P. 415-418.

3. Deutsch M., Long M. Intron-exon structures of eukaryotic model organisms // Nucleic Acids Research. 1999. V. 27. №15. P. 3219-3228.

4. Castillo-Davis C.I., Mekhedov S.L., Hart D.L., Koonin E.V., Kondrashov F.A. Selection for short introns in highly expressed genes // Nature genetics. 2002. V.31. №4. P. 415-418.