Без выходных

Экзон: структура, функции, альтернативный сплайсинг и клиническое значение

Содержание

1. Введение: определение экзона

Экзон (от англ. exon, сокращение от expressed region - "экспрессируемый участок") - это участок ДНК или соответствующей ему РНК, который сохраняется в зрелой матричной РНК (мРНК) после процесса сплайсинга и в конечном итоге участвует в кодировании белка или функциональной некодирующей РНК. В отличие от интронов (некодирующих вставок), экзоны представляют собой те части гена, которые "выражаются" в конечном продукте гена.

Важное уточнение: термин "экзон" не является синонимом "кодирующей последовательности". Только часть экзонов (кодирующая последовательность, CDS) кодирует аминокислотную последовательность белка. Остальные экзоны включают 5'- и 3'-нетранслируемые области (5'-UTR и 3'-UTR), которые присутствуют в мРНК, но не переводятся в белок, а также экзоны некодирующих РНК (lncRNA, miRNA и другие).

Термин "экзон" был введён Уолтером Гилбертом в 1978 году в контексте открытия "прерывистых" (split) генов у эукариот. В геноме человека только около 1-1.5% ДНК составляют экзоны, а из них менее 30% непосредственно кодируют белки.

2. Исторический контекст: открытие прерывистых генов

До 1977 года в научном сообществе господствовало представление о генах как о непрерывных последовательностях ДНК, которые напрямую соответствуют молекулам мРНК. Однако в 1977 году произошла революция в молекулярной биологии.

Независимо друг от друга Ричард Дж. Робертс (Richard J. Roberts) и Филлип А. Шарп (Phillip A. Sharp) обнаружили, что у эукариот гены состоят из чередующихся кодирующих (экзонов) и некодирующих (интронов) участков. Их исследования проводились на примере аденовируса: было показано, что первичный транскрипт (пре-мРНК) значительно длиннее зрелой мРНК, так как из него удаляются интроны.

Это открытие полностью изменило представление о структуре генов и получило Нобелевскую премию по физиологии и медицине в 1993 году. Термины "экзон" и "интрон" были предложены Уолтером Гилбертом вскоре после этого открытия.

3. Экзон-интронная структура генов

Организация генов существенно различается у прокариот и эукариот:

  • Прокариоты (бактерии и археи): Гены обычно не содержат интронов. Весь ген представляет собой один непрерывный экзон-подобный участок, который непосредственно транслируется в белок.
  • Эукариоты (животные, растения, грибы): Гены имеют прерывистую структуру. Схема экспрессии гена: Ген -> пре-мРНК (содержит экзоны и интроны) -> сплайсинг -> зрелая мРНК (только экзоны, соединённые вместе).

Экзоны нумеруются последовательно (экзон 1, 2, 3...), а границы между экзоном и интроном называются сайтами сплайсинга (5'-сайт донор и 3'-сайт акцептор). Среднее количество экзонов в гене человека составляет около 8-9, а средняя длина экзона - 100-200 нуклеотидов (хотя существуют как очень короткие, так и очень длинные экзоны).

Ключевое различие: не все экзоны кодируют белок. Экзоны подразделяются на:

  • Кодирующие экзоны (CDS): Непосредственно кодируют аминокислотную последовательность белка.
  • Некодирующие экзоны: Включают 5'- и 3'-нетранслируемые области (5'-UTR и 3'-UTR), которые присутствуют в мРНК, но не транслируются, а также экзоны, входящие в состав функциональных некодирующих РНК (lncRNA, miRNA, snoRNA и другие).

4. Процесс сплайсинга

Сплайсинг - это процесс удаления интронов и соединения экзонов в зрелой молекуле мРНК. У эукариот сплайсинг происходит в ядре с помощью сплайсосомы - огромного рибонуклеопротеинового комплекса, состоящего из малых ядерных РНК (snRNA - U1, U2, U4, U5, U6) и многочисленных белков.

Механизм сплайсинга включает два этапа (трансэстерификация):

  1. Атака 2'-OH группы ветвящегося аденина (А) в интроне на 5'-сайт сплайсинга приводит к образованию лариата (петлевидной структуры).
  2. 3'-OH освобождённого 5'-экзона атакует 3'-сайт сплайсинга, что приводит к соединению экзонов и высвобождению интрона в виде лариата (который впоследствии деградируется).

Существуют также самосплайсирующиеся интроны (группы I и II), которые не требуют участия сплайсосомы и способны катализировать собственное удаление. Интроны группы II, как полагают, являются эволюционными предшественниками сплайсосомы и эукариотических интронов.

5. Альтернативный сплайсинг

Один и тот же ген может производить несколько различных изоформ мРНК за счёт альтернативного сплайсинга. Это главный механизм увеличения протеомного разнообразия у человека - один ген может кодировать десятки различных белковых изоформ.

Основные типы событий альтернативного сплайсинга:

Тип сплайсинга Описание Частота у млекопитающих
Пропуск экзона (exon skipping) Экзон исключается из зрелой мРНК Наиболее частый (около 40% событий)
Взаимно исключающие экзоны Из нескольких экзонов включается только один Редкий тип
Альтернативные 5'- или 3'-сайты Использование альтернативных границ экзон-интрон Встречается часто
Ретенция интрона (intron retention) Интрон остаётся в зрелой мРНК Чаще у растений и при патологиях
Альтернативные первые/последние экзоны Использование разных промоторов или сигналов полиаденилирования Тканеспецифичная регуляция

Альтернативный сплайсинг регулируется сплайсинг-факторами (SR-белки, hnRNP и другие), которые связываются с усилителями (ESE - exonic splicing enhancers) или сайленсерами (ESS - exonic splicing silencers) в экзонах и интронах. Нарушение регуляции сплайсинга приводит к развитию различных заболеваний, включая спинальную мышечную атрофию (SMA), миотоническую дистрофию и многие формы рака.

6. Экзом и его практическое значение

Экзом - это совокупность всех экзонов генома. У человека насчитывается примерно 180 000 экзонов, составляющих около 30-60 мегабаз (Мб) геномной ДНК. Секвенирование экзома (whole-exome sequencing, WES) представляет собой мощный клинический диагностический инструмент.

Ключевое преимущество экзомного секвенирования заключается в том, что около 85% всех известных патогенных мутаций человека локализованы именно в экзонах или в сайтах сплайсинга на границах экзон-интрон. WES широко используется для:

  • Диагностики редких наследственных заболеваний: Идентификация мутаций, вызывающих моногенные болезни.
  • Онкологии: Выявление соматических мутаций в опухолях для подбора таргетной терапии.
  • Персонализированной медицины: Прогнозирование ответа на лекарственные препараты.

В России и мире активно применяют клиническое экзомное секвенирование для выявления генетических форм нейродегенеративных, скелетных, метаболических и других наследственных болезней.

7. Клиническое и эволюционное значение

Клиническое значение мутаций в экзонах

  • Мутации в кодирующей части экзонов могут приводить к аминокислотным заменам (миссенс-мутации), преждевременным стоп-кодонам (нонсенс-мутации) или сдвигу рамки считывания (фреймшифт-мутации).
  • Мутации на границах экзон-интрон (сайты сплайсинга) нарушают нормальный процесс сплайсинга, что приводит к включению интронов или пропуску экзонов в зрелой мРНК.
  • Нарушение регуляции альтернативного сплайсинга связано с множеством заболеваний, включая нейродегенеративные, мышечные дистрофии и злокачественные новообразования.

Эволюционное значение

Альтернативный сплайсинг рассматривается как один из ключевых факторов эволюции многоклеточных организмов. Он позволяет одному гену выполнять различные функции в разных тканях или на разных стадиях развития организма, значительно расширяя функциональный репертуар генома без увеличения числа генов.

Эволюция экзон-интронной структуры генов также способствовала возникновению новых генов путём экзонной перетасовки (exon shuffling) - рекомбинации между экзонами разных генов, что приводило к появлению белков с новыми комбинациями функциональных доменов.

8. Часто задаваемые вопросы (FAQ)

Вопрос Ответ
Что такое экзон и чем он отличается от интрона? Экзон - это участок гена, который сохраняется в зрелой мРНК после сплайсинга и участвует в кодировании белка или функциональной РНК. Интрон - некодирующий участок, который удаляется в процессе сплайсинга и не входит в состав зрелой мРНК.
Все ли экзоны кодируют белок? Нет. Только часть экзонов (кодирующая последовательность, CDS) транслируется в белок. Экзоны также включают 5'- и 3'-нетранслируемые области (5'-UTR, 3'-UTR), которые присутствуют в мРНК, но не кодируют белок, а также экзоны некодирующих РНК.
Кто открыл прерывистую структуру генов и когда? В 1977 году Ричард Робертс и Филлип Шарп независимо друг от друга открыли, что гены эукариот состоят из чередующихся экзонов и интронов. В 1993 году они получили Нобелевскую премию за это открытие. Термины "экзон" и "интрон" предложил Уолтер Гилберт.
Что такое альтернативный сплайсинг и зачем он нужен? Альтернативный сплайсинг - это процесс, при котором из одного гена образуется несколько различных изоформ мРНК за счёт комбинирования разных наборов экзонов. Это позволяет одному гену кодировать множество белковых изоформ, значительно увеличивая протеомное разнообразие.
Что такое экзом и для чего используется его секвенирование? Экзом - это совокупность всех экзонов генома (у человека около 180 000 экзонов). Экзомное секвенирование (WES) используется для диагностики редких наследственных заболеваний, поскольку около 85% патогенных мутаций находится именно в экзонах или сайтах сплайсинга.
Сколько экзонов в среднем содержит ген человека? Среднее количество экзонов в гене человека составляет около 8-9. Средняя длина экзона - 100-200 нуклеотидов, хотя существуют как очень короткие (менее 10 нт), так и очень длинные экзоны (более 1000 нт).

9. Заключение

  1. Экзон - это экспрессируемый участок гена, который сохраняется в зрелой РНК после сплайсинга. Термин введён Уолтером Гилбертом в 1978 году.
  2. Открытие прерывистой (экзон-интронной) структуры генов было сделано Робертсом и Шарпом в 1977 году (Нобелевская премия 1993 года).
  3. У прокариот гены не содержат интронов (непрерывные), у эукариот гены имеют прерывистую структуру (экзоны чередуются с интронами).
  4. Не все экзоны кодируют белок: экзоны включают также 5'-UTR, 3'-UTR и экзоны некодирующих РНК.
  5. Альтернативный сплайсинг позволяет одному гену продуцировать множество изоформ мРНК, что является главным механизмом увеличения протеомного разнообразия у эукариот.
  6. Экзом (совокупность всех экзонов) и его секвенирование (WES) являются ключевыми инструментами современной медицинской генетики для диагностики наследственных заболеваний.
  7. Мутации в экзонах и нарушения сплайсинга лежат в основе многих заболеваний, включая нейродегенеративные, мышечные дистрофии и рак.
Ключевой вывод: Экзон - фундаментальная функциональная единица гена, определяющая конечный продукт его экспрессии. Открытие экзон-интронной структуры и механизмов альтернативного сплайсинга произвело революцию в молекулярной биологии и генетике, заложив основы для понимания геномной сложности эукариот.

10. Список литературы

N Источник Что подтверждает
1 NHGRI: Exon definition Официальное определение экзона от National Human Genome Research Institute
2 Nobel Prize 1993: Press release Нобелевская премия за открытие прерывистых генов (split genes)
3 Not all exons are protein coding (2023, PMC) Подчёркивает, что экзоны не равны кодирующим последовательностям
4 Nature Reviews: Intron definition, exon definition and back-splicing (2019) Современный обзор механизмов сплайсинга и определения экзон-интронных границ
5 Berget SM, Moore C, Sharp PA. (1977). Spliced segments at the 5' terminus of adenovirus 2 late mRNA. PNAS. 74(8):3171-3175. Классическая работа Филлипа Шарпа, демонстрирующая сплайсинг
6 Chow LT, Gelinas RE, Broker TR, Roberts RJ. (1977). An amazing sequence arrangement at the 5' ends of adenovirus 2 messenger RNA. Cell. 12(1):1-8. Классическая работа Ричарда Робертса о прерывистой структуре генов
7 Gilbert W. (1978). Why genes in pieces? Nature. 271(5645):501. Введение терминов "экзон" и "интрон" Уолтером Гилбертом
Юридическое предупреждение: Настоящий материал носит информационно-справочный характер и предназначен для научно-образовательных целей. Информация не является медицинской консультацией, публичной офертой или руководством к самодиагностике. Результаты генетических тестов не являются медицинским диагнозом. Имеются противопоказания. Необходима консультация специалиста (врача-генетика, молекулярного биолога).