Молекулярная биология - MIPT. DNA.pdf · Бактериофаг λ 26 23,8 24,3...

Post on 10-Aug-2020

15 views 0 download

Transcript of Молекулярная биология - MIPT. DNA.pdf · Бактериофаг λ 26 23,8 24,3...

Скоблов Михаил Юрьевич

Молекулярная биология

Лекция 2. Структура, свойства и функции нуклеиновых кислот.

Часть 1. Структура нуклеиновых кислот

Состав клетки Вещества в клетке

Неорганические • Вода – 75-85% • Неорганические соли,

кислоты – 1-1,5%

Органические

Малые молекулы • Моносахариды • Аминокислоты • Нуклеотиды • Другие • Липиды (жиры) – 1-5%

Биополимеры (макромолекулы)

• Полисахариды (углеводы) - 0,2-2% • Белки - 10-20% • Нуклеиновые кислоты (ДНК, РНК) - 1-2%

0,5%

История открытия:

Фридрих Мишер

• В 1869 году молодой швейцарский врач Фридрих Мишер в Германии решил изучить химический состав клеток животных, а в качестве материала выбрал лейкоциты, которых было много в гное. Из местной хирургической больницы ему стали привозить корзины с гнойными повязками, снятыми с ран.

• В процессе работы он понял, что кроме белков в лейкоцитах присутствует неизвестное соединение, содержащееся в ядрах клеток.

• Фридрих Мишер назвал его нуклеином, от латинского nucleus — ядро.

• Позже было обнаружено, что бактериальные клетки, в которых нет ядра, тоже содержат нуклеиновые кислоты.

• Джерард Маирбакс изолировал первую матричную РНК, кодирующую гемоглобин кролика и показал, что при её введении в ооциты образуется гемоглобин.

• Северо Очоа получил Нобелевскую премию по медицине в 1959 году за открытие механизма синтеза РНК

ДНК

РНК

Строение нуклеозида и нуклеотидов

Строение нуклеозида и нуклеотидов

Строение нуклеозида и нуклеотидов

Строение рибонуклеотидов

U

• Рибоза • Урацил

Почему в ДНК тимин, а в РНК урацил?

• Синтез урацила, энергетически выгоднее, чем тимина, так как не нужно делать лишнее метилирование.

• Это косвенно подтверждает гипотезу мира РНК, о том что первичными нуклеиновыми кислотами были РНК

• При частом спонтанном дезаминировании цитозина в клетке, цитозин превращается в урацил.

• Если в составе ДНК был бы урацил, то отличить его от возникшего из цитозина было бы невозможно.

• Это бы привело к невозможности репарации, и как следствию к интенсивному накоплению мутаций.

Названия оснований и нуклеозидов

Сокращение Основание Нуклеозид

A Аденин Аденозин

G Гуанин Гуанозин

T Тимин Тимидин

C Цитозин Цитидин

U Урацил Уридин

Минорные основания нуклеозидов

Искусственные нуклеотиды

Искусственная пара реплицируется бактериальной ДНК полимеразой и не удаляется механизмами репарации.

KlenTaq polymerase replicates unnatural base pairs by inducing a Watson-Crick geometry. Betz K1, Malyshev DA, Lavergne T, Welte W, Diederichs K, Dwyer TJ, Ordoukhanian P, Romesberg FE, Marx A. Nat Chem Biol. 2012 Jul;8(7):612-4.

Ацикловир

ТК вируса

герпеса ? ?

Монофосфат

ацикловира

Дифосфат

ацикловира

Трифосфат

ацикловира

Вирусная ДНК-

полимераза

Ацикловир – самое распространенное противогерпетическое лекарственное

средство. Убирает симптомы заболевания, но не излечивает!

Вирус погибает

Модифицированные нуклеозиды

Модифицированные нуклеозиды

5-фторурацил

Тимидилатсинтетаза катализирует превращение дезоксиуридина монофосфата в дезокситимидин монофосфат, который является единственным источником синтеза тимидина, начальным предшественником для репликации ДНК.

Активные метаболиты 5-ФУ FdUMP, FUTP и FdUTP ответственны за противоопухолевый эффект препарата: • FdUMP связывается с ТС,

препятствуя синтезу тимидина трифосфата

• FdUTP инкорпорируется в ДНК, приводя к ее разрывам

• FUTP инкорпорируется в РНК, вызывая нарушения ее стабильности и функции

Правила Чаргаффа

Содержание нуклеотидов в ДНК

Эрвин Чаргафф

Соотношения, выявленные Чаргаффом для аденина (А), тимина (Т), гуанина (Г) и цитозина (Ц), оказались следующими:

• Количество аденина равно количеству тимина, а гуанина — цитозину: А=Т, Г=Ц.

• Количество пуринов равно количеству пиримидинов: А+Г=Т+Ц. • Количество оснований с аминогруппами в положении 6 равно

количеству оснований с кетогруппами в положении 6: А+Ц=Г+Т.

Принцип комплементарности

Джеймс Уотсон и Френсис Крик. 1953 год.

Вторичная структура ДНК

Содержание нуклеотидов

Организм A G C T G+C, мол. %

Бактериофаг λ 26 23,8 24,3 25,8 48

Бактериофаг Т2 32,5 18,2 16,72 32,6 35

Escherichia coli 23,8 26 26,4 23,8 52

Bacillus subtilis 29 20,7 21,3 29 42

Вирус папилломы Шоупа

26,6 24,5 24,2 24,7 49

Saccharomyces cerevisiae

31,3 18,7 17,1 32,9 36

Chlamydomonas 19,6 30,2 30 19,7 60

Мышь 28,9 21,1 20,3 30 41

Пшеница 27,2 22,6 22,8 27,4 45

Соотношение (A+Т):(Г+Ц) может быть различным у ДНК разных видов. У одних преобладают пары АТ, в других — ГЦ.

Содержание динуклеотидов

Gentles AJ, Karlin S. Genome-scale compositional comparisons in eukaryotes. Genome Res. 2001 Apr;11(4):540-6.

За 400 млн лет позвоночными утрачено 75% CpG динуклеотидов

Вторичная структура ДНК

Формирование вторичной структуры ДНК определяется следующими типами взаимодействий:

• водородные связи между комплементарными основаниями (две

между аденином и тимином, три — между гуанином и цитозином);

• стэкинг-взаимодействия

• нековалентное взаимодействие между органическими соединениями, содержащими ароматические компоненты.

• В ДНК параллельный стэкинг имеет место между соседними парами нуклеотидов и повышает стабильность молекулярной структуры.

Сила комплементарных взаимодействий оснований в ДНК: пурин-пурин>пиримидин-пурин>пиримидин-пиримидин

Неканонические формы ДНК

В-ДНК - основное состояние ДНК показанное на кристаллах и в водных растворах. С-ДНК - форма существующая при пониженной концентрации Na и влажности 44-66%, если GC=31-72%. А-ДНК - форма ДНК-РНК гибридов. Z-ДНК - левозакрученная форма. Переходу B-->Z способствует наличие GC-5' последовательности являющейся местом метилирования у организмов. Z-ДНК обнаружена в междисках политенных хромосом D. melanogaster.

G-квадруплексы последовательности нуклеиновых кислот, обогащенные гуанином и способные образовывать структуры из двух, трёх или четырех цепей.

Часть 2. Свойства нуклеиновых кислот

Химические свойства

• ДНК и РНК - нуклеиновые кислоты, кислоты, слабые, но кислоты • Молекулы нуклеиновых кислот содержат множество

отрицательно заряженных фосфатных групп и образуют комплексы с ионами металлов; их калиевая и натриевая соли хорошо растворимы в воде.

• 2’ гидроксил делает РНК уязвимой к щелочному и кислотному гидролизу

• Концентрированные растворы нуклеиновых кислот очень вязкие и слегка опалесцируют, а в твердом виде эти вещества белые.

• Нуклеиновые кислоты сильно поглощают ультрафиолетовый свет, и это свойство лежит в основе определения их концентрации. С этим же свойством связан и мутагенный эффект ультрафиолетового света.

Оптические свойства ДНК • Поглощение нуклеиновых кислот в ближней УФ-области почти целиком обязано

пуриновым и пиримидиновым основаниям. • Сахарофосфатный остов РНК и ДНК дает незначительный вклад в спектр

поглощения при длинах волн, превышающих 200 нм.

• Спектры всех четырех нуклеозидов чувствительны к рН. Протонирование С и G приводит к значительному сдвигу поглощения в сторону больших длин волн (красное смещение). Депротонирование U или Т при щелочных рН также приводит к существенному красному смещению максимума поглощения. Протонирование А сопровождается гораздо меньшими спектральными изменениями.

Оптические свойства ДНК • Наиболее часто измерения поглощения проводят для определения

концентрации. • Это можно делать, если известен коэффициент молярной экстинкции и

соблюдается закон Ламберта-Бера. Например, для двухцепочечной ДНК D260=1 соответствует 50 мкг/мл, для РНК – 40.

Молекулярный коэффициент экстинкции.

OD - единица измерения количества олигонуклеотидов, соответствует количеству, которое в 1ml на пути 1см дает А260=1 C [µmol/ml] = OD/E олигонуклеотида E олигонуклеотида = сумма всех (Eнуклеотидов)

E [ml/µmol] dG 7 dC 12 dA 16 dT 9,6 dN 10,8

• Расхождение цепей происходит из-за разрушения слабых водородных связей и плоскостных взаимодействий между основаниями.

• На денатурацию также влияют: ионы одно- и двухвалентных металлов, белки, нейтрализующие отрицательные заряды фосфатных групп.

• Температура плавления GC выше чем АТ.

• Денатурация – процесс обратимый, последующее восстановление двухцепочечной структуры ДНК может происходить даже при полном расхождении цепей. Процесс воссоединения, называемый ренатурацией, реассоциацией или отжигом, происходит при

• понижении температуры или рН • При резком понижении температуры или рН правильное воссоединение комплементарных

цепей затрудняется из-за спаривания оснований локально комплементарных участков в пределах одной или разных цепей.

• При ренатурации сначала соединяются участки цепей с повторенной ДНК и затем с уникальными участками

• Если совместно. отжигают одноцепочечные ДНК, происходящие из различных источников, то формирование двухцепочечной структуры ДНК называют гибридизацией.

Плавление ДНК

Денатурация или плавление - расхождение цепей ДНК при нагревании ДНК или при повышении pH.

40%

60%

Плавление ДНК

Tm — температура, при которой половина ДНК-матриц имеет двухцепочечную структуру

Плавление ДНК

• Плавление ДНК - процесс перехода регулярной двойной спирали линейной молекулы ДНК в клубкообразное состояние.

• При переходе ДНК из спирального состояния в клубкообразное поглощение раствора A в области 250-270 нм увеличивается на 30-40%

• Суммарная длина различных присутствующих в геноме последовательностей, оценивается по их реассоциации в процессе ренатурации ДНК

• Метод реассоциации ДНК позволяет судить о близком родстве по способности денатурированных отдельных нитей ДНК одних бактерий реассоциировать перекрестно при инкубации в определенных условиях с нитями ДНК других, образовывая спиральную гибридную молекулу.

Вторичная структура – распределение вторичных структур рибозофосфатного скелета вдоль цепи

Вторичная и третичная структуры тРНК кодированы одним цветом

Вторичная и третичная структуры РНК

Третичная структура – 3D структура молекулы РНК

C A G A G A C G | | C G | G C G | | A U / \ G | A A \ / G C | | C G | | A U / \ / C C G C-A / | | A G-C-A-A-G G C A G-G-U-U-C | | U-G \ C G U | \ \ / A G C | | | U A U | | | C G U | | | A C G / A G A

Элементы вторичной структуры

Петля-шпилька

Внутреняя петля

Выпячивание

Множественная петля Спирали

Псевдоузел

Вторичная структура HIV-1

Часть 3. Методы исследования первичной и вторичной

структуры нуклеиновых кислот.

Фредерик Сенгер

Секвенирование ДНК

Терминаторы элонгации цепи

Дидезоксинуклеотиды

1980г Вторая Нобелевская премия по химии: «for their contributions concerning the determination of base sequences in nucleic acids»

Секвенирование ДНК по Сенгеру

Капилярное секвенирование с флуоресцентными терминаторами

Обратная транскрипция

Обратная транскрипция

Обратная транскриптаза (также известная как ревертаза или РНК-зависимая ДНК-полимераза)

• Фермент класса трансфераз, осуществляющий ДНК-зависимый синтез ДНК на матрице РНК (обратная транскрипция).

• Обладает активностью РНКазы Н (т.е. разрушает цепь РНК, входящую в состав ДНК/РНК-дуплекса).

• Подобно всем ДНК-полимеразам функционирует только при наличии затравки.

Потенциал вторичной структуры РНК

Более чем для 3000 транскриптов определены элементы вторичной структуры, что составляет около 50% всех генов Saccharomyces cerevisiae.

Предсказание вторичной структуры

• Перебор вариантов (жадные алгоримы)

• Минимизация свободной энергии/ Максимизация числа пар (Динамическое программирование)

• Стохастические алгоритмы (Монте-Карло, генетические алгоритмы)

• Поиск консервативных структур

• Проблема формирования вторичной структуры РНК – сложная комбинаторная и физическая задача

• Результаты минимизации энергии не всегда дают биологически осмысленную структуру

• Наилучшие результаты дает поиск консервативных структур

Реальность:

Часть 4. Функции нуклеиновых кислот

Происхождение ДНК

Земное!

Ученые из NASA проанализировали состав 12 богатых углеродом метеоритов, 9 из которых найдены в Антарктике. В них были обнаружены компоненты ДНК такие как аденин, гуанин, а также и другие клеточные компоненты - гипоксантин и ксантин.

Внеземное?

Теория химической эволюции

Эксперимент Миллера — Юри

Происхождение ДНК

Земное!

• Возраст Земли составляет 4.5 миллиарда лет

• Самые древние следы жизни на ней имеют возраст около 3.5

миллиардов лет.

• Все виды современных организмов являются потомками древних форм

жизни и используют одинаковый материал для хранения и передачи

наследственной информации - ДНК.

• В 1869 году Фридрих Мишер обнаружил неизвестное соединение, содержащееся в ядрах клеток, и назвал его нуклеином, от латинского nucleus — ядро.

Эксперимент Фредерика Гриффита по трансформации бактерий. 1944 г.

История изучения ДНК

Эксперимент Эвери, Маклеода и Маккарти по трансформации бактерий. 1944 г.

История изучения ДНК

Вывод: Только ДНК определяет наследственные свойства организма.

Реализация ДНК как генетического материала

У каждого живого организма есть наследственный материал

Размер генома человека 3,2x109 нуклеотидных пар, из него около 1.5% генома кодирует белки

А остальное?

“junk DNA”?

Реализация ДНК как генетического материала

Размер генома, тыс. нукл.

Пл

отн

ост

ь ге

но

в,ге

н/т

ыс.

нук

л.

Прокариоты и вирусы

Эукариоты

Реализация ДНК как генетического материала

Структура генома человека

Реализация ДНК как генетического материала

Информационная емкость ДНК

Демонстрация записи текста целой книги Чёрча в 1 пикограмм молекул.

Авторы кодировали не текст ASCII, а бинарный код —книгу Чёрча, с сохранением форматирования HTML и иллюстраций JPEG. Перед записью код разбили на 96-битные блоки. Общий объём записанной информации составил 54898 таких блоков, то есть примерно 643 килобайта, включая служебную информацию — 19-битный уникальный адрес каждого блока (на диаграмме внизу он изображён красным цветом). В данном эксперименте достигнута информационная плотность записи 5,5 петабит на кубический миллиметр.

Информационная емкость ДНК

Исследователи из Европейского института биоинформатики опубликовали работу с описанием способа, как можно существенно повысить информативность ДНК, предложив отказаться от четверичной системы (Base-4) в пользу троичной (Base-3), а четвёртый нуклеотид использовать в служебных целях для разбиения длинных цепочек

Информационная плотность записи 2,2 петабайта на 1 грамм биологического материала.

На сегодняшний день стоимость кодирования информации в ДНК оценивается примерно в $12400 за мегабайт, стоимость считывания — $220 за 1 МБ.

Часть 5. Функциональные элементы генома

Анализ первичной структуры ДНК и её функции

Что? Где? Когда?

Проект ENCODE

Полученные данные позволяют провести фактически полноценный анализ по исследованию регуляции изучаемого локуса.

The Encyclopedia of DNA Elements

Гены Найти ген – значит картировать РНК на ДНК, проаннотировать эту последовательность.

«Ген – это совокупность геномных последовательностей, кодирующих сцепленный набор потенциально перекрывающихся функциональных продуктов».

Гены

Гены

• К 2007 году из 7000 генов у дрожжей была известна функция только для 1000 генов.

• У человека известна функция примерно для половины генов

• Каждый год примерно для 100 генов открывают функцию

(единичный)

(дуплицированный)

(процессированый)

Псевдогены. Классификация.

Обратная транскрипция

Виды Количество

генов

Количество

процессированных

псевдогенов

%

Arabidopsis 33583 4260 13

Caenorhabditis elegans 21187 2445 12

Drosophila melanogaster 22372 2208 10

Danio rerio 34291 16357 48

Gallus gallus 22720 5539 24

Canis lupus familiaris 24953 12852 52

Rattus norvegicus 42743 13962 33

Mus musculus 58433 19119 33

Pan troglodytes 32989 16785 51

Homo sapiens 42000 17609 42

• Образованы 10% кодирующих генов • Около 80% примато-специфичные • Значительная фракция псевдогенов (до 20%) транскрипционно активна…

функциональность

?

Процессированные псевдогены

Механизмы действия процессированных псевдогенов

Регуляторные участки в геноме

Промотор — последовательность нуклеотидов ДНК, узнаваемая РНК-полимеразой для осуществления транскрипции.

мРНК гена А

ТАТА-бокс - консервативная, богатая аденином и тимином последовательность ДНК, выявленная примерно у четверти генов человека на расстоянии 25-30 п. о. слева («вверх по течению») от точки инициации транскрипции. ТАТА-бокс обеспечивает ориентацию РНК-полимеразы относительно промотора, участвует в инициации транскрипции генов.

Регуляторные участки в геноме

Энхансер (enhancer) — последовательность ДНК, способный связываться с факторами транскрипции, при этом увеличивая уровень транскрипции гена или группы генов. Сайленсер (silencer) — последовательность ДНК, с которой связываются факторы транскрипции (белки-репрессоры), что приводит к понижению или к полному подавлению транскрипции гена.

Инсулятор (insulator) — последовательность ДНК, способная блокировать взаимодействие между энхансером и промотором, если находится между ними.

Регуляторные участки в геноме

Уровень экспрессии гена является результирующей всех взаимодействий.

• Проанализировано 19 тканей и типов клеток мыши • Найдено около 300 000 цис-регуляторных последовательностей • Они составляют до 11% генома мыши • И включают в себя более 70% консервативных не-кодирующих последовательностей

Регуляторные участки в геноме

В результате было выявлено:

• 53,834 возможных промоторов

• 234,764 потенциальных энхансеров

• 111,062 инсуляторов

Регуляторные участки в геноме

Повторяющиеся последовательности в ДНК

Тандемные повторы

Организм Всего повторов в

геноме

Сателлиты и

простые повторы

Мобильные

элементы

Кукуруза 70% 10% 60%

Рис 35% 9% 26%

Рожь 87% 15% 72%

Нематода 16% 7% 9%

Медовая пчела 8% 6% 2%

Дрозофила 16% 6% 10%

Москит 95% 11% 84%

Курица 16% 7% 9%

Мышь 62% 15% 47%

Человек 64% 17% 46%

Диспергированные повторы

Повторяющиеся последовательности в ДНК

Тандемные повторы

Сателлиты > 100 нуклеотидов

Минисателлиты от 7 до 100 нукл.

ATGCGTAGCTAGCAGTAGCTGACGTACATGCTAACATGCTAACATGCTAACATGCTAACATGCTAACATGCTAACATGCTAACATGCTAACATGCTAACATGCTAACATGCTACTAGCAGTAGCTGACGTAGACTAGGCTAGC

Микросателлиты от 1 до 6 нуклеотидов

ATGCGTAGCTAGCAGTAGCTGACGTACAACAACAACAACAACAACAACAACAAATGCGTAGCTAGCAGTAGCTGACGTATAGGCTAGCATGCAGTCTAGCTAATGCGATCGCATCG

Диспергированные повторы

Болезни экспансии (умножения) тринуклеотидных повторов

Умножение полиглутаминовых трактов (GAA, GAG)

• болезнь Генгтинтона

• болезнь Кеннеди • спиноцеребеллярная

атаксия тип 1,2,3,6,7,17

Умножение неполиглутаминовых трактов

• синдром ломкой Х-хромосомы

• атаксия Фридрейха • спиноцеребеллярная

атаксия 8,12

Повторяющиеся последовательности в ДНК

Повторяющиеся последовательности в ДНК

Повторяющиеся последовательности в ДНК

Диспергированные повторы

Транспозоны

Ретротранспозоны

мобильные элементы, репликация которых включает перемещение своей ДНК последовательности на новое место в геноме

мобильные элементы, которые могут самовоспроизводиться в геноме, осуществляя реакцию обратной транскрипции.

• 2-3% генома человека • Примеры: MER1, MER2

• 42% генома человека • Примеры: Alu, MIR, LINE1, LINE2…..

Открытие мобильных элементов

Барбара Мак-Клинток, 1944-1951 гг.

лаборатория Колд-Спринг Харбор

Нобелевская премия по физиологии и медицине: «За открытие мобильных генетических элементов»

Исследование южноамериканских видов кукурузы

Эффект транспозиции мобильных элементов выражался в изменении окраски зёрен кукурузы относительно образцов из поколений от контрольного скрещивания.

Mobile DNA in cancer. Extensive transduction of nonrepetitive DNA mediated by L1 retrotransposition in cancer genomes. Tubio JM, Li Y, Ju YS, Martincorena I, Cooke SL, et al.. Science. 2014 Aug 1;345(6196):1251343.

Полиморфизм ДНК

Сравнение результатов

секвенирования индивидуальных геномов человека

Gonzaga-Jauregui C, Lupski JR, Gibbs RA. Human genome sequencing in health and disease. Annu Rev Med. 2012;63:35-61.

Функционирование вторичной структуры ДНК

• Квадруплексы - последовательности нуклеиновых кислот, обогащенные гуанином и способные образовывать структуры из двух, трёх или четырех цепей.

• В геноме человека насчитывается около 350 тысяч квадруплексов.

G-квадруплексы

G-квадруплексы в промоторе

Direct evidence for a G-quadruplex in a promoter region and its targeting with a small molecule to repress c-MYC transcription. Siddiqui-Jain A1, Grand CL, Bearss DJ, Hurley LH. Proc Natl Acad Sci U S A. 2002 Sep 3;99(18):11593-8.

Модель укладки теломер, в которой G4 ДНК взаимодействует с G-квадруплекс связывающими белками (G4BP)

Rudimentary G-quadruplex-based telomere capping in Saccharomyces cerevisiae. Smith JS, Chen Q, Yatsunyk LA, Nicoludis JM, Garcia MS, Kranaster R, Balasubramanian S, Monchaud D, Teulade-Fichou MP, Abramowitz L, Schultz DC, Johnson FB. Nat Struct Mol Biol. 2011 Apr;18(4):478-85.

G-квадруплексы в теломерах

ДНКазимы

• Впервые дезоксирибозимы были экспериментально продемонстрированы в 1994 Брикеро и Джойсом

• Они использовали селекцию in vitro для поиска специфичных ДНК последовательностей способных катализировать Pb2+-зависимое расщепление фосфодиэфирной связи в РНК

• Сегодня в литературе описано большое количество различных каталитических молекул ДНК способных расщеплять, лигировать, фосфорилировать деапуринизировать молекулы ДНК, метилировать порфирины, расщеплять и лигировать молекулы РНК.

• Также в литературе описано несколько десятков случаев использования in vivo РНК-расщепляющих дезоксирибозимов для подавления экспрессии генов с ориентированием на будущий прикладной потенциал.