Информация

Какие домены или мотивы способны присоединяться как к ДНК, так и к РНК?

Какие домены или мотивы способны присоединяться как к ДНК, так и к РНК?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Домены или мотивы факторов транскрипции каталитически активны при присоединении к нуклеиновой кислоте любого типа. Где я могу найти список доменов или мотивов, которые могут присоединяться как к ДНК, так и к РНК? например, домены KH связываются либо с РНК, либо с одноцепочечной ДНК.


Прион

Прионы представляют собой неправильно свернутые белки со способностью передавать свою неправильно свернутую форму нормальным вариантам того же самого белка. Они характеризуют несколько смертельных и трансмиссивных нейродегенеративных заболеваний у людей и многих других животных. [3] Неизвестно, что вызывает неправильную укладку нормального белка, но предполагается, что аномальная трехмерная структура придает инфекционные свойства, сводя соседние молекулы белка к той же форме. Слово прион происходит от «белковой инфекционной частицы». [4] [5] [6] Предполагаемая роль белка как инфекционного агента отличается от всех других известных инфекционных агентов, таких как вироиды, вирусы, бактерии, грибы и паразиты, все из которых содержат нуклеиновые кислоты (ДНК, РНК или и то, и другое).

Прионные изоформы прионного белка (PrP), специфическая функция которых не определена, предполагаются как причина трансмиссивных губчатых энцефалопатий (TSE) [7], включая скрепи у овец, хроническую болезнь истощения (CWD) у оленей, губчатую энцефалопатию крупного рогатого скота ( BSE) у крупного рогатого скота (широко известное как «коровье бешенство») и болезнь Крейтцфельдта – Якоба (CJD) у людей. Все известные прионные заболевания у млекопитающих влияют на структуру мозга или других нервных тканей, все они прогрессируют, не поддаются эффективному лечению и всегда приводят к летальному исходу. [8] До 2015 года считалось, что все известные прионные заболевания млекопитающих вызываются прионным белком (PrP), однако в 2015 году предполагалось, что множественная системная атрофия (MSA) вызвана прионной формой альфа-синуклеина. [9]

Прионы образуют аномальные агрегаты белков, называемых амилоидами, которые накапливаются в инфицированной ткани и связаны с повреждением тканей и гибелью клеток. [10] Амилоиды также ответственны за несколько других нейродегенеративных заболеваний, таких как болезнь Альцгеймера и болезнь Паркинсона. [11] [12] Прионные агрегаты стабильны, и эта структурная стабильность означает, что прионы устойчивы к денатурации химическими и физическими агентами: они не могут быть уничтожены обычной дезинфекцией или приготовлением пищи. Это затрудняет удаление и локализацию этих частиц.

Прионная болезнь - это тип протеопатии или заболевание структурно аномальных белков. Считается, что у людей прионы являются причиной болезни Крейтцфельда-Якоба (CJD), ее варианта (vCJD), синдрома Герстманна-Штреусслера-Шейнкера (GSS), фатальной семейной бессонницы (FFI) и куру. [4] Есть также свидетельства того, что прионы могут играть роль в процессах болезни Альцгеймера, Паркинсона и бокового амиотрофического склероза (БАС). прионоподобные заболевания. [13] [14] [15] [16] Некоторые дрожжевые белки также были идентифицированы как обладающие прионогенными свойствами. [17] [18] Репликация прионов подвержена эпимутации и естественному отбору, как и другие формы репликации, и их структура незначительно варьируется между видами. [19]


СОДЕРЖАНИЕ

Вирусные RdRps были обнаружены в начале 1960-х годов в результате исследований менговирусов и вирусов полиомиелита, когда было обнаружено, что эти вирусы не были чувствительны к актиномицину D, лекарству, которое ингибирует клеточный ДНК-направленный синтез РНК. Это отсутствие чувствительности предполагает, что существует специфический для вируса фермент, который может копировать РНК с матрицы РНК, а не с матрицы ДНК.

RdRps высококонсервативны во всех вирусах и даже связаны с теломеразой, хотя причина этого остается под вопросом с 2009 года. [3] Сходство привело к предположению, что вирусные RdRps являются предками теломеразы человека.

Самый известный пример RdRp - это вирус полиомиелита. Вирусный геном состоит из РНК, которая проникает в клетку через рецептор-опосредованный эндоцитоз. Оттуда РНК может немедленно действовать как матрица для синтеза комплементарной РНК. Таким образом, комплементарная цепь сама по себе может действовать как матрица для производства новых вирусных геномов, которые затем упаковываются и высвобождаются из клетки, готовые инфицировать большее количество клеток-хозяев. Преимущество этого метода репликации заключается в том, что нет стадии репликации ДНК, это быстро и легко. Недостатком является отсутствие «резервной» копии ДНК.

Многие RdRps прочно связаны с мембранами и поэтому трудны для изучения. Наиболее известными RdRps являются полиовирус 3Dpol, вирус везикулярного стоматита L [4] и белок NS5B вируса гепатита С.

Многие эукариоты также имеют RdRps, участвующие в РНК-интерференции, они амплифицируют микроРНК и малые временные РНК и продуцируют двухцепочечную РНК с использованием малых интерферирующих РНК в качестве праймеров. [5] Фактически, те же самые RdRps, которые используются в защитных механизмах, могут быть узурпированы РНК-вирусами для их блага. [6] Их эволюционная история была рассмотрена. [7]

RdRp отличается от РНК-полимеразы, поскольку он работает, чтобы катализировать синтез цепи РНК, комплементарной данной матрице РНК, а не использовать матрицу ДНК. Как описано, процесс репликации РНК представляет собой четырехступенчатый механизм.

  1. Связывание нуклеотидтрифосфата (NTP) - первоначально RdRp представляет собой свободный активный сайт, в котором связывается NTP. Правильное связывание NTP вызывает конформационное изменение RdRp. [8]
  2. Закрытие активного сайта - конформационное изменение, инициированное правильным связыванием NTP, приводит к ограничению доступа к активному сайту и создает каталитически компетентное состояние. [8]
  3. Образование фосфодиэфирной связи - два иона Mg 2+ присутствуют в каталитически активном состоянии и располагаются таким образом вокруг праймера РНК, что субстрат NTP способен подвергаться фосфатидильному переносу и образовывать фосфодиэфирную связь с существующей нуклеотидной цепью. [9] При использовании этих ионов Mg 2+ активный центр теряет каталитическую стабильность, и комплекс RdRp переходит в открытую конформацию. [9]
  4. Транслокация - как только активный сайт открыт, цепь РНК может перемещаться через белковый комплекс RdRp и связывать новый NTP и продолжать удлинение цепи, если иное не указано в шаблоне. [8]

Синтез РНК может осуществляться с помощью независимого от праймера (de novo) или праймер-зависимый механизм, который использует праймер, связанный с вирусным белком, связанный с геномом (VPg). [10] de novo инициация заключается в добавлении нуклеозидтрифосфата (NTP) к 3'-OH первого инициирующего NTP. [10] Во время следующей так называемой фазы элонгации эта реакция переноса нуклеотидила повторяется с последующими NTP для образования продукта комплементарной РНК. Окончание зарождающейся цепи РНК, продуцируемой RdRp, полностью не известно, однако было показано, что терминация RdRp не зависит от последовательности. [11]

Одним из основных недостатков репликации РНК-зависимой РНК-полимеразы является огромное количество ошибок во время транскрипции. [10] Известно, что RdRps имеет недостаточную точность порядка 10 4 нуклеотидов, что считается прямым результатом его недостаточных способностей к корректуре. [10] Такой высокий уровень вариабельности благоприятствует вирусным геномам, поскольку он позволяет патогену преодолевать защитные механизмы, выработанные хозяевами, пытающимися избежать инфекции, обеспечивая эволюционный рост.

Вирусные / прокариотические РНК-направленные РНК-полимеразы, наряду со многими ДНК-направленными полимеразами с одной субъединицей, используют складку, организация которой связана с формой правой руки с тремя субдоменами, называемыми пальцами, ладонью и большим пальцем. [12] Только субдомен ладони, состоящий из четырехцепочечного антипараллельного бета-листа с двумя альфа-спиралями, хорошо консервативен среди всех этих ферментов. В RdRp субдомен ладони включает три хорошо консервативных мотива (A, B и C). Мотив A (D-x (4,5) -D) и мотив C (GDD) пространственно сопоставлены, остатки аспарагиновой кислоты этих мотивов подразумеваются в связывании Mg 2+ и / или Mn 2+. Остаток аспарагина в мотиве B участвует в отборе рибонуклеозидтрифосфатов вместо dNTP и, таким образом, определяет, синтезируется ли РНК, а не ДНК. [13] Доменная организация [14] и трехмерная структура каталитического центра широкого спектра RdRps, даже с низкой общей гомологией последовательностей, сохраняются. Каталитический центр образован несколькими мотивами, содержащими ряд консервативных аминокислотных остатков.

Эукариотическая РНК-интерференция требует клеточной РНК-зависимой РНК-полимеразы (c RdRp). В отличие от «ручных» полимераз, они напоминают упрощенные многосубъединичные ДНК-зависимые РНК-полимеразы (DdRP), особенно в каталитических β / β 'субъединицах, в том, что они используют два набора β-бочек с двойным фунт на квадратный дюйм в активном центре. QDE1 (Q9Y7G6) в Neurospora crassa, который имеет оба цилиндра в одной цепи, [15] является примером такого фермента. [16] Гомологи бактериофагов, включая аналогично одноцепочечный DdRp yonO (O31945), по-видимому, ближе к c-RdRps, чем DdRP. [5] [17]

Существует 4 суперсемейства вирусов, которые охватывают все РНК-содержащие вирусы без стадии ДНК:

  • Вирусы, содержащие РНК с положительной или двухцепочечной РНК, кроме ретровирусов и Birnaviridae
    • Все эукариотические вирусы с положительной цепью РНК без стадии ДНК
    • У всех РНК-содержащих бактериофагов существует два семейства РНК-содержащих бактериофагов: Левивириды (положительные фаги оцРНК) и Cystoviridae (фаги дцРНК)
    • семейство вирусов дцРНК Reoviridae, Totiviridae, Hypoviridae, Partitiviridae

    Транскрипция РНК аналогична [ как? ], но не то же самое, что репликация ДНК.

    Флавивирусы продуцируют полипротеин из генома оцРНК. Полипротеин расщепляется на ряд продуктов, одним из которых является NS5, РНК-зависимая РНК-полимераза. Эта РНК-направленная РНК-полимераза обладает рядом коротких участков и мотивов, гомологичных другим РНК-направленным РНК-полимеразам. [18]

    РНК-репликаза, обнаруженная в вирусах оцРНК с положительной цепью, связана друг с другом, образуя три больших суперсемейства. [19] Бирнавирусная РНК-репликаза уникальна тем, что в ней отсутствует мотив C (GDD) на ладони. [20] Мононегавирусный RdRp (PDB 5A22) был автоматически классифицирован как аналог (+) - ssRNA RdRps, в частности, один из Пестивирус и один из Левивириды. [21] Буньявирусный мономер RdRp (PDB 5AMQ) напоминает гетеротримерный комплекс ортомиксовируса (Influenza PDB 4WSB) RdRp. [22]

    Поскольку это универсальный белок для РНК-содержащих вирусов, RdRp является полезным маркером для понимания их эволюции. [23] Была рассмотрена общая структурная эволюция вирусного RdRps. [24]

    Рекомбинация Править

    При репликации своего (+) генома оцРНК полиовирус RdRp способен осуществлять рекомбинацию. Рекомбинация, по-видимому, происходит с помощью механизма выбора копии, в котором RdRp переключает (+) матрицы ssRNA во время синтеза отрицательной цепи. [25] Частота рекомбинации частично определяется точностью репликации RdRp. [26] Варианты RdRp с высокой точностью репликации показывают сниженную рекомбинацию, а RdRp с низкой точностью демонстрируют повышенную рекомбинацию. [26] Рекомбинация путем переключения цепи RdRp также часто происходит во время репликации в (+) оцРНК растительных кармовирусов и tombusviruses. [27]

    Внутригенное дополнение Править

    Вирус Сендай (семейный Paramyxoviridae) имеет линейный, одноцепочечный, негативный, несегментированный геном РНК. Вирусный RdRp состоит из двух кодируемых вирусом субъединиц, меньшей P и большей L. Когда разные неактивные мутанты RdRp с дефектами по всей длине субъединицы L тестировались в парных комбинациях, в некоторых случаях наблюдалось восстановление синтеза вирусной РНК. комбинации. [28] Это положительное L-L-взаимодействие называется внутригенной комплементацией и указывает на то, что L-белок является олигомером в комплексе вирусной РНК-полимеразы.

    RdRps можно использовать в качестве лекарственных мишеней для вирусных патогенов, поскольку их функция не является необходимой для выживания эукариот. Ингибируя функцию РНК-зависимой РНК-полимеразы, новые РНК не могут реплицироваться из цепи матрицы РНК, однако ДНК-зависимая РНК-полимераза останется функциональной.

    В настоящее время существуют противовирусные препараты против гепатита С и COVID-19, которые специально нацелены на RdRp. К ним относятся софосбувир и рибавирин против гепатита C [29] и ремдесивир, единственный одобренный FDA препарат против COVID-19.

    GS-441524 трифосфат является субстратом для RdRp, но не для полимераз млекопитающих. Это приводит к преждевременному обрыву цепи и подавлению репликации вируса. Трифосфат GS-441524 - это биологически активная форма пролекарства фосфата Ремдесивира. Ремдесивир классифицируется как аналог нуклеотида, в котором он действует, чтобы ингибировать функцию RdRp путем ковалентного связывания и прерывания терминации растущей РНК посредством ранней или отсроченной терминации или предотвращения дальнейшего удлинения полинуклеотида РНК. [30] [31] Это раннее завершение приводит к нефункциональной РНК, которая будет деградировать в результате нормальных клеточных процессов.

    Использование РНК-зависимой РНК-полимеразы играет важную роль в РНК-интерференции у эукариот, процессе, используемом для подавления экспрессии генов посредством связывания малых интерферирующих РНК (миРНК) с мРНК, что делает их неактивными. [32] Эукариотический RdRp становится активным в присутствии дцРНК, однако RdRp присутствует только в избранном подмножестве эукариот, включая C. elegans а также P. tetraurelia. [33] Это присутствие dsRNA запускает активацию процессов RdRp и RNAi, инициируя инициацию транскрипции РНК через введение siRNAs в систему. [33] В C. elegans, миРНК интегрированы в комплекс РНК-индуцированного сайленсинга, RISC, который работает вместе с мРНК, нацеленными на вмешательство, для рекрутирования большего количества RdRps для синтеза большего количества вторичных миРНК и подавления экспрессии генов. [34]


    Методы

    Изучены системы оцДНК – оцДБП и оцРНК – оцРБП.

    Для всестороннего анализа разнообразных взаимодействий между белками и одноцепочечными нуклеиновыми кислотами мы изучили 12 комплексов: шесть комплексов ssDNA – ssDBP и шесть комплексов ssRNA – ssRBP, трехмерные структуры которых известны (суммированы в таблице 1). Наборы комплексов белок-ДНК и белок-РНК включают белки, выполняющие разные функции, со складками разного размера и с гетерогенными оцДНК / оцРНК, имеющими разные длины и последовательности. Белки в этих комплексах ssDNA – ssDBP принадлежат к разным структурным доменам: складке связывания олигонуклеотидов / олигосахаридов (OB), домену мотива узнавания РНК (RRM) и домену K-гомологии (KH). Отметим, что четыре комплекса с OB-складками различаются по своему строению (я.е., длина белка) и последовательности. Сходным образом, шесть комплексов ssRNA-ssRBP были также выбраны для покрытия различных структурных доменов, а именно OB-складки, RRM, домена PUF, домена цинкового пальца, белка RAMP и Fab. В целом, мы рассмотрели различные складки, в которых вклады электростатической и ароматической энергии накопления варьируются от очень высокой доли энергии накопления (OB-складка) до высокой доли электростатической энергии (KH-домен и RAMP). Судя по доступным структурам 12 изученных здесь комплексов и исходя из имеющихся несвязанных структур, кажется маловероятным, что белки претерпевают значительные конформационные изменения, чтобы связать свои лиганды оцДНК / оцРНК. Молекулы оцДНК и оцРНК гораздо более гибкие в растворе, чем свернутые белки. Соответственно, можно сделать вывод, что поверхности связывания в ssDBP и ssRBP предопределены, и большие конформационные изменения происходят только для ssDNA / ssRNA.


    Название: РНК-зависимое нацеливание на РНК с помощью CRISPR-Cas9

    Связывание и расщепление двухцепочечной ДНК (дцДНК) с помощью Cas9 является отличительным признаком бактериального адаптивного иммунитета CRISPR-Cas типа II. Считается, что все известные ферменты Cas9 распознают ДНК исключительно как естественный субстрат, обеспечивая защиту от ДНК-фагов и плазмид. Здесь мы показываем, что ферменты Cas9 из подтипов II-A и II-C могут распознавать и расщеплять одноцепочечную РНК (оцРНК) с помощью механизма, управляемого РНК, который не зависит от последовательности мотива, примыкающего к протоспейсер (PAM) в мишени. РНК. РНК-управляемое расщепление РНК является программируемым и сайт-специфичным, и мы обнаружили, что эту активность можно использовать для уменьшения инфицирования фагом одноцепочечной РНК in vivo. Мы также демонстрируем, что Cas9 может направлять PAM-независимую репрессию экспрессии генов в бактериях. В заключение, эти результаты показывают, что подмножество ферментов Cas9 обладает способностью действовать как на последовательности-мишени ДНК, так и на РНК, и предполагают возможность использования в приложениях для нацеливания программируемых РНК.


    RG-rich повторы - швейцарский армейский нож белок-РНК взаимодействий

    Часто встречающийся неупорядоченный РНК-связывающий мотив в RBP состоит из повторов аргинина и глицина, называемых RGG-боксами или повторами GAR. Эти последовательности неоднородны как по количеству повторов, так и по расстоянию между ними. Недавний анализ разделил эти богатые RG области на блоки ди- и три-RG и -RGG и выявил экземпляры таких повторов в порядке от десятков (ди- и три-RGG) до сотен (три-RG) и почти двух тысяч. (di-RG) белки [47]. Белки, содержащие такие повторы, обогащены метаболическими функциями РНК [47]. Однако в настоящее время неясно, обеспечивают ли разные повторяющиеся архитектуры различные функциональные сигнатуры.

    RGG-бокс был впервые идентифицирован в гетерогенном ядерном рибонуклеопротеидном белке U (hnRNP-U, также известном как SAF-A) как область, достаточная и необходимая для связывания РНК (Таблица 1, Рис. 1). hnRNP-U лишен канонических RBDs, но имеет полуструктурированный домен SAP, участвующий в связывании ДНК [48-50]. Было обнаружено, что hnRNP-U нацелен на сотни некодирующих РНК, включая малые ядерные (sn) РНК, участвующие в сплайсинге РНК, и ряд длинных некодирующих (lnc) РНК, зависимым от RGG-бокса способом [51 ]. RGG-опосредованное взаимодействие hnRNP-U с lncRNAs Xist [52] и PANDA [53] участвует в эпигенетической регуляции.

    Связывание РНК, опосредованное RG [G], также играет роль в экспорте ядерной РНК, как показано на примере фактора экспорта ядерной РНК 1 (NXF1). В то время как NXF1 содержит RRM, способный связывать РНК [54], большая часть способности связывания РНК in vivo приписывается RGG-содержащей N-концевой области [55] (Таблица 1). Аргинины в этом мотиве играют ключевую роль во взаимодействии с РНК, которая, как было показано, не зависит от последовательности, но необходима для экспорта РНК [55]. Общее сродство NXF1 к РНК низкое [55, 56] и требует сотрудничества с экспортным адаптером ALY / REF [57]. ALY / REF также несет на N-конце неупорядоченную богатую аргинином область, которая напоминает RGG-бокс [57] и обеспечивает как связывание РНК [54, 58, 59], так и взаимодействие с NXF1 [60]. Активация NXF1, как предполагается, запускается образованием тройного комплекса между ALY / REF и NXF1, в котором их богатые RG неупорядоченные области играют центральную роль. Аналогичные последовательности были идентифицированы в вирусных белках, а также способствуют экспорту вирусной РНК, минуя канонические пути ядерного экспорта (Таблица 1).

    Белок умственной отсталости Fragile X (FMRP) представляет собой еще один RBP с хорошо охарактеризованным РНК-связывающим RGG-боксом (рис. 1). Участвуя в репрессии трансляции в головном мозге [61], потеря активности FMRP ведет к изменениям в синаптических связях [62], умственной отсталости [63–65], а также может способствовать возникновению нейродегенеративных заболеваний [66]. Помимо своего RGG-бокса, FMRP содержит два домена KH, которые участвуют в связывании РНК. RGG-box FMRP, как было показано, взаимодействует с высоким сродством со структурами G-quadruplex РНК [67–77]. RGG-box не имеет структуры в своем несвязанном состоянии [70, 78], но сворачивается при связывании с богатым гуанином структурированным G-квадруплексом в РНК-мишени [78] (Fig. 2). И аргинины, и глицины играют ключевую роль в функции RGG-бокса, и замена этих аминокислот нарушает связывание РНК [78]. Остатки аргинина, используемые для взаимодействия с РНК, варьируются в зависимости от целевой РНК [70, 76, 78]. FMRP RGG-box нацелен на свою собственную мРНК в структуре G-квадруплекса, которая кодирует RGG-box [69]. Это связывание регулирует альтернативный сплайсинг мРНК FMRP проксимальнее G-квартета, предполагая, что оно может саморегулировать баланс изоформ FRMP [74]. Удивительно, но недавнее исследование транскриптома ассоциированного с полисомами FMRP не обнаружило обогащения для предсказанных структур G-quadruplex в 842 мРНК-мишенях с высокой степенью достоверности [79]. Другое исследование выявило сайты связывания FMRP, обогащенные специфическими мотивами последовательностей, где домены KH2 выступили в качестве основных детерминант специфичности [80]. Эти результаты предполагают, что роль RGG-бокса в этом RBP может быть ограничена увеличением общей аффинности связывания белка, поддерживая специфичные для последовательности взаимодействия, опосредованные доменами KH2. Однако мы не можем исключить возможность дифференциальной эффективности УФ-поперечного сшивания доменов KH2 и RGG-бокса, что может привести к смещенным сигнатурам связывания в исследованиях CLIP.

    Структурные примеры РНК-связанные неупорядоченные области. а RGG-пептид человеческого FMRP, связанный с in vitro-отобранная богатая гуанином sc1 РНК, определенная методом ЯМР (PDB 2LA5) [78] б Базовый участок неупорядоченного вируса иммунодефицита крупного рогатого скота (BIV) Tat образует β-поворот при взаимодействии со своей целевой РНК, TAR. Структура определена ЯМР (PDB 1MNB) [91] c Димер основного пластыря, содержащего белок Rev вируса иммунодефицита человека (ВИЧ) в комплексе с РНК-мишенью, RRE, определенный методом кристаллографии [102] (PDB 4PMI). Красный, пептидный желтый, РНК. Иллюстрации были созданы с использованием PyMol

    Ряд других RBPs используют область RGG-повтора для нацеливания на G-богатые и структурированные РНК-мишени и вовлечены в неврологические заболевания, а также в рак (Таблица 1). Эти богатые RG области могут опосредовать как неселективные, так и специфические взаимодействия с РНК и могут участвовать в различных метаболических процессах РНК.


    Какие домены или мотивы способны присоединяться как к ДНК, так и к РНК? - Биология

    Системы CRISPR / Cas обеспечивают бактерии и археи адаптивным иммунитетом против вирусов и плазмид за счет использования crRNA для подавления инвазивных нуклеиновых кислот. Мы показываем здесь, что в подмножестве этих систем зрелые основания crRNA спарены с транс-активирующая tracrRNA образует структуру из двух РНК, которая направляет CRISPR-связанный белок Cas9 для введения двухцепочечных (ds) разрывов в ДНК-мишени. В сайтах, комплементарных направляющей последовательности crRNA, домен нуклеазы Cas9 HNH расщепляет комплементарную цепь, в то время как домен Cas9 RuvC расщепляет некомплементарную цепь. Двойная tracrRNA: crRNA, когда сконструирована как химера с единственной РНК, также направляет специфичное для последовательности расщепление дцДНК Cas9. Наше исследование выявляет семейство эндонуклеаз, которые используют двойные РНК для сайт-специфического расщепления ДНК, и подчеркивает потенциал использования системы для редактирования генома, программируемого с помощью РНК.

    Бактерии и археи развили РНК-опосредованные системы адаптивной защиты под названием CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) / Cas (связанные с CRISPR), которые защищают организмы от вторжений вирусов и плазмид (13). Эти защитные системы полагаются на малые РНК для последовательного обнаружения и подавления чужеродных нуклеиновых кислот. Системы CRISPR / Cas состоят из cas гены, организованные в оперон (ы), и массив CRISPR, состоящий из уникальных нацеливающих на геном последовательностей (называемых спейсерами) с вкраплениями идентичных повторов (13). CRISPR / Cas-опосредованный иммунитет происходит в три этапа. В адаптивной фазе бактерии и археи, несущие один или несколько локусов CRISPR, отвечают на вирусную и плазмидную нагрузку путем интеграции коротких фрагментов чужеродной последовательности (протоспейсеров) в хромосому хозяина на проксимальном конце массива CRISPR (13). На этапах экспрессии и интерференции транскрипция элемента повтор-спейсер в молекулы предшественника CRISPR РНК (пре-crRNA) с последующим ферментативным расщеплением дает короткие crRNA, которые могут образовывать пары оснований с комплементарными последовательностями протоспейсера вторгающихся вирусных или плазмидных мишеней (411). Распознавание мишени crРНК направляет подавление чужеродных последовательностей с помощью белков Cas, которые функционируют в комплексе с crRNA (10, 1220).

    Существует три типа систем CRISPR / Cas (2123). Системы типа I и III обладают некоторыми общими характеристиками: специализированные эндонуклеазы Cas обрабатывают пре-crRNA, и после созревания каждая crRNA собирается в большой мульти-Cas белковый комплекс, способный распознавать и расщеплять нуклеиновые кислоты, комплементарные crRNA. Напротив, системы типа II обрабатывают пре-crРНК по другому механизму, в котором транс-активирующая crРНК (tracrRNA), комплементарная последовательностям повторов в пре-crRNA, запускает процессинг двухцепочечной РНК-специфической рибонуклеазой РНКазы III в присутствии белок Cas9 (ранее Csn1) (4, 24) (рис. S1). Считается, что Cas9 является единственным белком, ответственным за подавление чужеродной ДНК, управляемое crRNA (2527).

    Мы показываем здесь, что в системах типа II белки Cas9 составляют семейство ферментов, которым необходима структура с парными основаниями, сформированная между активирующей tracrRNA и нацеливающей crRNA для расщепления целевой двухцепочечной (ds) ДНК. Сайт-специфическое расщепление происходит в местах, определяемых как комплементарностью спаривания оснований между crRNA и целевой ДНК протоспейсера, так и коротким мотивом (называемым мотивом, прилегающим к протоспейсеру, или PAM), расположенным рядом с комплементарной областью в целевой ДНК. Наше исследование также демонстрирует, что семейство эндонуклеаз Cas9 может быть запрограммировано с помощью отдельных молекул РНК для расщепления определенных участков ДНК, тем самым повышая захватывающую возможность разработки простой и универсальной РНК-направленной системы для генерации разрывов дцДНК (DSB) для нацеливания и редактирования генома.

    Cas9 - это эндонуклеаза ДНК, управляемая двумя РНК. Было высказано предположение, что Cas9, характерный белок систем типа II, участвует как в созревании crRNA, так и в ДНК-интерференции, управляемой crRNA (рис. S1) (4, 2527). Cas9 участвует в созревании crRNA (4), но его непосредственное участие в разрушении ДНК-мишени не исследовано. Чтобы проверить, может ли Cas9 быть способным к расщеплению целевой ДНК и каким образом, мы использовали систему сверхэкспрессии для очистки белка Cas9, полученного из патогена. Streptococcus pyogenes (рис. S2) и протестировали его способность расщеплять плазмидную ДНК или олигонуклеотидный дуплекс, несущий последовательность протоспейсера, комплементарную зрелой crRNA, и добросовестный PAM. Мы обнаружили, что только зрелая крРНК не способна управлять расщеплением плазмидной ДНК, катализируемым Cas9 (фиг. 1A и фиг. S3A). Однако добавление tracrRNA, которая может образовывать пары оснований с повторяющейся последовательностью crRNA и является важным для созревания crRNA в этой системе, запускает Cas9 для расщепления плазмидной ДНК (фиг. 1A и фиг. S3A). Для реакции расщепления требовались как магний, так и присутствие последовательности crRNA, комплементарной ДНК. CrRNA, способная к спариванию оснований tracrRNA, но содержащая не родственную целевую ДНК-связывающую последовательность, не поддерживала катализируемое Cas9 расщепление плазмиды (рис. 1A и рис. S3A, сравните crRNA-sp2 с crRNA-sp1 и рис. S4A). Аналогичные результаты были получены с коротким линейным субстратом дцДНК (фиг. 1B и фиг. S3, B и C). В транс-активирующая tracrRNA, таким образом, представляет собой небольшую некодирующую РНК с двумя важными функциями: запуск процессинга пре-crRNA ферментом РНКазой III (4) и впоследствии активируя расщепление ДНК, управляемое крРНК, с помощью Cas9.

    Cas9 - это эндонуклеаза ДНК, управляемая двумя молекулами РНК. (А) Cas9 был запрограммирован с помощью 42-нуклеотидной crRNA-sp2 (crRNA, содержащей последовательность спейсера 2) в присутствии или в отсутствие 75-нуклеотидной tracrRNA. Комплекс добавляли к кольцевой или XhoI-линеаризованной плазмидной ДНК, несущей последовательность, комплементарную спейсеру 2 и функциональному PAM. crRNA-sp1, контроль специфичности M, маркер ДНК см. рис. S3A. (B) Cas9 был запрограммирован с помощью crRNA-sp2 и tracrRNA (нуклеотиды 4-89). Комплекс инкубировали с двух- или одноцепочечными ДНК, несущими последовательность, комплементарную спейсеру 2 и функциональному PAM (4). Комплементарные или некомплементарные цепи ДНК были помечены 5'-радиоактивной меткой и отожжены с немеченой партнерской цепью. См. Рис. S3, B и C. (C) Анализ секвенирования продуктов расщепления из фиг. 1А. Прекращение удлинения праймера в реакции секвенирования указывает положение сайта расщепления. 3'-концевой выступ A (звездочка) является артефактом реакции секвенирования. См. Рис. S5, A и C. (DПродукты расщепления из фиг. 1B анализировали вместе с маркерами размера, меченными 5'-концом, происходящими из комплементарных и некомплементарных цепей дуплекса ДНК-мишени. М, маркер Р, продукт расщепления. См. Рис. S5, B и C. (E) Схематическое изображение последовательностей ДНК tracrRNA, crRNA-sp2 и протоспейсера 2 области комплементарности crRNA с tracrRNA (оранжевый) и ДНК протоспейсера (желтый) представлены последовательностью PAM, серые сайты расщепления, картированные на (C) и (D), представлены синие стрелки (C), красная стрелка (D, дополнительная цепь) и красная линия (D, неполная цепь).

    Расщепление как плазмиды, так и короткой линейной дцДНК с помощью tracrRNA: Cas9, управляемый crRNA, является сайт-специфичным (фиг. 1, C-E и фиг. S5, A и B). Расщепление плазмидной ДНК приводило к образованию тупых концов в положении трех пар оснований выше последовательности PAM (рис. 1, C и E, и рис. S5, A и C) (26). Аналогичным образом, в коротких дуплексах дцДНК, цепь ДНК, которая комплементарна последовательности связывания мишени в crРНК (комплементарная цепь), расщепляется в сайте на три пары оснований выше PAM (рис.1, D и E, и рис. S5, B и C). Некомплементарная цепь ДНК расщепляется по одному или нескольким сайтам в пределах от 3 до 8 пар оснований перед PAM. Дальнейшее исследование показало, что некомплементарная цепь сначала расщепляется эндонуклеолитически, а затем обрезается 3'-5'-экзонуклеазной активностью (рис. S4B). Скорости расщепления Cas9 в условиях однократного оборота варьировались от 0,3 до 1 мин -1, что сравнимо с таковыми для эндонуклеаз рестрикции (рис. S6A), при инкубации комплекса Cas9-tracrRNA: crRNA дикого типа с 5-кратным молярным избытком субстратная ДНК предоставила доказательства того, что Cas9, управляемый двойной РНК, является многооборотным ферментом (рис. S6B). В отличие от комплекса CRISPR Type I Cascade (18), Cas9 расщепляет как линеаризованные, так и суперскрученные плазмиды (Figs. 1A and 2A). Таким образом, инвазивная плазмида может, в принципе, многократно расщепляться белками Cas9, запрограммированными различными crRNA.

    Cas9 использует два нуклеазных домена для расщепления двух цепей целевой ДНК. (А) Вверху: схематическое изображение доменной структуры Cas9, показывающее положения доменных мутаций. Внизу: комплексы белков Cas9 дикого типа или мутантных по нуклеазе белков с tracrRNA: crRNA-sp2 анализировали на эндонуклеазную активность, как показано на фиг. 1A. (B) Комплексы Cas9 дикого типа или мутантов нуклеазного домена с tracrRNA и crRNA-sp2 тестировали на активность, как показано на фиг. 1B.

    Каждый домен нуклеазы Cas9 расщепляет одну цепь ДНК. Cas9 содержит домены, гомологичные эндонуклеазам HNH и RuvC (рис. 2А и рис. S7) (2123, 27, 28). Мы разработали и очистили варианты Cas9, содержащие инактивирующие точечные мутации в каталитических остатках HNH или RuvC-подобных доменов (рис. 2A и рис. S7) (23, 27). Incubation of these variant Cas9 proteins with native plasmid DNA showed that dual-RNA–guided mutant Cas9 proteins yielded nicked open circular plasmids, while the wild-type Cas9 protein-tracrRNA:crRNA complex produced a linear DNA product (Figs. 1A and 2A and figs. S3A and S8A). This result indicates that the Cas9 HNH and RuvC-like domains each cleave one plasmid DNA strand. To determine which strand of the target DNA is cleaved by each Cas9 catalytic domain, we incubated the mutant Cas9-tracrRNA:crRNA complexes with short dsDNA substrates in which either the complementary or the noncomplementary strand was radiolabeled at its 5′ end. The resulting cleavage products indicated that the Cas9 HNH domain cleaves the complementary DNA strand, while the Cas9 RuvC-like domain cleaves the noncomplementary DNA strand (Fig. 2B and fig. S8B).

    Dual-RNA requirements for target DNA binding and cleavage. tracrRNA might be required for target DNA binding and/or to stimulate the nuclease activity of Cas9 downstream of target recognition. To distinguish between these possibilities, we used an electrophoretic mobility shift assay to monitor target DNA binding by catalytically inactive Cas9 in the presence or absence of crRNA and/or tracrRNA. Addition of tracrRNA substantially enhanced target DNA binding by Cas9, whereas little specific DNA binding was observed with Cas9 alone or Cas9-crRNA (fig. S9). This indicates that tracrRNA is required for target DNA recognition, possibly by properly orienting the crRNA for interaction with the complementary strand of target DNA. The predicted tracrRNA:crRNA secondary structure includes base-pairing between the 3′-terminal 22-nucleotides of the crRNA and a segment near the 5′ end of the mature tracrRNA (Fig. 1E). This interaction creates a structure in which the 5′-terminal 20 nucleotides of the crRNA, which vary in sequence in different crRNAs, are available for target DNA binding. The bulk of the tracrRNA downstream of the crRNA base-pairing region is free to form additional RNA structure(s) and/or to interact with Cas9 or the target DNA site. To determine whether the entire length of the tracrRNA is necessary for site-specific Cas9-catalyzed DNA cleavage, we tested Cas9-tracrRNA:crRNA complexes reconstituted using full-length mature (42-nt) crRNA and various truncated forms of tracrRNA lacking sequences at their 5′ or 3′ ends. These complexes were tested for cleavage using a short target dsDNA. A substantially truncated version of the tracrRNA retaining nucleotides 23-48 of the native sequence was capable of supporting robust dual-RNA–guided Cas9-catalyzed DNA cleavage (Fig. 3, A and C, and fig. S10, A and B). Truncation of the crRNA from either end showed that Cas9-catalyzed cleavage in the presence of tracrRNA could be triggered with crRNAs missing the 3′-terminal 10 nucleotides (Fig. 3, B and C). In contrast, a 10-nucleotide deletion from the 5′ end of crRNA abolished DNA cleavage by Cas9 (Fig. 3B). We also analyzed Cas9 orthologs from various bacterial species for their ability to support S. pyogenes tracrRNA:crRNA-guided DNA cleavage. In contrast to closely related S. pyogenes Cas9 orthologs, more distantly related orthologs were not functional in the cleavage reaction (fig. S11). Сходным образом, S. pyogenes Cas9 guided by tracrRNA:crRNA pairs originating from more distant systems were unable to cleave DNA efficiently (fig. S11). Species specificity of dual-RNA–guided cleavage of DNA indicates co-evolution of Cas9, tracrRNA and the crRNA repeat, as well as the existence of a still unknown structure and/or sequence in the dual-RNA that is critical for the formation of the ternary complex with specific Cas9 orthologs.

    Cas9-catalyzed cleavage of target DNA requires an activating domain in tracrRNA and is governed by a seed sequence in the crRNA. (А) Cas9-tracrRNA:crRNA complexes were reconstituted using 42-nucleotide crRNA-sp2 and truncated tracrRNA constructs and assayed for cleavage activity as in Fig. 1B. (B) Cas9 programmed with full-length tracrRNA and crRNA-sp2 truncations was assayed for activity as in (A). (C) Minimal regions of tracrRNA and crRNA capable of guiding Cas9-mediated DNA cleavage (blue box). (D) Plasmids containing wild-type or mutant protospacer 2 sequences with indicated point mutations (right) were cleaved in vitro by programmed Cas9 as in Fig. 1A (left top) and used for transformation assays of wild-type or pre-crRNA-deficient S. pyogenes (left bottom). The transformation efficiency was calculated as CFU per μg of plasmid DNA error bars represent standard deviations for three biological replicates. (E) Plasmids containing wild-type and mutant protospacer 2 inserts with varying extent of crRNA-target DNA mismatches (right) were cleaved in vitro by programmed Cas9 (left). The cleavage reactions were further digested with XmnI. The 1880 bp and 800 bp fragments are Cas9-generated cleavage products.

    To investigate the protospacer sequence requirements for Type II CRISPR/Cas immunity in bacterial cells, a series of protospacer-containing plasmid DNAs harboring single-nucleotide mutations were analyzed for their maintenance following transformation in S. pyogenes and their ability to be cleaved by Cas9 in vitro. In contrast to point mutations introduced at the 5′ end of the protospacer, mutations in the region close to the PAM and the Cas9 cleavage sites were not tolerated in vivo and resulted in decreased plasmid cleavage efficiency in vitro (Fig. 3D). Our results are in agreement with a previous report of protospacer escape mutants selected in the Type II CRISPR system from S. thermophilus in vivo (27, 29). Furthermore, the plasmid maintenance and cleavage results hint at the existence of a “seed” region located at the 3′ end of the protospacer sequence that is crucial for the interaction with crRNA and subsequent cleavage by Cas9. In support of this notion, Cas9 enhanced complementary DNA strand hybridization to the crRNA and this enhancement was the strongest in the 3′-terminal region of the crRNA targeting sequence (fig. S12). Corroborating this, a contiguous stretch of at least 13 base pairs between the crRNA and the target DNA site proximal to the PAM is required for efficient target cleavage, while up to six contiguous mismatches in the 5′-terminal region of the protospacer are tolerated (Fig. 3E). These findings are reminiscent of the previously observed seed sequence requirements for target nucleic acid recognition in Argonaute proteins (30, 31) and the Cascade and Csy CRISPR complexes (13, 14).

    A short sequence motif dictates R-loop formation. In multiple CRISPR/Cas systems, recognition of self versus non-self has been shown to involve a short sequence motif that is preserved in the foreign genome, referred to as the PAM (27, 29, 3234). PAM motifs are only a few base pairs in length, and their precise sequence and position vary according to the CRISPR/Cas system type (32). в S. pyogenes Type II system, the PAM conforms to an NGG consensus sequence, containing two G:C base pairs that occur one base pair downstream of the crRNA binding sequence, within the target DNA (4). Transformation assays demonstrated that the GG motif is essential for protospacer plasmid DNA elimination by CRISPR/Cas in bacterial cells (fig. S13A), consistent with previous observations in S. thermophilus (27). The motif is also essential for in vitro protospacer plasmid cleavage by tracrRNA:crRNA-guided Cas9 (fig. S13B). To determine the role of the PAM in target DNA cleavage by the Cas9-tracrRNA:crRNA complex, we tested a series of dsDNA duplexes containing mutations in the PAM sequence on the complementary or noncomplementary strands, or both (Fig. 4A). Cleavage assays using these substrates showed that Cas9-catalyzed DNA cleavage was particularly sensitive to mutations in the PAM sequence on the noncomplementary strand of the DNA, in contrast to complementary strand PAM recognition by Type I CRISPR/Cas systems (18, 34). Cleavage of target single-stranded DNAs was unaffected by mutations of the PAM motif. This observation suggests that the PAM motif is required only in the context of target dsDNA and may thus be required to license duplex unwinding, strand invasion, and the formation of an R-loop structure. Using a different crRNA-target DNA pair (crRNA-sp4 and protospacer 4 DNA), selected due to the presence of a canonical PAM not present in the protospacer 2 target DNA, we found that both G nucleotides of the PAM were required for efficient Cas9-catalyzed DNA cleavage (Fig. 4B and fig. S13C). To determine whether the PAM plays a direct role in recruiting the Cas9-tracrRNA:crRNA complex to the correct target DNA site, binding affinities of the complex for target DNA sequences were analyzed by native gel mobility shift assays (Fig. 4C). Mutation of either G in the PAM sequence substantially reduced the affinity of Cas9-tracrRNA:crRNA for the target DNA. This finding argues for specific recognition of the PAM sequence by Cas9 as a prerequisite for target DNA binding and possibly strand separation to allow strand invasion and R-loop formation, which would be analogous to the PAM sequence recognition by CasA/Cse1 implicated in a Type I CRISPR/Cas system (34).

    A PAM is required to license target DNA cleavage by the Cas9-tracrRNA:crRNA complex. (А) Dual RNA-programmed Cas9 was tested for activity as in Fig. 1B. Wild-type and mutant PAM sequences in target DNAs are indicated (right). (B) Protospacer 4 target DNA duplexes (labeled at both 5′ ends) containing wild-type and mutant PAM motifs were incubated with Cas9 programmed with tracrRNA (nt 23-89):crRNA-sp4. At indicated time points (min), aliquots of the cleavage reaction were taken and analyzed as in Fig. 1B. (C) Electrophoretic mobility shift assays were performed using RNA-programmed Cas9 (D10A/H840A) and protospacer 4 target DNA duplexes [same as in (B)] containing wild-type and mutated PAM motifs. Cas9 (D10A/H840A)-RNA complex was titrated from 100 pM to 1 μM.

    Cas9 can be programmed with a single chimeric RNA. Examination of the likely secondary structure of the tracrRNA:crRNA duplex (Figs. 1E and 3C) suggested the possibility that the features required for site-specific Cas9-catalyzed DNA cleavage could be captured in a single chimeric RNA. Although the tracrRNA:crRNA target selection mechanism works efficiently in nature, the possibility of a single RNA-guided Cas9 is appealing due to its potential utility for programmed DNA cleavage and genome editing (Fig. 5A). We designed two versions of a chimeric RNA containing a target recognition sequence at the 5′ end followed by a hairpin structure retaining the base-pairing interactions that occur between the tracrRNA and the crRNA (Fig. 5B). This single transcript effectively fuses the 3′end of crRNA to the 5′ end of tracrRNA, thereby mimicking the dual-RNA structure required to guide site-specific DNA cleavage by Cas9. In cleavage assays using plasmid DNA, we observed that the longer chimeric RNA was able to guide Cas9-catalyzed DNA cleavage in a manner similar to that observed for the truncated tracrRNA:crRNA duplex (Fig. 5B and fig. S14, A and C). The shorter chimeric RNA did not work efficiently in this assay, confirming that nucleotides 5-12 positions beyond the tracrRNA:crRNA base-pairing interaction are important for efficient Cas9 binding and/or target recognition. Similar results were observed in cleavage assays using short dsDNA as a substrate, which further indicate that the position of the cleavage site in target DNA is identical to that observed using the dual tracrRNA:crRNA as a guide (Fig. 5C and fig. S14, B and C). Finally, to establish whether the design of chimeric RNA might be universally applicable, we engineered five different chimeric guide RNAs to target a portion of the gene encoding the green-fluorescent protein (GFP) (fig. S15, A to C), and tested their efficacy against a plasmid carrying the GFP coding sequence in vitro. In all five cases, Cas9 programmed with these chimeric RNAs efficiently cleaved the plasmid at the correct target site (Fig. 5D and fig. S15D), indicating that rational design of chimeric RNAs is robust and could in principle enable targeting of any DNA sequence of interest with few constraints beyond the presence of a GG dinucleotide adjacent to the targeted sequence.

    Cas9 can be programmed using a single engineered RNA molecule combining tracrRNA and crRNA features. (А) Top: In Type II CRISPR/Cas systems, Cas9 is guided by a two-RNA structure formed by activating tracrRNA and targeting crRNA to cleave site-specifically target dsDNA (refer to fig. S1). Bottom: A chimeric RNA generated by fusing the 3′ end of crRNA to the 5′ end of tracrRNA. (B) A plasmid harboring protospacer 4 target sequence and a wild-type PAM was subjected to cleavage by Cas9 programmed with tracrRNA(4-89):crRNA-sp4 duplex or in vitro-transcribed chimeric RNAs constructed by joining the 3′ end of crRNA to the 5′ end of tracrRNA with a GAAA tetraloop. Cleavage reactions were analyzed by restriction mapping with XmnI. Sequences of chimeric RNAs A and B are shown with DNA-targeting (yellow), crRNA repeat-derived (orange) and tracrRNA-derived (light blue) sequences. (C) Protospacer 4 DNA duplex cleavage reactions were performed as in Fig. 1B. (D) Five chimeric RNAs designed to target the GFP gene were used to program Cas9 to cleave a GFP gene-containing plasmid. Plasmid cleavage reactions were performed as in Fig. 3E, except that the plasmid DNA was restriction mapped with AvrII following Cas9 cleavage.

    Выводы. In summary, we identify a DNA interference mechanism involving a dual-RNA structure that directs a Cas9 endonuclease to introduce site-specific double-stranded breaks in target DNA. The tracrRNA:crRNA-guided Cas9 protein utilizes distinct endonuclease domains, HNH and RuvC-like, to cleave the two strands in the target DNA. Target recognition by Cas9 requires both a seed sequence in the crRNA and a GG dinucleotide-containing PAM sequence adjacent to the crRNA-binding region in the DNA target. We further show that the Cas9 endonuclease can be programmed with guide RNA engineered as a single transcript to target and cleave any dsDNA sequence of interest. The system is efficient, versatile and programmable by changing the DNA target-binding sequence in the guide chimeric RNA. Zinc-Finger Nucleases (ZFNs) and Transcription-Activator Like Effector Nucleases (TALENs) have attracted considerable interest as artificial enzymes engineered to manipulate genomes (3538). We propose an alternative methodology based on RNA-programmed Cas9 that could offer considerable potential for gene targeting and genome editing applications.


    Kink-turns in RNA

    The kink-turn (usually abbreviated to k-turn) is a widespread structural motif in RNA, first noted as a repeated structural element in the large ribosomal subunit by the Steitz lab (1). It introduces a very tight kink into the axis of helical RNA. It clearly plays an important structural role in RNA, and is significant in many aspects of RNA function including translation, modification and splicing, as well as genetic regulation.

    The sequence of Kt-7, an almost canonical k-turn found in the 50S subunit of the Haloarcula marismortui ribosome.

    The standard k-turn comprises a three-nucleotide bulge flanked on its 3 side by A G and G A basepairs (N-C stem), and on its 5 side by a section of regular basepairing (C stem) (1).

    The structure of a generic k-turn. A schematic of the structure is shown on the left, and the structure of Kt-7 in the Х. марисмортуи ribosome is shown on the right.

    Kt-7 of the 23S rRNA of the Х. марисмортуи ribosome is close to the consensus sequence for k-turns. The structure introduces a pronounced kink in the RNA (from whence its name), with an included angle between the axes of

    50 . The minor grooves of the two helices are juxtaposed, and the conformation is stabilized by interactions between the stacked adenosines of the A G basepairs and the C stem, and by stacking of the 5 and central bases of the bulge on the ends of the C and N-C stems respectively.

    The two A G basepairs at the center of the k-turn. The A G pairs of Kt-7 are shown in the molecular graphics.

    The A G basepairs are highly conserved. Both are trans sugar edge (G) to Hoogsteen edge (A) pairs, linked by potential hydrogen bonds G-N2 to A-N7 and A-N6 to G-N3. The 1b 1n pair is strongly buckled, while the bases of the 2n 2b pair are much closer to coplanarity. In some k-turns, the A-N6 to G-N3 hydrogen bond is not formed in the 2b 2n pair (see below). In the folded structure the minor groove edges of the two A G pairs are juxtaposed with the minor groove of the opposing C helix to participate in A-minor interactions (2). The structural principles of k-turn geometry have been analyzed using isostericity matrices (3).

    Many k-turns are bound by proteins in their natural state, at least some of which stabilize the kinked geometry. This is discussed further below.

    A general nucleotide numbering system for k-turns

    We have devised a universal nomenclature for the nucleotide positions in k-turns (4), thus avoiding the confusion that could arise from the many different numbering systems used in various crystal structures.

    A systematic nomenclature for the nucleotides of a k-turn.

    In this system, the unpaired bulge nucleotides are labelled Lj, where the index j is numbered sequentially from the 5 side. Unpaired nucleotides on the opposite strand (found in a small fraction of k-turns) are designated Lnj, with j increasing 5 to 3 . For all the remaining nucleotides, the two strands are differentiated by the suffix of b for the бulge-containing strand or n for the пon-bulged strand. The nucleotides of the non-canonical stem are positively numbered from the first G A mismatch in the 5 to 3 direction relative to the bulged strand, while those of the canonical stem are negatively numbered in the 3 to 5 direction. The numbering system can accommodate loops of different sizes.

    Where are k-turns found ?

    Some k-turns have been identified unequivocally, from their structure на месте within crystal structures of larger RNA structures or complexes. Others are assumed by virtue of their sequence, and perhaps their homology with known k-turns in related species. The pronounced kink of the k-turn can also be observed using a variety of biophysical methods, such as FRET (5).

    The k-turn was first identified as a novel motif occurring multiple times in the ribosome (1,6,7). Further examples have been found in mRNA (8-11), and in riboswitches (12-16). They are very commonly found in C/D and H/ACA guide snoRNAs, and U3 snoRNA species (17-25). There is also a near-canonical k-turn in a stem-loop of the human U4 snRNA (26,27).

    Metal ion-induced folding of k-turns

    In order to adopt the tightly-kinked geometry, k-turn motifs require the presence of metal ions (5,27,28), or the binding of proteins (29). In the absence of either of these factors the RNA adopts a conformation that is more extended, like that of any three-nucleotide bulge in a duplex (30). The kinked conformation can be stabilized by addition of either divalent or monovalent metal ions (5), and folding can be treated as a two-state process.

    Ion-induced folding of Kt-7 observed by the increase in fluorescence resonance energy transfer between terminally-attached fluorophores that become closer when the RNA adopts the kink turn conformation.

    Folding is induced by micromolar concentrations of divalent ions, or millimolar concentrations of monovalent ions. For example, FRET analysis reveals that the folding of Kt-7 is achieved with a [Mg 2+ ]1/2 = 80 M, and a [Na + ]1/2 = 30 mM (4).

    There is no evidence for site-specific binding of metal ions to k-turns. It is likely that electrostatic interactions must be screened to allow the folded structure to achieve stability, and this is achieved by an ion atmosphere of loosely bound metal ions.

    This suggests a dynamic character for k-turn structures, where they sample both the kinked and a more extended geometry, consistent with fluorescent lifetime measurements (31). Computer modelling studies have suggested that k-turns undergo hinge-like motions on a fast timescale (32-34).

    Protein binding by k-turn RNA

    The majority of k-turns are known to bind one or more proteins. A few are not, including that found in the SAM riboswitch (12), although it remains possible that in the cellular environment even that too is bound by proteins.

    The archetypal k-turn binding protein is the ribosomal L7Ae and related proteins. These form a family of RNA-binding proteins including the eukaryotic and archaeal proteins L7Ae, L30e and S12e (35), the yeast Nhp2 and Snu13p proteins, and the human 15.5 kDa protein (36). Each of these proteins binds k-turn motifs in RNA, and some functional substitutions are tolerated (21). The assembly of the RNA methylation (box C/D) and pseudouridylation (box H/ACA) nucleoproteins are initiated by the binding of L7Ae-type proteins to k-turns contained within the guide RNA (37,38). The 15.5 kDa protein binds a k-turn of the U4 stem-loop in the U4-U6.U5 tri-snRNP (36). Crystal structures are available for the complexes of Археоглобус фулгидус L7Ae and box C/D RNA (22), Methanococcus jannaschii L7Ae and box H/ACA RNA (23) and the human 15.5 kDa protein and the U4 snRNA (26). In each case, the k-turn adopts the tightly-kinked conformation in the complex with the protein.

    Crystal structure of the L7Ae protein complexed with the box C/D k-turn (22).

    Even in the absence of added metal ions, the kinked conformation is induced by the binding of the protein. Moreover, the binding occurs with extremely high affinity. We have measured a dissociation constant of Kd = 10 pM for Archeoglobus fulgidus L7Ae binding to Kt-7 (39).

    The binding of L7Ae to Kt-7 observed by FRET. The k-turn becomes folded into the kinked geometry on binding L7Ae, and thus adopting the structure that exhibits high FRET efficiency. Thus the position of equilibrium can be followed in this manner. The data are fitted to a two-state model. However, the binding is so tight that only an upper limit can be measured for the Kd. An accurate value was measured using kinetic measurements of association and dissociation rates (39).

    In principle it could be imagined that k-turn folding could be promoted by protein binding in one of two ways, by passive selection of the kinked structure (conformational selection), or a more active process in which the protein manipulates the RNA structure (induced fit). The former requires an equilibrium between extended and folded k-turn structure in solution, as indicated in our measurement of fluorescent lifetimes (40). Real-time binding single-molecule experiments provide no evidence for a more extended intermediate down to a time resolution of 16 ms, supporting the conformational selection model (41).

    Stabilization of k-turn structure by tertiary interactions

    There is a third mechanism of stabilization, arising from longer-range tertiary interactions within the RNA. The k-turn introduces an abrupt transition in helical trajectory in the RNA helix that can be an important element in building the large-scale architecture of large RNA species. This is exemplified by the SAM-I riboswitch, where a long helix (P2) is kinked by a standard k-turn to allow the terminal loop to dock into a receptor in helix P4 (12,14).

    Schematic of the secondary structure of the SAM-I riboswitch. The k-turn is colored in our conventional manner. Note the loop-receptor interaction with the terminal loop of helix P2B.

    This stabilizes the global fold of the riboswitch that creates the binding pocket for its ligand S-adenosyl methionine (SAM - shown in red above), and removal of the k-turn completely prevents SAM binding. Conversely though, the tertiary structure of the RNA stabilizes the local structure of the k-turn. We observed that a G2nA substitution prevented the k-turn from folding as an isolated duplex, yet allowed the riboswitch to retain full function indicative of unperturbed folding (42). Solving the crystal structure of the modified SAM-I riboswitch showed that the k-turn was folded completely normally, despite the presence of an A A pair at the 2b 2n position.

    Crystal structure of the SAM-I riboswitch containing a k-turn that has been modified by a G2nA substitution. A. The 3D structure of the complete riboswitch. B. The structure of the k-turn (colored) superimposed with that of the unmodified sequence (grey).

    We conclude that the free energy of the tertiary interactions in the riboswitch is coupled to the folding of the k-turn so that an intrinsically unstable k-turn can fold normally.

    Thus we see that the folded structure of the k-turn can be stabilized in three ways : 1. By neutralization of charge on addition of metal ions. 2. By the binding of proteins, including members of the L7Ae family. 3. By tertiary interactions within larger RNA species. There is likely to be an interplay between these different processes in larger RNA-protein assemblies.

    Hydrogen bonding interactions that stabilize the kinked geometry

    The majority of k-turns have a G A pair at the 1b 1n position, and an A G pair at the 2b 2n position. Sequence substitution of any of the four nucleotides is usually highly detrimental to folding (5). Both are trans sugar edge (G) to Hoogsteen edge (A) pairs, linked by potential hydrogen bonds G-N2 to A-N7 and A-N6 to G-N3. We have found experimentally that all four hydrogen bonds are important to the stability of the kinked form of the RNA. But the G-N2 to A-N7 hydrogen bonds of the two G A pairs are the most critical to the stability of kinked form of Kt-7 in Mg 2+ ions, so that folding is completely prevented by G to inosine substitutions at either position (39).

    A cartoon summarizing the important hydrogen-bonding interactions involving O2 groups that stabilize the kinked geometry of the k-turn. Hydrogen bonds are indicated by the cyan arrows, with a thickness that reflects their conservation and importance in stabilizing the structure.

    In addition to the bonds linking the G A pairs, a number of critical hydrogen bonds involving O2 groups play a key role in stabilizing the kinked structure. These are summarized in the figure above. The most important are those in the core of the turn, and ribose-phosphate interactions around the bulge. These are strongly conserved in all k-turns, and critical to folding. Of these the single-most important hydrogen bond is one donated from the O2 of L1 ribose to the N1 of the A1n in the kink-proximal A G pair.

    The critical hydrogen bond formed between the O2 of L1 ribose to the N1 of the A1n.

    This is present in all known k-turn structures, and removal of the O2 from L1 completely prevents metal ion-induced folding (4). Another important hydrogen bond stabilizes the tight turn made at the loop of the k-turn. An interaction between the O2 of L3 and the профиS non-bridging O of the phosphate between L1 and L2 bridges the neck of the turn, and is observed in most k-turn crystal structures. Removal of the O2 from L3 ribose in Kt-7 led to marked impairment of ion-induced folding (4).

    Two important hydrogen bonds in the loop, seen here in Kt-7. One is donated from the O2 of L3 to the профиS non-bridging O of the phosphate between L1 and L2. The other is between the O2 of L2 and the профиS O of the L2/L3 phosphate group.

    There is a further key hydrogen bond in the A-minor interaction between the C and NC helices, from the O2' of -1n to the nucleobase of the conserved adenine 2b. However, the acceptor can be N3 or N1, and this divides most of the known k-turn structures into two structural classes (31) . This is also true for the k-turns with an A A pair at the 2b 2n position. The rotation of the adenine nucleobase required to present either N3 or N1 as acceptor affects the basepairing with the base at the 2n position. For example, where this is guanine, the G A pair is bonded by two hydrogen bonds for the N3 class however in the N1 class the A2b N6 to G2n N3 is too long to be considered hydrogen bonded.

    Examples of the N3 and N1 classes of k-turn, showing the A-minor interaction between A2b and the O2' at the -1n position, and the hydrogen bonding between A2b and G2n. The red broken line in Kt-38 indicates an N-N distance of 4.7 , too long to be bonded.

    K-turns that depart from the consensus sequence

    Some k-turns break the rules of the standard motif. We divide these into two classes :
    1. The simple k-turns. These retain the same ordering of key nucleotides with respect to the primary sequence.
    2. The complex k-turns. In these k-turns the key nucleotides do not map onto the primary sequence in a linear way.

    Some of the simple k-turns have sequence changes that alter the seemingly essential G A pairs. This is well exemplified by Kt-23 of the small ribosomal subunit, that exhibits frequent changes from the consensus in the 2n position.

    WebLogo (43) summary of Kt-23 sequences

    In Kt-23 of Термус термофильный (6), the 2n nucleotide is uridine, forming a non-Watson-Crick A U pair with A2b. Although making the same change in Kt-7 totally prevents folding from occurring, Kt-23 folds efficiently on addition of magnesium ions, and its structure in the 30S ribosomal subunit is superimposable with that of Kt-7 (44).

    Overlay of the crystal structures of Kt-7 (blue) and Kt-23 (red), showing the closely similar positions of the adenine nucleobases at the 1n and 2b positions.

    A relatively rare subset of Kt-23 sequences have adenine at the 2n position, giving a potential A A pair at the 2b 2n position. One such example is found in Thelohania solenopsae. This can be folded into the k-turn conformation by the binding of L7Ae, or by tertiary interactions in the SAM-I riboswitch (45). The crystal structure of the latter construct shows that the RNA adopts standard k-turn geometry, with the 1n and 2b adenine nucleobases directed into the C helix minor groove as normal, and preservation of the standard hydrogen bonding pattern (45). This is an N1 structure, and consequently there is no hydrogen bond between A2b N6 and A2n N3 (N-N distance 4.7 ).

    The structure of the A2b A2n pair observed in the crystal structure of T. solenopsae Kt-23 (45). The electron density is the calculated composite omit map.

    The complex k-turns exhibit more radical departure from the simple k-turns such as Х. марисмортуи Kt-7, where the key nucleotides appear to be out of order (as in T. thermophilus Kt-11), and can even pass between strands (as in Х. марисмортуи Kt-15).

    The connectivity of the nucleotides in the structures of Х. марисмортуи Kt-15, and T. thermophilus Kt-11.

    Despite the major departures of the sequences from the conventional k-turn, both form standard k-turn structures in the ribosome. We recommend naming the nucleotides according to their location in the structure, rather than their position in the linear sequence. Thus the adenine paired with G2n in Kt-15 is best termed 2b, even though it is covalently located on the non-bulged strand.

    In some species k-turns are functionally replaced by structures that are strongly kinked, yet not k-turns (if we define k-turns by the A G pairs and the juxtaposition of the N and NC helix minor grooves). Например, Б. subtilis lysine riboswitch contains a probable k-turn that introduces a kink into the structure required for the tertiary structure (13), yet in Thermatoga maritima this is replaced by a sequence that is plainly not a k-turn (40). The latter may well be a point of flexibility rather than an intrinsic kink, but it functions in a similar manner на месте. In another example, RNase P of T. maritima contains a sequence (termed a pk turn) that is kinked similarly to a k-turn (47) , but lacks the G A pairs and cross-strand hydrogen bonding. However the pk-turn and the k-turn are functionally exchangeable between the SAM-I riboswitch and RNase P (40). In the crystal structure of the group I intron ribozyme of Azoarcus, Strobel and colleagues found a sequence that they termed the reverse k-turn (48). This motif has an A A pair at the putative 1b 1n position, and bends in the opposite direction compared to conventional k-turns, so that the major grooves become juxtaposed. We feel that this should not be classified as a k-turn because it lacks all the key elements that define a k-turn.

    A role for k-turns in building complex RNA structures ?

    Kink turns could play a key role in RNA architecture and the biogenesis of large assemblies. This includes the formation of functional RNA-protein complexes such as the box C/D in guided methylation, where the first even is the binding of an L7Ae-related protein to a k-turn. On a larger scale, the ribosome has many k-turns that are bound by a variety of different proteins. The dynamic character of the k-turn should provide opportunity for RNA to explore conformational space, but once folded the tight kink can provide long-range organization of the structure in a delicate interplay between the local structure and tertiary interactions. This may provide flexibility during the assembly of the structure, with subsequent fixation by the high-affinity binding of specific proteins to k-turns.


    Благодарности

    We thank K. Makarova for assistance with the PSIBLAST search and S. Gottesman, S. Melamed, M. Raina, T. Updegrove, J. Vogel, and Z. Wroblewska for comments. Research in the M.O. lab is supported by the National Science Centre in Poland (grant no. 2014/15/B/NZ1/03330), KNOW RNA Research Centre in Poznań (grant no. 01/KNOW2/2014), and the Foundation for Polish Science (grant no. TEAM/2011-8/5), co-financed by the European Union Regional Development Fund. Research in the G.S. lab is supported by the Intramural Research Program of the Eunice Kennedy Shriver National Institute of Child Health and Human Development. Авторы объявили, что нет никаких конфликтов интересов.

    Обратите внимание: издатель не несет ответственности за содержание или функциональность любой вспомогательной информации, предоставленной авторами. Любые запросы (кроме отсутствующего контента) следует направлять соответствующему автору статьи.