Теломера
Nature Genetics, том 55, страницы 1390–1399 (2023 г.) Процитировать эту статью
6669 Доступов
58 Альтметрика
Подробности о метриках
Пангеномы обеспечивают доступ к точному представлению генетического разнообразия видов как с точки зрения полиморфизма последовательностей, так и с точки зрения структурных вариантов (SV). Здесь мы создали Панель эталонной сборки Saccharomyces cerevisiae (ScRAP), включающую геномы эталонного качества для 142 штаммов, представляющих филогенетическое и экологическое разнообразие видов. ScRAP включает поэтапные сборки гаплотипов для нескольких гетерозиготных диплоидных и полиплоидных изолятов. Мы идентифицировали около (около) 4800 неизбыточных SV, которые обеспечивают широкое представление о геномном разнообразии, включая динамику длины теломер и мобильных элементов. Мы обнаружили частые случаи сложных анеуплоидий, когда крупные хромосомы подвергались крупным делециям и транслокациям. Мы обнаружили, что SV могут влиять на экспрессию генов вблизи точек останова и существенно способствовать эволюции репертуара генов. Мы также обнаружили, что горизонтально приобретенные области встраиваются на концах хромосом и могут генерировать новые теломеры. В целом, ScRAP демонстрирует преимущества пангенома в понимании эволюции генома в масштабе популяции.
Секвенирование длинных считываний одной молекулы обеспечивает доступ к сборкам генома без пробелов, включая повторяющиеся хромосомные области, которые обычно остаются несобранными с помощью предыдущих технологий. Лучше всего это иллюстрируется быстрым увеличением непрерывности человеческого генома1, особенно благодаря сверхдлинным считываниям от Oxford Nanopore Technology (ONT)2. Недавно консорциум теломер-теломеры (T2T) выпустил первую полную сборку «T2T» двух хромосом человека3,4,5, за которой последовал выпуск первого генома человека без пробелов, включая новые последовательности размером почти 200 МБ6. Сложные геномы растений и классические модельные организмы также продемонстрировали улучшение непрерывности сборки благодаря давно изученным технологиям7,8,9,10,11.
Эти достижения позволили немногим видам иметь несколько смежных геномов, подобных эталонным, которые включают модельные организмы и виды антропоцентрического значения, такие как Escherichia coli12, Drosophila melanogaster10,13, Solanum lycopersicum14, Glycine max15, Oryza sativa8,16, Bombyx mori17 и люди18,19. , 20. Пекарские дрожжи Saccharomyces cerevisiae имеют в общей сложности 68 сборок длиннопрочитанного генома нереферентных штаммов21,22,23,24,25,26,27,28,29,30. Эти данные использовались для количественной оценки улучшения смежности по сравнению с данными короткого чтения25, создания полногеномных карт мобильных элементов (TE)22,24,25, характеристики субтеломерных областей29, фазовых гаплотипов и обнаружения крупных структурных вариантов (SV)22,25, 26,29,30. Однако смежность доступных сборок генома широко варьируется у S. cerevisiae, и только небольшая часть из них достигла смежности на уровне хромосом. Более того, выборка остается ограниченной: у многих клад отсутствует репрезентативный эталонный геном, а полиплоидные геномы не были включены, несмотря на их численность (11,5% изолятов)31. Наконец, поэтапное формирование гаплотипов диплоидных и полиплоидных геномов является сложной задачей, поскольку это не позволяет сделать вывод о гаплотипах и измерить гетерозиготность.
Здесь мы создали панель эталонных сборок S. cerevisiae (ScRAP), включающую сборки генома T2T для 142 изолятов, которые отбирают образцы геномного пространства вида. Качество этих геномов превышает эталонный золотой стандарт и позволяет нам точно охарактеризовать SV и сложные регионы в масштабе, который еще не был достигнут у других видов.
ScRAP включает 142 штамма, которые охватывают географическое и экологическое распространение вида, а также уровни его плоидности и гетерозиготности (рис. 1a,b и дополнительная таблица 1). Панель включает 197 ядерных и 136 сборок митохондриальных геномов, включая 100 новых секвенированных геномов, среди которых сборки с гаплотипическим разрешением доступны как для диплоидных, так и для полиплоидных геномов (таблица 1 и дополнительные таблицы 1–3). Геномные метрики показывают высокие уровни непрерывности и полноты во всех сборках (дополнительное примечание 1). ScRAP предоставляет геномы эталонного качества для всех основных филогенетических клад31,32 (рис. 1c и дополнительное примечание 2). Диплоидные сборки с разрешением гаплотипа T2T показывают, что сестринские гаплотипы (HP; гаплотип 1 (HP1) и гаплотип 2 (HP2)) всегда группировались вместе в дереве и имели один и тот же профиль примесей (рис. 1c,d). Наиболее поразительная разница наблюдалась между двумя HP штамма Wine/European MC9 (AIS), у которых длина ветви HP2 (AIS_HP2) непропорционально длиннее по сравнению со всеми другими концевыми ветвями (рис. 1c), что обусловлено хромосомой. -масштабные интрогрессии хромосом VI и VII у сильно дивергентных видов (см. Полнохромосомные интрогрессии).