Теломера
ДомДом > Блог > Теломера

Теломера

Jun 26, 2023

Nature Genetics, том 55, страницы 1390–1399 (2023 г.) Процитировать эту статью

6669 Доступов

58 Альтметрика

Подробности о метриках

Пангеномы обеспечивают доступ к точному представлению генетического разнообразия видов как с точки зрения полиморфизма последовательностей, так и с точки зрения структурных вариантов (SV). Здесь мы создали Панель эталонной сборки Saccharomyces cerevisiae (ScRAP), включающую геномы эталонного качества для 142 штаммов, представляющих филогенетическое и экологическое разнообразие видов. ScRAP включает поэтапные сборки гаплотипов для нескольких гетерозиготных диплоидных и полиплоидных изолятов. Мы идентифицировали около (около) 4800 неизбыточных SV, которые обеспечивают широкое представление о геномном разнообразии, включая динамику длины теломер и мобильных элементов. Мы обнаружили частые случаи сложных анеуплоидий, когда крупные хромосомы подвергались крупным делециям и транслокациям. Мы обнаружили, что SV могут влиять на экспрессию генов вблизи точек останова и существенно способствовать эволюции репертуара генов. Мы также обнаружили, что горизонтально приобретенные области встраиваются на концах хромосом и могут генерировать новые теломеры. В целом, ScRAP демонстрирует преимущества пангенома в понимании эволюции генома в масштабе популяции.

Секвенирование длинных считываний одной молекулы обеспечивает доступ к сборкам генома без пробелов, включая повторяющиеся хромосомные области, которые обычно остаются несобранными с помощью предыдущих технологий. Лучше всего это иллюстрируется быстрым увеличением непрерывности человеческого генома1, особенно благодаря сверхдлинным считываниям от Oxford Nanopore Technology (ONT)2. Недавно консорциум теломер-теломеры (T2T) выпустил первую полную сборку «T2T» двух хромосом человека3,4,5, за которой последовал выпуск первого генома человека без пробелов, включая новые последовательности размером почти 200 МБ6. Сложные геномы растений и классические модельные организмы также продемонстрировали улучшение непрерывности сборки благодаря давно изученным технологиям7,8,9,10,11.

Эти достижения позволили немногим видам иметь несколько смежных геномов, подобных эталонным, которые включают модельные организмы и виды антропоцентрического значения, такие как Escherichia coli12, Drosophila melanogaster10,13, Solanum lycopersicum14, Glycine max15, Oryza sativa8,16, Bombyx mori17 и люди18,19. , 20. Пекарские дрожжи Saccharomyces cerevisiae имеют в общей сложности 68 сборок длиннопрочитанного генома нереферентных штаммов21,22,23,24,25,26,27,28,29,30. Эти данные использовались для количественной оценки улучшения смежности по сравнению с данными короткого чтения25, создания полногеномных карт мобильных элементов (TE)22,24,25, характеристики субтеломерных областей29, фазовых гаплотипов и обнаружения крупных структурных вариантов (SV)22,25, 26,29,30. Однако смежность доступных сборок генома широко варьируется у S. cerevisiae, и только небольшая часть из них достигла смежности на уровне хромосом. Более того, выборка остается ограниченной: у многих клад отсутствует репрезентативный эталонный геном, а полиплоидные геномы не были включены, несмотря на их численность (11,5% изолятов)31. Наконец, поэтапное формирование гаплотипов диплоидных и полиплоидных геномов является сложной задачей, поскольку это не позволяет сделать вывод о гаплотипах и измерить гетерозиготность.

Здесь мы создали панель эталонных сборок S. cerevisiae (ScRAP), включающую сборки генома T2T для 142 изолятов, которые отбирают образцы геномного пространства вида. Качество этих геномов превышает эталонный золотой стандарт и позволяет нам точно охарактеризовать SV и сложные регионы в масштабе, который еще не был достигнут у других видов.

ScRAP включает 142 штамма, которые охватывают географическое и экологическое распространение вида, а также уровни его плоидности и гетерозиготности (рис. 1a,b и дополнительная таблица 1). Панель включает 197 ядерных и 136 сборок митохондриальных геномов, включая 100 новых секвенированных геномов, среди которых сборки с гаплотипическим разрешением доступны как для диплоидных, так и для полиплоидных геномов (таблица 1 и дополнительные таблицы 1–3). Геномные метрики показывают высокие уровни непрерывности и полноты во всех сборках (дополнительное примечание 1). ScRAP предоставляет геномы эталонного качества для всех основных филогенетических клад31,32 (рис. 1c и дополнительное примечание 2). Диплоидные сборки с разрешением гаплотипа T2T показывают, что сестринские гаплотипы (HP; гаплотип 1 (HP1) и гаплотип 2 (HP2)) всегда группировались вместе в дереве и имели один и тот же профиль примесей (рис. 1c,d). Наиболее поразительная разница наблюдалась между двумя HP штамма Wine/European MC9 (AIS), у которых длина ветви HP2 (AIS_HP2) непропорционально длиннее по сравнению со всеми другими концевыми ветвями (рис. 1c), что обусловлено хромосомой. -масштабные интрогрессии хромосом VI и VII у сильно дивергентных видов (см. Полнохромосомные интрогрессии).

50 bp, including deletions, insertions, duplications and contractions of repetitive sequences and copy-neutral rearrangements including inversions (>1 kb) and translocations (>10 kb). They originated from 4,809 nonredundant large-scale rearrangements that are shared at varying frequencies across the 141 nonreference strains (Table 1 and Supplementary Table 5). This nonredundant SV catalog covers ca. 80% of the estimated whole species structural diversity that we predicted to contain approximately 6,000 SVs (Fig. 2b and Table 1)./p>10 kb (Fig. 2f). This distribution shows two clear peaks around 300 bp and 6 kb for deletions, insertions and inversions corresponding to solo-long terminal repeats (LTRs) and full-length Ty elements. The mobility of Ty elements directly accounts for 59% of all insertions (1,571 events) and 16% of deletions through inter-LTR recombination (218 events). This unbalance is explained by the limited number of Ty elements in the reference genome that can be interpreted as a deletion when absent from other genomes. Interestingly, 19% and 8% of all duplications and contractions (representing 74 and seven cases, respectively), also resulted from tandem Ty movements. Altogether 39% of all SVs result from the insertion and deletion of Ty elements./p>50 bp) per genome, which represents an average density of 1 SV every 50 kb. By comparison, each human genome would contain >20,000 SVs46, which corresponds to approximately 1 SV/150 kb, that is, three times lower than in S. cerevisiae. In other eukaryotes that benefit from pangenome data, the SV density scales from 1 SV/90 kb in Drosophila47 (likely underestimated because only >100 bp euchromatic SVs were considered), 1 SV/38 kb in soybean15, 1 SV/17 kb in rice8 and up to 1 SV/4 kb in silkworm17. We also found a clear positive correlation between the numbers of SVs and SNVs/indels accumulating within genomes. It has been proposed that a genomic clock would coordinate the pace of fixation between amino acid substitutions and large-scale rearrangements in bacteria and yeast48,49. However, this clock seems to tick at a different pace depending on the ploidy and zygosity levels of the genome. SVs preferentially accumulate in heterozygous and higher ploidy genomes (Fig. 2c). One possibility would be that SVs are better tolerated in higher ploidy genomes as their deleterious effects (for example, gene deletion and dosage imbalance) are more efficiently buffered. Alternatively, the rate of SV formation might increase with ploidy, as was suggested for aneuploidies37./p>100 kb (that is, a the CR does not cover region/s summing to 100 kb or more) were labeled as complex and the rest as simple/p>100 kb that are present within a strain containing an aneuploidy detected above. Label as complex aneuploidy-related and use in the less conservative estimate of complex aneuploidy count./p>