据最新一期《科学》杂志报道,一个国际研究团队对代表全球25个人种的64个完整人类基因组进行了测序,该数据集将更好地揭示人类的遗传多样性,帮助发现更复杂形式的遗传变异,并使针对人类疾病遗传易感性的人群特异性研究成为可能。
20年前,国际人类基因组测序联盟宣布了人类基因组参考序列初稿。该人类基因组计划耗时13年,由40多个国家的1000多名科学家共同完成。但是,该参考序列并不代表单一个体,而是一个无法准确反映人类遗传变异复杂性的人类基因综合体。
在此基础上,科学家在过去20年中开展了多个测序项目,以鉴定和分类个体与参考基因组之间的遗传差异。这些差异通常集中在小的单碱基变化上,而忽略了较大的遗传改变。新研究采用的技术聚焦于检测和表征较大的差异(称为结构变异),例如插入新的遗传物质。与较小的遗传差异相比,结构变异更可能干扰基因功能。
最新完成的功能更为全面的参考数据集,是通过结合先进的测序和作图技术获得的。新的参考数据集反映了64个人类基因组,代表了全球25个不同的人类种群。因此,新的数据集可以更好地反映不同人群的遗传差异。
该研究第一作者、德国海因里希海涅大学医学生物统计学和生物信息学研究所的彼得·艾伯特说:“有了这些新的参考数据,就可以在全球遗传变异的背景下,以前所未有的准确性研究遗传差异,这有助于对个人携带的遗传变异进行生物医学评估。”
这项研究建立在去年发表于《自然·生物技术》上的一种新方法的基础上,该方法可以准确地重建一个人基因组的两个组成部分——一个从父亲继承而来,另一个从母亲继承而来。当组装一个人的基因组时,这种方法可消除一些潜在偏差。