在迄今为止最大规模的研究中,研究人员发现了 850 多种可导致人类患上癌症的罕见遗传性基因突变。
一位艺术家将复古的 F1 赛车想象成带状染色体,喻指癌症基因组图谱研究在识别癌症分子驱动因素方面的重要作用。
尽管很多年前科学家们就知道了癌症家族的存在,但目前已经发现的上百个被认为会影响癌症发展的基因并不能解释癌症的广泛遗传性。
最新一期(4 月 5 日)Cell 杂志公布了泛癌症图谱(Pan-Cancer Atlas)的研究成果,这是癌症研究领域里程碑式的重要图谱。这一图谱主要包括 27 篇文章,共分为三部分,每部分由一篇 Cell 文章领头,其它文章公布在 Cancer Cell 等杂志上。
在这些成果中,研究人员公布了癌症患者体内发现和遗传的超过 850 种罕见的遗传改变,这些突变能帮助癌症发生发展,并且在多种癌症类型中很常见。这些发现有助于解释一些癌症的遗传性,而且提出了针对肿瘤组织旁边的健康组织进行测序,对于优化治疗非常重要。
“这些论文让人大开眼界,”英国 Sarah Cannon 研究所的肿瘤学家 Hendrik-Tobias Arkenau 说,“它证实了我们每天观察到的现象:遗传突变的患者需要进行合适的遗传管理。”
癌症基因组图谱(The Cancer Genome Atlas,TCGA)在 2006 年首先作为试点项目开展,任务是产生所有类型肿瘤变化的综合全景图,旨在对癌症生物学获得新的见解,可能用来开发更好的治疗方法。
在数据生成方面,该项目已经取得无可争议的成功。自其成立的近十年以来,总投资共有 3.75 亿美元,TCGA 包含了来自 16 个国家 150 多位研究人员的科学贡献,表征了来自超过 25 种不同癌症的 100,00 份肿瘤。它的 20 字节数据包括 1000 万个突变,到目前为止它们已经发表在 TCGA 研究网络的 17 种出版物上,并被数百篇论文引用。这些惊人的数字反映出项目的指数增长,通过样本收集、测序和分析技术的快速发展,这一切都成为可能。
TCGA 项目不断涌现出大量的信息。TCGA 数据已被用来寻找新的突变,定义固有的肿瘤类型,确定泛癌症的异同,揭示耐药机制和收集肿瘤进化的证据。毫无疑问,我们现在可以以前所未有的细节来研究癌症,但是我们远远还不能解释这种疾病的全貌并阐明其机制。
华盛顿大学圣路易斯分校华人癌症遗传学家丁丽(Li Ding,生物通注)及其同事分析了癌症基因组图谱的数据——包括来自 10,000 多名成年人和 33 种不同类型癌症的正常组织和肿瘤的基因组。
研究人员利用基于云计算的生物信息学方法识别出了 14.6 亿种胚系突变(Germline variant,又叫生殖细胞突变),然后确定哪些确实会导致癌症易感性。他们将范围缩小到 853 个变化(约 8% 的病例),这对于了解疾病进展具有意义。
研究小组发现的 853 个可遗传的突变中,有些并不会令人惊讶。例如,肿瘤抑制因子 BRCA1 和 BRCA2 中的种系变异与乳腺癌和卵巢癌有关联。但研究人员也表示,这些基因的罕见变化似乎也使个体易患胰腺癌。研究人员在抑癌因子中检测到许多致病性胚系变异,但他们也发现癌基因发生了改变,表达有所增加,同样也促进了癌症易感性。
“当只关注于单个癌症类型时,你可能找到的是这种或者那种癌症,但把它们放在一起,你就会发现有了一个全景的图谱,”丁丽说。
除了发现癌症类型之间的共同改变之外,该研究的另一个重要发现就是配对的肿瘤和正常基因组,以及表达数据。她说,并列比较可以帮助他们确定在肿瘤中高度表达的突变,这表明它们处于选择状态,肿瘤细胞需要它们来保持癌症进展。
“这篇论文很重要,因为它是癌症易感性突变的最大规模研究。不过这一研究结果主要基于用于(原发性肿瘤)数据分析,”纽约 Memorial Sloan Kettering 癌症中心的医学遗传学家 Liying Zhang 指出,“将这种类型的大型分析扩展到配对的肿瘤正常样本非常重要的。 。 。转移性肿瘤以及白血病和其他血液癌症,这些癌症在收集正常样本方面存在困难,“她补充说。
Arkenau 说,将这些发现转化到临床上最大的挑战在于,许多提供者缺乏将正常和肿瘤基因数据整合到实践中的培训。 “有些患者治疗不当,无法给家庭适当的建议,而且还有可能遗漏了遗传疾病或易感性家庭。”
关注癌症中胚系突变的影响仅仅是 TCGA 的 Pan-Cancer Atlas 项目的一部分,还有其它论文整合了 TCGA 数据,分析了 9000 多个肿瘤样品中的 10 条信号通路。
其次还有利用人工只能深度挖掘 TCGA 数据库中的表观遗传数据,寻找癌症干细胞相关特征,为药物开放和新的治疗方法提供新的见解。
一些 TCGA 研究人员认为,通过持续寻找新的癌症变化,可以获得更多的见解。但是,新研究强调了获得癌症测序饱和度的艰巨任务:根据背景突变率,为了检测到 1% 概率的变化,一些肿瘤类型需要超过 10,000 个样本的表征。
另外一个问题是样品的获得,这也是一个最大的财政负担,现在配合正在进行的靶向癌症疗法临床试验,可以对不同癌症阶段的基因型和表型有一个更完整的描述。重要的是,NCI 将投入资源以确保测序数据的可访问性和正确分析。
TCGA 已经提出一些解决方案。首先,研究人员正在开发更好的计算模型,希望能在遗传背景噪声中,确定相关的变化,这可能会降低数据的复杂性,但是功能性研究必须扩展到遗传学研究的维度。
例如,基因组编辑工具(如 CRISPR-Cas9)的最新进展提供了前所未有的能力,以快速、可扩展的和更具成本效益的方式,来研究遗传变异。
但是要获得有意义的见解,我们需要研究复杂和异质性生理性肿瘤环境中的遗传改变。这将需要将细胞系、类器官和患者来源的模型合并到一个流程中,从而进行高通量的遗传变异功能测试。此外,癌症基因组学和临床实践之间的更好整合,才能帮助研究人员直接鉴定表型 - 基因型。
文章来源:序说DNASpeaking
{replyUser1} 回复 {replyUser2}:{content}