本篇文章2924字,读完约7分钟
如果我们谈一谈近30年来人类生物医学的基础研究,遗传密码的测量一定是最令人眼花缭乱的成就之一。人类世代繁衍,靠什么来实现传承?遗传信息储存在哪里?它们是什么样的?
众所周知,遗传信息储存在dna(脱氧核糖核酸)中。长的dna序列由四个碱基组成,不同的序列片段记录不同的信息。有些段落包含了制造蛋白质的信息。这些段落就是我们通常所说的基因。一套完整的人类dna序列被称为“人类基因组”,它不仅包含所有人类基因,还包含许多其他有用的信息,这些信息不是用来编码蛋白质的。Dna在每个细胞的细胞核中形成染色体,由dna释放的信息被转录产生mrna(信使核糖核酸),然后mrna被翻译成蛋白质以完成各种生物功能。这就是著名的“中心法则”。
一个人的遗传密码有多长?大约30亿个字符。如果一页印有3000个遗传密码,用a4纸装订,厚度可达100米左右,相当于30层楼高。20世纪90年代初,“人类基因组计划”正式启动,开启了人类在分子水平上了解自身遗传密码的新征程。2001年,人类基因组精细图谱及其初步分析结果发布,让我们看到了由四个符号组成的一维人类遗传密码的真面目。人类基因组研究促进了基因检测等一系列新技术的出现,也带来了基因诊断、基因治疗和靶向药物等新的医学手段。生物医学已经进入了基于基因组大数据的精确医学时代。
从分子水平理解人类生活活动
“人类基因组计划”不仅发现了各种人类基因,积累了大量的基因组数据,还积累了从基因组中转录的各种rna(核糖核酸)数据和由mrna翻译产生的各种蛋白质数据。rna的集合称为转录组,蛋白质的集合称为蛋白质组。身体的所有代谢物构成代谢组学,并且有表观遗传组。通过大数据对这些“群体”及其相互关系的研究被称为“组学大数据研究”,组学大数据的介入已成为当代生物医学发展的典型特征。
有了这些大数据,我们可以在分子水平上了解人类生长、发育和正常生理活动的本质和基础,并通过比较健康人和患者的大数据,在分子水平上找到各种疾病的病因。我们已经知道6000多种人类疾病是由各种基因突变引起的。例如,据估计大约有数千个与癌症相关的原癌基因。大数据的分析也带来了许多与疾病相关的新发现,例如,发现人类基因组中非编码蛋白序列的突变也可能导致疾病。
更多的疾病是环境(包括病原微生物)和人类基因及其产物相互作用的结果。在医学领域,由于大数据在组学中的应用,人们开始重视其他相关数据的收集和整理,共同形成了医学领域的大数据。例如,记录患者基本情况的电子病历、可穿戴设备测量的生理指标、超声、核磁共振和ct等图像数据以及各种环境大数据等。当今,人类面临的人口、健康、食品、环境、资源等重大问题都与生物医学大数据密切相关,因此研究生物医学大数据对人类健康和可持续发展具有重要意义。
带来新的诊断和治疗技术和方法
当我们知道所有人类基因在染色体上的位置、它们的序列特征、它们的表达规则和产物特征时,我们就能有效地确定各种疾病的分子机制,进而制定出合适的诊断和治疗方法。生物医学大数据研究为生物医学发展提供了前所未有的机遇,并为疾病诊断和治疗带来了许多新技术和新方法,如基因诊断、基因治疗和靶向药物。
基因诊断。随着基因组大数据的收集和分析,人们发现包括肿瘤在内的许多疾病都是由基因突变引起的。研究人员记录下遗传密码的变化并保存在数据库中,然后通过测序或基因芯片检查患者的基因是否发生了变化,从而帮助疾病的诊断,这就是所谓的基因诊断。不同的人有相同的疾病,而基因检测可能会发现他们的基因突变位点完全不同,所以他们对同一种药物有不同的反应,所以有必要根据人与人制定不同的医疗计划,而这种个性化治疗更为准确。
基因疗法。也就是说,通过基因转移技术将正常的外源基因插入到患者的合适的受体细胞中,使得由外源基因制成的产物可以被纠正或补偿由基因变异或基因表达异常引起的疾病。目前,基因治疗的目标已经逐渐从单基因遗传病扩展到恶性肿瘤、感染性疾病、心血管疾病、自身免疫性疾病、代谢性疾病等重大疾病。
靶向药物。当我们知道哪些基因序列改变会导致疾病时,我们可以通过测量局部基因序列来识别导致疾病的基因。例如,特定基因的突变会导致癌症,而这些突变的基因是肿瘤治疗的目标,即“靶向”。为这些目标设计的药物是靶向药物,并且靶向药物的治疗目标是具体和精确的。例如,赫赛汀是一种针对特定基因的乳腺癌治疗药物。
人类有望进入精确医学时代
随着基因组研究的深入和基于大数据的新方法和新技术的应用,医疗将更加精确和有效,人类有望进入精确医学时代。
精确医学是组学和医学大数据的结合。精确医学不仅使疾病的诊断更加准确,治疗更加有效,而且给医疗系统带来了更加重要和本质的变化。特别是帮助人们根据无病基因组序列的变化来预测疾病的潜在风险,从而评估和预测任何个体在其生长的任何时期的健康状况,并制定相应的干预方案,以达到健康保护的目的。因此,精密医学的长期意义在于推动医学障碍向前发展:从诊断和治疗到健康保护。当前的医疗系统以病人为中心,以疾病诊断和治疗为目标。未来,医疗系统将面向社会所有成员,监控社会成员的整个生命周期,以健康评估、健康预测和健康干预为目标,实现健康保护。
达到精确是我们的目标,但我们离这个目标还很远,还有许多巨大的挑战。例如,解释人类基因组的挑战。人类基因组中编码蛋白质的区域,即基因,只占整个基因组的一小部分,不超过3%,其余97%的dna序列统称为非编码dna。近年来,大量研究表明,人类基因组中97%的非编码序列具有重要的生物学功能,与人类疾病直接相关。到目前为止,我们对这些非编码序列以及相关的非编码基因和非编码rna的功能知之甚少。在这种情况下,很难达到精度。
另一个例子是大数据挖掘的挑战。与生物医学相关的大数据不仅数量庞大,而且是多尺度、异构和高度复杂的。这些数据像分子和细胞一样小,像器官和整体一样大,而且尺度非常不同;其中一些数据是数字和符号,如基因组数据;有些是波形,如心电图和脑电图;有的是图像,比如超声波,核磁共振,ct。同时,生命活动和疾病的发生是动态的,往往不是由一个基因决定的,而是可能涉及多个基因。因此,大数据分析还必须涉及复杂的网络。面对如此复杂的数据挖掘,人工智能技术将成为从海量复杂的生物医学大数据中获取生命活动知识的有效工具。
事实上,基因组大数据发展中的各种挑战也为原始科技创新提供了巨大的机遇。目前,只有约占人类基因组3%的编码序列被用作临床分子标记。如果挖掘出97%的非编码序列用于疾病相关的分子标记,将会增加无数新的分子标记和药物设计的目标。
精密医学是我们向往的目标,要实现它还有很长的路要走。通过不断的努力和对遗传密码的逐渐破译,人类医学将会更加精确。我期待着这一天的早日到来。
(作者是中国科学院生物物理研究所研究员,中国科学院院士)
推荐读数:
1.什么是生活:埃尔文?薛定谔,由罗莱欧和罗辽翻译;湖南科技出版社出版。
2.基因的故事——解读生命的密码:陈润生和刘苏;北京理工大学出版社出版。
3.《基因的分子生物学:沃森等待》,杨译;由科学出版社出版。
人民日报(2020年7月21日,第20版)
来源:搜狐微门户
标题:从基因组大数据到精准医学(开卷知新)
地址:http://www.shwmhw.com/shxw/12294.html