从基因组大数据到精准医学
若论近30年人类生物医学基础研究 , 遗传密码的测量必定是最耀眼的成果之一 。 人类代代繁衍 , 靠什么实现遗传?遗传信息储存在哪里?它们是什么样子?
我们知道 , 遗传信息储存在DNA(脱氧核糖核酸)里 , 长长的DNA序列由四种碱基A、G、C、T排列组成 , 不同的序列段记载不同的信息 。 有些段落含有制造蛋白质的信息 , 这些段落就是我们常说的基因 。 一整套人类DNA序列被称作“人类基因组” , 它不仅包含所有人类基因 , 还包含大量不用来编码蛋白质的其他有用信息 。 DNA在每个细胞的细胞核里组成染色体 , DNA要释放的信息先转录产生mRNA(信使核糖核酸) , mRNA再翻译制造蛋白质进而完成各种生物学功能 , 这就是著名的“中心法则” 。
一个人的遗传密码到底有多长?约30亿个字符 。 如果一页打上3000个遗传密码 , 用A4纸打印出来装订成书 , 厚度能达到约100米 , 有30多层楼那么高 。 20世纪90年代初 , “人类基因组计划”正式启动 , 开启人类在分子水平上认识自身遗传密码的新航程 。 2001年 , 人类基因组精细图谱及其初步分析结果发布 , 使我们看到由四种符号组成的一维人类遗传密码的真实面貌 。 人类基因组研究促成基因检测等一系列新技术出现 , 还带来基因诊断、基因治疗、靶向药物等医学新手段 , 生物医学进入建立在基因组大数据基础上的精准医学时代 。
在分子水平上认识人类生命活动
“人类基因组计划”不仅找到了各种人类基因 , 积累了大量基因组数据 , 还积累了由基因组转录出来的各种RNA(核糖核酸)数据 , 以及由mRNA翻译产生的各种蛋白质数据 。 RNA的集合称为转录组 , 蛋白质的集合称为蛋白质组 , 机体所有代谢产物组成代谢组 , 此外还有表观遗传组等 。 通过大数据研究这些“组”及其相互关系的工作即称“组学大数据”研究 , 组学大数据的介入成为当代生物医学发展的典型特征 。
有了这些大数据 , 就能够从分子水平上了解人体生长、发育、正常生理活动的本质和基础 , 还能够通过对健康人和病人组学大数据的比较找到各种疾病在分子水平的病因 。 我们已经知道 , 约有6000种以上的人类疾患是由各种基因突变引起的 , 比如有人估计与癌症相关的原癌基因约有上千个 。 大数据的分析还带来很多与疾病相关的新发现 , 比如发现人类基因组中不编码蛋白质的序列(非编码序列)的突变也可能导致疾病 。
更多的疾病是环境(包括致病微生物)与人类基因及其产物相互作用的结果 。 在医学领域 , 由于组学大数据的应用 , 人们也开始关心其他相关数据的搜集、整理 , 共同形成医学领域的大数据 。 比如 , 记载病人基本情况的电子病历 , 可穿戴设备测量的生理指标 , 超声、核磁、CT等影像数据以及各种环境大数据等 。 当今人类面临的人口、健康、食物、环境、资源等重大问题都同生物医学大数据密切相关 , 研究生物医学大数据对人类健康与可持续发展具有重要意义 。
为诊断治疗带来新技术新方法
当我们知道了人类全部基因在染色体上的位置、它们的序列特征及其表达规律和产物特征 , 就可以有效判定各种疾患的分子机制 , 进而发展合适的诊断和治疗手段 。 生物医学大数据研究为生物医学发展提供前所未有的机遇 , 为疾病诊断与治疗带来许多新技术、新方法 , 如基因诊断、基因治疗、靶向药物等 。
基因诊断 。 伴随基因组大数据的收集、分析 , 人们发现很多疾病包括肿瘤是基因突变造成的 , 研究人员把遗传密码的变化记录下来并保存到数据库中 , 然后通过测序或基因芯片检查病人基因是否发生了这种变化 , 以帮助疾病确诊 , 这就是基因诊断 。 不同人得了同一种疾病 , 基因检测可能会发现他们基因突变的位点完全不同 , 因此对同种药物的反应也不同 , 必须因人而异地制定医疗方案 , 这种个性化治疗更加精准 。
推荐阅读
- 金十数据|中国7月制造业交亮眼成绩单!上半年美国对华投资增长6%,好消息
- 金十数据|苹果欲向印转移6条生产线,印度手机市场混战:三星份额紧追小米
- 餐厅|大数据显示:二季度餐厅服务员求职环比上升超150%,快递员收入第一
- 美剧去哪看|状元们最后都干什么?权势巨子数据显示,3300名状元,最后只是……
- 中国天气网|哪些台风与“黑格比”相似,大数据看8月台风
- 新闻科技快报 华云数据用创新技术夯实中国信创“云基座”
- 问董秘|因为公司的发动机产品满足国六标准...,投资者提问:在公司营销数据和半年报中发现
- 天擎|海纳百川 风云际会——气象大数据云平台“天擎”
- 大数据看8月台风 哪些台风与“黑格比”相似
- 黑格比|大数据看8月台风 哪些台风与“黑格比”相似
