Pay attention to our:

 
 
综述文章】大数据点亮生命“美好时代”  
 

2019年对于吴双(化名)而言是最难熬的一年。年初,本以为是一场普通感冒引起的咳嗽,却未曾料想到在3个月后,竟被诊断为中央型肺腺癌第四期,纵隔淋巴转移,伴远端肾上腺转移。

“拿到诊断报告的那一刻,我没有掉一滴眼泪。”说这句话的时候,吴双转头看向窗外,故意将视线避开了记者的目光,但眼角却渗透出晶莹的泪水。

吴双,41岁,是一位都市职业女性。她告诉《科学新闻》,患病后,她和家人跑遍了北京多家知名的三甲医院,尝试过靶向药物、化疗、中药等办法,但病情都没有得到缓解。“我还特地花了一万多块钱做了肿瘤基因检测,很遗憾,报告显示是没有可用药的基因突变。”

没有相应的“可用药”,又不能通过手术和放疗进行积极干预,这在临床上就意味着只能“盲”用药,即只能尝试使用临床上常用的一些药物进行治疗,再定期评价治疗效果。但通常盲用药物治疗的效果只能“听天由命”,而在医院,像吴双这样的患者是大多数。

“即便能检测到相应的基因突变,靶向药物对不同患者的疗效也并不相同。”中国工程院院士、中国医学科学院肿瘤医院主任医师孙燕表示,肿瘤的发生是多基因联合“发力”的结果,虽然通过基因检测等手段可以得到海量的数据,但现有的认识仍集中在个别基因与治疗肿瘤的关系,比如携带了致病性突变的BRCA1/2基因与乳腺癌、卵巢癌的关系,突变的EGFR基因与肺癌的关系等。“但是否还会有其他基因的参与,每个基因发挥的作用如何,我们不得而知。”

其实,孙燕的这种困惑,也正是目前肿瘤领域最让人“头疼”的难题。对此,中国科学院计算技术研究所高性能计算机研究中心主任谭光明在接受《科学新闻》采访时表示,当前,生物医学大数据的规模和产生速度远远超出了普通规模计算机的处理能力,亟需超算助力科学家从多维、立体、融合的数据中摸索出规律,从而更精确地辅助疾病的诊断和治疗。

大数据是基础战略资源

事实上,自人类基因组计划启动以来,以下一代测序技术(NGS)和质谱技术(MS)为代表的各类组学技术得到了飞速发展,再加上传统的显微镜技术、生化方法、免疫组织化学方法、生理体征检测和临床影像拍摄技术等数据源的聚集,使得海量生物医学数据正呈现指数级增长态势。

“这些生物医学大数据是国家基础战略资源也是重要资产。”中国医学科学院医学信息研究所副所长钱庆告诉《科学新闻》,生物医学大数据主要包含以下特征:一是数量大、复杂性高。例如,目前单个样本的人类基因组和转录组测序数据量分别超过了100GB和30GB。二是内容与类型丰富。不仅包括临床数据、生物组学数据,还包括医药研发与管理数据、医疗保险数据、行为与情绪数据等。三是存储分散。医学数据与信息往往存储在不同机构所创建的数据库中,具有异地、异构的特点。四是时效性强。比如医学检测时间、影像数据的时间函数、医学文献的半衰期等,均是反映相关数据时效特征的重要指标。五是私密性。生物医学数据不可避免地会涉及有关病人的姓名、年龄、病情等隐私内容。

也就是说,国家级样本库与数据中心应当承担起大数据基础建设的重要任务,建立百万级中国人群基础表型的基因组多样性数据,作为临床基因组学研究的基线。因此,对样本和数据的管理、生产、调度、处理、使用都需要相关部门的投入和规划,以保证数据的质量控制、使用效率和安全性。从长远来看,这也为未来临床研究提供了标准和对照数据,不仅能大大节省研究经费,同时也能提高研究质量。也就是说,工业化的获取、生产与管理,才能保证生物医学大数据能够作为国家基础战略资源。 生物医学大数据已经赋能临床

不可否认,即便尚未引入信息科学的大型工具,这些大数据也赋予了医生和临床科研人员更多、更细致的维度去了解疾病发生发展过程,大大拓展了医学研究的深度和广度。

截至2014年3月,美国人类基因组研究中心(NHGRI)基因组测序和全基因组关联性分析(GWAS)目录有3961条人类疾病相关的单核苷酸多态性(SNP)信息记录在案,涉及571种疾病。而到2016年9月,NHGRI-GWAS目录中的疾病相关SNP信息已经增长至24218条。


某某视觉微博 某某视觉微信
织梦模板 建站素材 织梦主机 企业网站模板 微信小程序开发 企业建站系统 易优CMS

粤123456789-1号

Copyright © 葡京娱乐 版权所有 Power by DeDe58