临床研究

以疾病的诊断、治疗、预后、病因为目标;以病人为对象;以群体研究为主要研究方法;以医疗机构为基地的一类医学研究的总称。通过临床研究获得治疗方法的安全性和有效性。在群体中进行药物测试,以期获得剂量、药物作用、不良反应等相关资料,从而对治疗方法进行安全性有效性评价。

新功能、新界面、新体验,扫描即可下载生物谷APP!
首页 » 临床研究 » 大数据研究推翻常规认识

大数据研究推翻常规认识

来源:生物谷 2017-05-04 11:31


(图片摘自www.pixabay.com)

2017年5月4日/生物谷BIOON/---近年来,科学创新日渐进入"大数据"时代,各种高通量的分析手段以及各类"组学"的发展,使得我们对生命科学的基本原理以及与人类健康有关的疾病发生机制方面有了更加深入的认识。针对最近一段时间以来科学家们利用"大数据"的手段产生的科学进展,我们进行简要的盘点,希望大家能够喜欢。



doi:10.1038/ng.3835



一项针对丙型肝炎病毒(HCV)和500多名HCV感染者的大数据研究有助更好地理解这种病毒如何与它的人宿主相互作用。

来自英国、瑞士、美国、加拿大、比利时和瑞典的研究人员首次开发出一种方法来分析和比较HCV的遗传组成,以及500多名HCV感染者的遗传组成。通过一起加以研究,这将让研究人员对HCV和人基因组如何与这种病毒相互作用并且改变这种病毒提供新的见解。相关研究结果于2017年4月10日在线发表在Nature Genetics期刊上,论文标题为"Genome-to-genome analysis highlights the effect of the human innate and adaptive immune systems on the hepatitis C virus"。论文通信作者为来自英国牛津大学的Ellie Barnes教授和Chris Spencer博士。

病毒性肝炎是全世界死亡和残疾的主要原因之一,2%~3%的世界人口被认为感染上HCV。在英国,据估计,有30万人感染上这种病毒。很多人并没有意识到他们感染上这种病毒,未接受治疗,从而导致肝病和肝癌。

Barnes说,"这是首次利用一项大数据研究一同探究了一种病毒和它的宿主。我们鉴定出人基因组中的两个位点,在这两个位点发生的调节着我们的免疫系统的遗传变异影响这种病毒的遗传多样性。"

"可用的新药物能够清除HCV感染,但是它们是非常昂贵的,而且当前对它们的获得是受到限制的。这些药物也比其他的药物不难么有效地治疗存在的7种HCV毒株中的一些毒株导致的感染。这突出强调了理解这种疾病的遗传基础在未来开发新的疗法中的重要性。"

"在15年内,对HCV等致病性微生物的DNA测序将变成健康医疗的一个常规的部分。这种信息能够被用来调整每名病人的疗法,从而有助确保这些病人服用最好的药物或在恰当的时间里最有可能控制这种感染或者从这种感染中康复过来。"

STOP-HCV是由英国医学研究委员会(MRC)资助的和在英国牛津大学领导下的一个全国联盟。该联盟的研究人员正在开发大的遗传数据集以便改善HCV疗法,和更好地理解HCV感染的生物学特征。

这项研究特别关注了随着时间的推移改变HCV的两个人基因位点。

人基因组的一个位点(即HLA基因,编码人白细胞抗原分子)揭示出HCV基因组中试图发生突变来逃避人免疫系统识别的那些序列。这些研究人员利用这些数据绘制出HCV基因组的这些选择性压力的图谱,从而能够被用来找出对这种病毒存活至为关键的弱点。这些弱点能够被作为开发新的疗法或疫苗的靶标。

这项研究关注的人基因组的第二个影响这种病毒的位点激活在一些人体内被关闭的一个免疫基因(编码干扰素-λ先天免疫系统中的组分)。激活这个基因的影响是改变病人血液中存在的HCV病毒数量。

对病人的DNA和HCV的DNA的大规模分析将为研究人免疫系统天然地对HCV感染作出反应的方式和这如何影响病毒进化提供机会。



doi:10.1038/srep34541



通过观察人群迁徙的卫星图片,可以帮助研究人员调查疫苗的覆盖和帮助阻止疾病的传播。最新的一项发表在《Scientific Reports》上的研究通过研究卫星图,疫苗接种记录和麻疹案例,他们认为这些数据一起,可以更快速地对疾病做出反应。

该研究的作者,宾夕法尼亚州立大学的助理教授 Nita Bharti认为,在发展中国家,诸多的因素导致了人群中的疫苗接种率不高,同时人群中疫苗接种的覆盖率是随时间动态变化的。发展中国家人群的季节性迁徙和聚会,导致了疾病传播风险的提高,这也为政府和医疗机构对相关疾病进行干预提供很好的靶标。

宾州州立的研究团队,通过收集尼日利亚首都尼亚美附近夜间灯光的卫星图片,可以了解在疾病爆发时期,夜间人群的聚集和估算出群体的人口数量,并与当时疫苗接种的数据进行比较。这种回溯性地估算可以得到疫苗接种的比例,该比例非常接近于真实的疫苗接种比例。他们还根据疫苗接种率、卫星图以及麻疹案例建立了计算机模型。该模型显示,在疾病大爆发前夕,越早地疫苗接种干预,可以更好地减少疾病爆发的程度,而与人口波动的关系不大。

研究者还认为,虽然卫星图比起手机以及社交网络而言是很陈旧的人口迁徙研究手段,但是好处是卫星图能够研究过去的数据,并且了解人群迁徙、运动的模式。远程的卫星图片,进而被赋予新的研究希望,结合未来的大数据发展趋势,很可能未来会出现根据卫星图自动化地疾病预警系统。




doi:10.2215/CJN.00730116



人总胆固醇指的是人血液中胆固醇总含量,包括结合到极低密度脂蛋白(VLDL)、低密度脂蛋白(LDL)、中密度脂蛋白(IDL)和高密度脂蛋白(HDL)等蛋白上的胆固醇,其中结合到HDL上的胆固醇被称作高密度脂蛋白胆固醇(HDL cholesterol, HDL-C)。HDL-C经常被吹捧为有助降低中风和心脏病发作风险的"好胆固醇"。结合到低密度脂蛋白的胆固醇被称作低密度脂蛋白胆固醇(LDL-C)。LDL-C被认为是"坏胆固醇",这是因为它导致能够堵塞动脉的斑块产生,使得动脉柔韧性变差。

在一项新的大规模流行病研究中,来自美国华盛顿大学圣路易斯医学院和退伍军人事务部圣路易斯医疗保健系统(Veterans Affairs St. Louis Health Care System)的研究人员发现高水平和低水平的HDL-C可能会增加一个人过早死亡的风险。相反,中间水平的HDL-C可能能够增加寿命。相关研究结果于2016年8月10日在线发表在Clinical Journal of the American Society of Nephrology期刊上,论文标题为"High Density Lipoprotein Cholesterol and the Risk of All-Cause Mortality among U.S. Veterans"。

论文通信作者、华盛顿大学医学助理教授Ziyad Al-Aly博士说,"这些发现让我们感到吃惊。人们之前认为水平升高的好胆固醇是有益的。水平增加的HDL-C和较早死亡之间存在关联性是意料之外的,而且迄今为止还没有完全弄清楚。这将需要进一步开展研究。"

胆固醇是一种在血液中发现的脂肪物质,能够让血管变窄和阻断血管,从而导致心血管疾病和中风。多年来,HDL-C一直被誉为有助于从动脉中移除形成斑块的"坏胆固醇"。

在这项研究中,研究人员从2003年10月到2004年9月研究了170万多名男性退伍军人体内的肾脏功能和HDL-C水平。此后,研究人员对对这些退伍军人进行追踪研究,一直到2013年9月为止。

肾病患者体内经常含有更低水平的HDL-C,这可能解释了他们的较早死亡风险死亡增加了;然而,在这些患者当中,水平增加的HDL-C与过早死亡之间的关联性一直是不清楚的。在当前的这项研究中,研究人员发现在参与这项研究的具有各种肾脏功能的患者当中,高水平HDL-C和低水平HDL-C与增加的死亡风险存在关联。

Al-Al说,"这些发现可能解释了旨在增加HDL-C水平的临床试验不能够改善临床结果。"

Al-Aly说,这些关于HDL-C和过早死亡的发现还未在其他加快理解胆固醇参数与临床结果之间关系的大型流行病学研究中得到报道。

他说,"然而,之前的研究总是存在局限性,这是因为在这些队列研究(cohort study)中,患者的数量相对较小,而在我们的这项新的研究中,我们采用了一种大数据方法进行分析。大数据允许更加细致入微地在整个HDL-C水平范围内研究HDL-C与死亡风险之间的关系。"

Al-Aly说,"研究数据表明HDL-C水平与死亡率之间存在一种U形曲线关系,在曲线的两端,死亡风险增加了。太低和太高水平的HDL-C与更高的死亡风险相关联。"

Al-Aly说,维持中间水平的HDL-C是否可能增加寿命将需要在未来的研究中进行进一步探究。



doi:10.1038/nmeth.3835



近日,刊登在国际杂志Nature Methods上的一项研究报告中,来自德克萨斯大学MD安德森癌症中心的研究人员开发了一种新型的计算机程序,其可以帮助有效鉴别出单一癌细胞中的DNA突变,该技术或许就可以帮助临床医生提高癌症诊断的准确率,当然也为开发新型的癌症个体化疗法提供思路。

当前的新一代测序技术可以测定数百万个细胞中的基因组,而这种名为Monovar方法的程序则可以对组织样本中的重要基因突变进行检测;Monovar技术的建立基于单细胞测序技术,单细胞测序技术不仅用于癌症研究,还用于神经生物学、微生物学及免疫学领域的研究,Monovar作为基于单细胞测序的新型技术可以对单个细胞中基因组进行全方位分析,而不是数百万个细胞。Monovar技术可以对细胞间的检测结果进行对比,并且以极高的准确率来筛选出细胞间的不同,并不像单细胞测序那样,Monovar技术可以发现非常轻微的DNA突变,比如单核苷酸多态性(SNVs),而这一技术将可有效改善特殊癌症的诊断效率及准确性。

基于系统性的分析,Monovar算法可以从多个单一细胞中提取出相关数据来寻找SNVs,并且为每一个细胞提供非常详细的遗传数据。对SNVs的准确检测对于病人的治疗和护理非常关键,因为SNVs会影响个体的患病过程以及对多种药物和疫苗的反应,这些分子突变对于开发个体化疗法起着决定性的作用。

研究者Ken Chen说道,Monovar技术可以分析大规模的数据并且处理不同的全基因组方案,因此其完全适用于多种类型的研究;利用该技术我们就可以在线检查自己,相比其它标准方法而言,Monovar技术在检测突变和遗传变异上具有更高的准确性。在利用大数据和统计学分析工具进行癌症领域研究方面这并不是第一次了,来自全世界的多个实验室都在收集大量的数据来揭示癌症发生的机制以及如何开发特异性的疗法进行治疗。

研究者希望未来可以进行更为深入的研究,基于对大量数据的分析结果来开发出多种癌症个体化疗法。



doi:10.1038/ncomms10882



刊登在Nature Communications杂志上的一篇文章中,来自圣路易斯大学的结构生物学家揭示了一个新型的数据共享"联盟"如何帮助科学家们快速分享他们的研究发现,并且从中获益。

研究者Enrico Di Cera说道,我们开发了一种新型的结构生物学数据网格,其可以帮助存储、搜索并且下载相关的结构生物学数据库,这种新型的数据存储库可以有效帮助科学家们复制早期的研究发现,并且加速后期的研究进程。而该数据库的开发将是一项革命性的进展,最终研究者们将利用众多结构生物学家们所研究的数据,从事更大规模且更加深入的研究。

X射线晶体学技术是结构生物学中的研究神器,其可以使得科学家们在原子水平的分辨率下确定蛋白质、核酸及其它小分子的结构,而理解蛋白质的结构或为阐明疾病发生的根源,以及开发新型治疗性方法提供新的思路。晶体学家们会分享他们在学术期刊上的研究发现,同时也会利用标准的数据库来进行数据的处理,这就好像蛋白数据银行一样。

这种新型的结构生物学数据网格存储库也可以利用计算集群的分布模型来支持原始实验数据的存档,而其所带来的利益包括可以快速获取原始性的实验数据来进行更深入的研究和探索等,随着数据收集过程越来越简单,以结构生物学数据网格呈现的资料文件也将会被推向主流。

当前研究中,研究人员进行了一项初步研究,对来自存储库中的数据进行分析,结果发现,该数据存储库可以有效帮助科学家们对早期实验的数据进行再处理,从而为其结果的复现提供机会,同时还可以改善当前的研究模型并且筛选出可能性的错误。最后研究者Di Cera说道,这种数据网格或将为进行高层次的结构生物学研究提供帮助,我们非常自豪可以成为这项研究的一部分,来利用大数据进行更为深入的科学研究和探索。



doi:10.1016/j.devcel.2016.01.024



在一项新的研究中,来自英国伯明翰大学、剑桥大学、利兹大学和曼彻斯特大学的研究人员通过在培养皿中重现血细胞发育的过程,鉴定出促进这一过程的关键因子。在正常条件下,有能力产生血液组织的细胞是在早期胚胎的多个发育阶段中产生的,并且最终形成造血干细胞,而造血干细胞在一生当中都会得到维持,并且每天能够制造数万亿个血细胞。相关研究结果于2016年2月25日在线发表在Developmental Cell期刊上,论文标题为"Dynamic Gene Regulatory Networks Drive Hematopoietic Specification and Differentiation"。

在这项新的研究中,通过研究早起胚胎的6个连续发育阶段,并且采用一种基于计算分析的"大数据"方法,研究人员研究了上千种基因的行为,以及调节这些基因的因子。

他们的发现揭示出之前并不为人所知的血细胞发育调节分子,从而显著地增加了人们对这一过程的了解。他们也解释了DNA中的调节元件如何一起协作促进基因表达和将一种发育阶段切换到另一种发育阶段。

这些数据也揭示了利用一种不相关的体外培养细胞产生血细胞所需的最少条件,而这种血细胞产生方法在产生用于再生医学的病人特异性血细胞中发生着至关重要的作用。为了让科学界和感兴趣的公众了解这些信息,研究人员创建了一个可以无限制地进行数据访问的网站(http://www.haemopoiesis.leeds.ac.uk/data_analysis/)。

研究人员认为加强理解促进血细胞分化的关键基因以及它们如何相互作用,将有助产生能够用来治疗血液疾病(如髓性白血病)病人的干细胞。

伯明翰大学Constanze Bonifer教授解释道,"我们通过测量基因活性、染色体结构变化以及基因的调节元件与基因本身的相互作用,收集'多组学(multi-omics)'数据,并以此研究胚胎中的细胞如何发育成血细胞。我们的研究以前所未有的细节证实了一种庞大的基因相互作用网络如何控制血细胞发育。它也展示了我们如何使用这些数据加强我们对这一过程的理解。"



doi:10.1111/acem.12876



在美国有超过一半的院内死亡都与严重感染或败血症直接相关,近日来自耶鲁大学等机构的研究者开发了一种预测模型,其可以利用当地病人的大数据,并且利用机器学习方法来帮助鉴别那些有疾病风险的患者,这种新型方法比当前的临床实践方法要好,该研究发表在国际杂志Academic Emergency Medicine上。

当前急诊医生可以利用简单的计算器或评分系统来作为临床的决策准则帮助确定哪些患者更易因院内败血症而死亡,然而这些方法常常并不能成功鉴别出高风险的病人,因为这仅仅是基于有限的信息,而这并不能够计算出数据的复杂性,其仅仅是利用不同病人群体而开发出的。

本文中,科学家开发的这种新型模型就利用了来自当地病人的电子健康记录的大量数据,这种名为"随机森林模型"的方法就可以对来自病人的数据进行处理分析并且做出一定的预测;这种新型的大数据分析方法远胜于当前的模型,而且可以潜在地在每5000份严重的败血症患者中进行分类出200-300名患者。

R. Andrew Taylor博士指出,利用机器学习技术并且结合大量的突变(超过500个突变),我们就可以开发出一种新型模型来潜在帮助更好地预测院内患者的败血症死亡率。研究人员希望后期在促进这种大数据分析模型使用的时候,同时还可以帮助对患者进行实时地监测,研究者的目的就是获取患者的数据,并且开发出新型的学习健康系统,即开发出预测性的模型来应用于改善患者的健康之中。



doi:10.1038/nchembio.1984



人类基因组测序不仅加深了人们对于机体如何运作的认识,同时也为开发疾病治疗药物提供了新的可能。而最近提出的"精准医学"概念中,一个重要特点就是发现基因突变与有效治疗方法之间的联系,目前关于开发疾病靶向治疗方法的研究越来越多,未来或将为许多患者带来获益。

在药物研发的过程中,基因表达数据是最有价值的信息之一,利用这些数据就可以进行小分子化合物筛选发现潜在药物,之后在包含基因表达数据和不同癌细胞对小分子化合物的化学敏感性数据的大数据背景下对筛选出来的潜在药物进行进一步分析,就可以帮助找到可能的药物作用机制。

在最近发表在国际学术期刊Nature Chemical Biology上的两篇文章中,研究人员利用基因表达数据与化学敏感性数据之间的关联发现了小分子化合物究竟如何与细胞发生作用。

在第一篇文章中,研究人员介绍了在他们的癌症治疗应答数据库(Cancer Therapeutics Response Portal)中添加的一项用于促进这类研究进展的新资源。该数据库是一个向科研群体开放的在线网站,能够帮助研究人员研究本底基因表达与细胞敏感性数据之间的关联。

"我们提供的资源能够帮助科研群体利用最新的化合物敏感性数据发现基因表达-化合物之间的联系。"文章作者这样说道。

目前该数据库中包含了500种作用机制已知,未知或半知的小分子。这些数据能够帮助科研人员在大约900个癌细胞系的本底基因表达谱中找到他们想要的信息,同时还可以对大约19,000个RNA转录本进行搜寻,找到与化合物敏感性有关的表达模式。最为重要的是,该资源中还有帮助发现这些关联所需要的算法,为相关研究提供了非常便捷的服务。

研究人员还对其中一些化合物进行了检测,重复证明了化合物与已知机制之间的关联,以证明这一资源的可靠性。除此之外,他们还对机制未知的一些化合物进行了检测,他们之前发现一个叫做ML239的小分子能够特异性靶向乳腺癌干细胞,但其中的机制一直不清楚。研究人员在他们的数据库中进行搜索,发现脂肪酸去饱和酶可能是这一分子的潜在靶点。

在第二篇文章中,研究人员利用类似的方法揭示了一条新的作用机制。

该研究团队首先进行了化合物筛选,寻找能够靶向携带TP53突变的癌细胞的化合物。他们在找到一个很有希望的候选化合物(DNMDP)之后,在数据库中进行了搜索期望找到该化合物发挥作用的可能机制。令他们大为意外的是,搜索结果表明他们发现的这个化合物与TP53并无关联,而与另外一个叫做PDE3A的基因表达有关。

由于DNMDP能够抑制PDE3A基因表达的蛋白,研究人员首先怀疑该化合物的癌细胞杀伤作用可能与这一抑制特性有关,但进一步的研究表明抑制PDE3A与癌细胞杀伤之间并无关联。经过分析研究人员发现DNMDP处理能够诱导PDE3A与另外一个叫做SLFN12的蛋白进行结合,而这一过程对于DNMDP发挥癌细胞杀伤作用非常关键。

这两篇文章表明,结合化合物敏感性数据和癌细胞系的基因组分析数据不仅可以找到潜在的治疗药物,还可以帮助阐释化合物作用机制,因此这或许是发现癌症治疗药物的一个新的有效方法。



DOI: 10.1371/journal.pcbi.1004518



近日,来自美国的科学家将两个开放的"组学"数据库进行了整合,得到了一个新的癌症驱动基因目录。相关研究结果发表在国际学术期刊Plos Computational Biology上。

癌症驱动基因是一类一旦发生改变就有可能促进癌症进展的基因,研究人员使用癌症突变基因与蛋白质结构数据库在病人肿瘤中发现了导致正常蛋白间相互作用发生改变的基因突变。通过这种方法,他们共发现了超过100个新的癌症驱动基因,或可帮助解释为什么由相同基因驱动的肿瘤会导致不同病人出现不同结果。

研究人员表示,这是首项基于大数据将蛋白质三位结构特征用于发现癌症驱动基因的研究,他们的分析结果发现了一些已知的癌基因,如TP53,HRAS,PI3KCA以及EGFR,表明这种方法的确可以发现一些相关癌症驱动基因,并且蛋白质相互作用位点的改变可能是癌细胞中一种常见的病理机制。

癌症的发生主要是由于DNA突变的累积所导致,直到现在,科学家们仍然将研究重点放在单个基因的改变以及可能导致癌症发生的细胞信号途径改变上。最近美国NIH鼓励科学家们分享研究数据,这才让系统性分析基因组,临床以及分子数据以更好解释和预测病人患病结果成为可能,同时也促进了预防,治疗甚至彻底治愈癌症的新药开发。

研究人员表示,他们在这项研究中提出的方法能够帮助人们发现新的癌症驱动基因,并可以提出分子层面的假设帮助解释为何相同基因驱动的肿瘤却会导致病人出现不同结果。

随着这项研究的出现,基于大数据的疾病分析将会得到越来越多的关注。





近日,来自杜克-新加坡国立大学医学院和全球远程健康平台Holmusk近日宣布了一项关于潜在的医疗保健领域大数据的合作,大数据就意味着大型的无社会组织及多样化的数据库,这些数据库并不能利用常规的方法来进行利用和管理,而在医疗保健领域,大数据及其分析可以帮助研究者们发现一些未知的信息,从而使得我们可以对疾病进行预测,进而改善患者的生活质量及花费。

这项合作旨在寻找改善糖尿病及精神健康管理的方法,研究者希望可以利用来自患者个体健康的记录、医疗记录及健康设备的信息,同时收集健康数据的传统来源,比如医学记录、理赔数据以及临床研究,这项研究将会是新一代的工具,可以为病人的治疗提供更好的见解、实时地反馈以及建议等,从而帮助医生和病人适时做出个体化的决策来改善健康和疾病的管理。

研究者David Epstein教授说道,我们很高兴可以在新加坡促进医疗IT空间,在决策制定工具的帮助下,对于医院和医生们或许就有可能采用更多以病人为中心的方法来帮助确定特殊疗法的必要性及时效性等。

目前研究者期望可以帮助开发并且评估这种新型工具是否可以在医院中应用来帮助有效改善病人的健康和医疗服务;研究者目前重点关注于健康技术的评估以及利用激励措施来影响患者的健康行为。

最后来自Holmusk的创始人和CEO表示,从银行到零售业,许多部门都已经包含了许多大数据,而我们在健康领域的大数据进化发展还处于一种初级阶段;进行更多的合作则可以帮助我们转化管理机体健康的方式;而通过将强大准确性的决策支持性工具真正用于患者和医生手中才可以使得这种技术或系统更有效地被应用,最终才能够改善患者的健康及疾病预后。(生物谷Bioon.com)

本文系生物谷原创编译整理,欢迎个人转发,网站转载请注明来源“生物谷”,商业授权请联系我们 。更多资讯请下载生物谷 app.
温馨提示:87%用户都在生物谷APP上阅读,扫描立刻下载! 天天精彩!


...(全文约16443字)
显示全文...
<< 去看24小时最新(30)

相关标签

最新会议 培训班 期刊库