大数据

或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。各类海量资料的整合分析,能够帮助评估现状,预测趋势。

新功能、新界面、新体验,扫描即可下载生物谷APP!
首页 » 大数据 » 昆明动物所开发出适用于高通量异质性数据算法并成功揭示泛肿瘤存在基因表达紊乱共有...

昆明动物所开发出适用于高通量异质性数据算法并成功揭示泛肿瘤存在基因表达紊乱共有模式

来源:中国科学院昆明动物研究所 2017-08-09 12:22

 

 

挖掘肿瘤大数据有助于识别和总结肿瘤发生、发展过程的分子变化规律。然而,肿瘤组织高度异质性、批次效应等因素是肿瘤数据分析的重要难题,而目前常用的转录组数据分析方法对于肿瘤离群值极度敏感,容易产生假阴性结果。针对此,中国科学院昆明动物研究所科研人员开发了一种新的不依赖均一化、非参的高维大数据分析算法(Cross-Value Association Analysis,CVAA)。基于对同一批转录组数据(1037个乳腺肿瘤和110个正常组织)的分析结果揭示:与T-Test、edgeR及DESeq等常用算法相比,CVAA在处理异质性数据时能明显地减少异常样本的影响和假阴性结果。

进一步将CVAA应用于TCGA数据库的5540个肿瘤(13种实体瘤)及正常组织的RNA-Seq转录组数据,研究人员成功鉴定到大量肿瘤显着差异表达基因,且不同肿瘤之间存在很多相似的基因转录紊乱模式。进而,针对甄别得到的新的肿瘤相关基因和生物学途径,如酒精代谢途径(ADH1B基因)、补体途径(Adipsin)等,研究人员筛选了10个未被报道的基因进行了体内外功能验证研究,结果发现其表达量变化均能显着抑制肿瘤细胞的增殖和/或迁移,且部分基因(ADH1B和NCAPH)表达量改变显着影响病人生存率和体外移植瘤的生长。因此,该项工作不但成功鉴定出大量新的肿瘤相关基因和通路,为深入理解肿瘤发生发展提供研究靶标,同时也表明CVAA算法在大批量、异质性数据分析中具有重要的应用价值。

该研究成果于近期发表在国际期刊Theranostics上,昆明动物所助理研究员李其刚、副研究员何永扞、博士生吴焕和副研究员杨翠萍为共同第一作者,研究员孔庆鹏和陈勇彬为共同通讯作者。该项目得到中科院、国家自然科学基金、云南应用基础研究和中科院青年创新促进会等的项目的支持。(生物谷Bioon.com)

温馨提示:87%用户都在生物谷APP上阅读,扫描立刻下载! 天天精彩!


...(全文约1701字)
<< 去看24小时最新(16)

相关标签

最新会议 培训班 期刊库