打开APP

Nature Methods:药物发现的“大航海时代”!CIGS数据库或将成为新药研发的“超级加速器”

来源:生物探索 2025-08-27 09:44

从CIGS数据库中的一个意外发现出发,研究人员成功揭示了女贞苷的现代身份——一个新的、可以直接结合并抑制BRD4功能的活性分子。这个案例完美地展示了CIGS数据库作为“创新引擎”的巨大潜力。

在浩瀚的化学世界里,潜藏着无数可能改变我们命运的分子。它们有些来自古老的草药典籍,有些诞生于现代化的实验室。我们知道它们中的一些可以治愈疾病,但对绝大多数分子,我们并不清楚它们进入我们身体后,究竟对细胞说了些什么“悄悄话”,又是如何改变细胞的“想法”和“行为”的。如果我们能有一种方法,可以大规模、高效率地“窃听”细胞在受到这些化学分子刺激后的“内心独白”,那将为药物研发和生命科学研究打开一扇怎样壮丽的大门?

8月18日,《Nature Methods》的研究报道“High-throughput profiling of chemical-induced gene expression across 93,644 perturbations”,为我们带来了实现这一梦想的可能。

这项研究不仅开发了一种名为 HiMAP-seq 的新技术,更是利用它构建了一个前所未有的庞大数据库:化学诱导基因印记 (Chemical-Induced Gene Signatures, CIGS)。这个数据库记录了 13,221种化合物 在两种人类细胞系中,总共引发的 93,644次“扰动事件”。这不仅仅是一个简单的数据库,它更像是一部细胞语言的“罗塞塔石碑”,帮助我们破译化学分子与生命系统之间复杂而深刻的对话。

图片

细胞的“指纹”:为何基因表达是破案的关键线索?

在深入了解这项研究的技术细节之前,我们先来回顾一个核心概念:基因表达印记 (gene expression signatures)。我们的每一个细胞都拥有一套完整的基因组,就像一本包含了所有建筑蓝图的百科全书。但在任何特定时间,细胞并不会使用全部的蓝图,而是会有选择地“阅读”其中的某些章节,并据此制造蛋白质来执行各种生命活动。哪些基因被“开启” (上调表达),哪些基因被“关闭” (下调表达),以及它们变化的程度,共同构成了一个独特的模式。这个模式,就是所谓的基因表达印记。

可以把它想象成一个城市复杂的电网系统。当一个外部事件,比如投入一种药物分子,发生时,就如同在电网上拨动了一个开关。这个动作并不会只影响一盏灯,而是会引起连锁反应,某些工厂的电力供应甚至可能被切断。整个城市灯光明暗的整体模式,就是这次“扰动”所产生的独特“印记”。

通过解读这个“印记”,我们就能反推出这个药物分子可能做了什么。如果两种不同的药物产生了相似的“城市灯光模式”,那么它们很可能作用于相似的靶点或通路。这就是“连接图谱” (Connectivity Map, CMap) 等项目的核心思想,它们试图通过比较基因表达印记,来连接药物、基因和疾病。然而,长期以来,这类研究面临着一个巨大的挑战:规模与成本。

著名的 LINCS L1000 项目是一个里程碑,但它每次扰动主要检测不到1000个基因的表达变化。虽然这已经非常强大,但相对于人类细胞中数万个基因来说,仍像是管中窥豹。要进行更全面的分析,就需要动用全转录组测序 (RNA-sequencing),但其成本高昂,难以实现对数万乃至数十万级别的扰动进行大规模筛选。这就像我们想绘制一张详尽的世界地图,却发现我们的交通工具既昂贵又缓慢,只能一次探索一小片区域。因此,药物发现领域迫切需要一场技术革命,一种既能覆盖足够多的基因,又足够便宜和快速的方法,来绘制这张前所未有的“化学-基因扰动地图”。

“团体旅行”策略:HiMAP-seq如何实现史无前例的效率?

面对规模化的挑战,该研究交出了一份惊艳的答卷。他们开发了一种名为 HiMAP-seq (highly multiplexed and parallel sequencing) 的新技术。这个技术的核心思想,可以理解为:“团体旅行”策略。传统的基因表达检测方法,就像是组织游客“自由行”。每个游客(代表一个细胞样品)都需要单独安排交通、住宿和行程,最后单独分享旅行见闻。这种方式虽然灵活,但当游客数量成千上万时,组织者的工作量和总成本将是天文数字。

而 HiMAP-seq 则像是一位高明的导游,他给每一位即将出发的游客(同样是细胞样品)都佩戴上一个独一无二的“身份手环”(即分子条形码,barcode)。这些“手环”不仅记录了游客的身份,还与他们将要“参观的景点”(即目标基因的信使RNA, mRNA)紧密相连。完成标记后,这位导游做出了一个颠覆性的决定:他让所有游客(数以百计甚至千计的样品)一起登上同一辆大巴车(混合在同一个反应管中),进行接下来的“旅行”(后续的生化反应和测序)。当“旅行”结束,拿到所有的“旅行照片”(测序数据)时,我们不仅能看到每个“景点”的景象(基因的表达水平),还能通过每个照片上游客佩戴的“身份手环”,精确地知道这张照片是属于哪个游客的(来源于哪个原始样品)。

这种“先标记,后混合”的“团体旅行”策略,极大地压缩了成本和操作时间,使得在一次测试中同时分析成千上万个样品成为可能。这就是HiMAP-seq能够实现超高通量的核心奥秘。当然,任何一个新方法都必须经过严格的“能力认证”。研究人员用一系列坚实的数据证明了HiMAP-seq的卓越性能。首先是效率。数据显示,测序得到的片段(reads)中,高达 91.62%和92.83% 都能成功地比对回它们预设的基因靶标上。其次是准确性。研究人员设计实验检测“条码混淆” (index misassignment) 现象,发现针对MDA-MB-231和HepG2细胞特异性基因的误判率分别只有 0.022%和0.009%。这说明“导游”的身份识别系统接近完美。最后是与“金标准”的一致性。在两种细胞系中,HiMAP-seq与RNA-seq测得的基因表达变化的相关性系数(R值)分别达到了 0.85和0.90;与qPCR的相关性系数更是高达 0.94和0.95。这有力地证明了,HiMAP-seq的报告质量与昂贵方法相比毫不逊色。

解密“女贞苷”:当大数据指向一个古老草药的现代身份

拥有了一个强大的工具和海量的数据库之后,真正的挑战才刚刚开始。第一个案例,就像一出现代技术背景下的侦探故事,主角是一种来自传统中药的神秘分子——女贞苷 (ligustroflavone)。女贞苷是从中药女贞子中分离得到的,但其精确的作用机制 (Mechanism of Action, MOA) 始终是个谜。

研究人员首先在CIGS数据库中对所有化合物的基因表达印记进行了一种名为t-SNE的可视化分析。令人惊讶的一幕出现了:女贞苷这个“无名之辈”,总是和一群“赫赫有名”的分子“扎堆”出现。这群分子就是 BET抑制剂,其中最著名的代表是 JQ1。BET家族蛋白(如BRD4)是重要的表观遗传调控因子,它们的抑制剂是当前抗癌药物研发的热点。这个发现提供了一个强有力的线索:女贞苷的行为模式与已知的BRD4抑制剂JQ1高度相似。它会不会也是一个BRD4抑制剂?

为验证这个猜想,研究人员进行了一系列严谨的实验。第一步:计算机模拟。分子对接技术显示,女贞苷能完美嵌入BRD4蛋白的关键“口袋”中,结合打分 (gscore) 达到了理想的 -13.602。第二步:验证物理结合。表面等离子共振 (SPR) 技术证实,女贞苷确实能够直接与BRD4蛋白结合,测出的结合亲和力常数 (KD) 约为 24.38 μM。第三步:确认细胞内“握手”。细胞热转移实验 (CETSA) 显示,女贞苷显著增强了细胞内BRD4蛋白的热稳定性,证明了它们在真实细胞环境中的结合。第四步:检验功能影响。女贞苷处理后的细胞中,BRD4的下游靶基因(如MYC和NFKB1)的表达水平显著降低,与JQ1的效果一致。

至此,证据链形成了完美的闭环。从CIGS数据库中的一个意外发现出发,研究人员成功揭示了女贞苷的现代身份——一个新的、可以直接结合并抑制BRD4功能的活性分子。这个案例完美地展示了CIGS数据库作为“创新引擎”的巨大潜力。

寻找“免死金牌”:一种简单分子如何抵御细胞的“钢铁之殇”?

如果说第一个案例是“破案”,那么第二个案例则更像是“寻宝”。研究人员这次的目标,是寻找一种能够赋予细胞特定“状态”的分子,这种状态就是对铁死亡 (ferroptosis) 的抵抗力。铁死亡是一种由铁离子依赖性的脂质过氧化驱动的细胞死亡,与多种疾病相关。因此,找到能够抑制铁死亡的分子,具有重要的临床应用价值。

研究人员首先从一个专业数据库中,筛选出了一个由13个基因组成的“铁死亡抑制印记”。然后,他们将这个印记作为“寻宝图”,在CIGS数据库中进行搜索。搜索结果带来了惊喜:排名非常靠前的位置(前 0.0333%),他们发现了一个意想不到的“宝藏”——2,4-二羟基苯甲醛 (2,4-DIH)。这是一种结构非常简单的天然小分子,之前很少有研究关注它与铁死亡的关系。

细胞实验证实,2,4-DIH能够有效抵抗铁死亡诱导剂(如erastin和顺铂)引起的细胞死亡,并显著抑制了铁死亡的核心生化标志:活性氧、二价铁离子和脂质过氧化。在顺铂诱导的急性肾损伤小鼠模型中,2,4-DIH同样表现出色。它显著逆转了肾功能衰竭的各项指标,极大地减轻了肾脏的组织损伤,并阻止了抗铁死亡关键蛋白GPX4的耗竭。这些有力的证据表明,2,4-DIH确实是一种有效的铁死亡抑制剂,并有潜力被开发为减轻化疗肾损伤的保护性药物。

那么,2,4-DIH的靶点是什么呢?研究人员再次利用CIGS数据库,通过“回溯查询”,发现其基因表达印记与多种已知 Keap1蛋白 抑制剂的印记高度相似。Keap1是细胞内抗氧化应激通路的关键调控蛋白。最终,通过多种生物物理学技术,研究人员证实,2,4-DIH可以直接与Keap1蛋白结合,其亲和力达到了微摩尔级别 (SPR测得KD为 19.69 μM,MST测得KD为 4.82 μM)。这个案例充分展示了CIGS资源在药物发现和机制阐明中的革命性力量。

开启药物发现的“大航海时代”

这项研究的意义远不止于开发一个新方法或发现两个新机制。它更像是一位领航员,为未来药物发现和细胞生物学研究描绘了壮丽的蓝图。CIGS数据库中包含了 1,865种 来源于传统中医药 (TCM) 的化合物,为系统性地阐明这些古老智慧的分子基础提供了一个前所未有的平台。

更重要的是,研究人员将CIGS数据库通过一个交互式网站 ( https://cigs.iomicscloud.com/ ) 向全球学术界完全开放。这意味着任何研究者都可以利用这个庞大的资源去检验自己的科学假设。这种开放、共享的精神,无疑将极大地加速整个生命科学领域的创新进程。

我们正处在一个由数据驱动的科学时代。像CIGS这样高质量、大规模的扰动数据集,也将成为训练和验证人工智能 (AI) 模型的宝贵“燃料”。我们可以想象,未来的AI模型能够通过学习其中的模式,直接预测全新分子的生物活性和靶点。从倾听单个基因的微弱“耳语”,到如今能够同时捕捉成千上万个基因在数万种扰动下的集体“交响乐”,我们对生命复杂性的理解正在发生质的飞跃。HiMAP-seq和CIGS数据库,正是这场变革中的一个华彩乐章,它为我们探索广阔无垠的化学宇宙、理解细胞社会的运行法则、寻找对抗顽固疾病的新式武器,提供了一张无比珍贵的新航图。属于药物发现的“大航海时代”,或许才刚刚拉开序幕。

版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

87%用户都在用生物谷APP 随时阅读、评论、分享交流 请扫描二维码下载->