Nature:新方法成功构建基因活性三维图谱
来源:本站原创 2019-12-17 21:24
2019年12月17日讯/生物谷BIOON/---一种三维计算机模型(或者说算法)使得科学家们能够快速地确定哪些基因在哪些细胞中有活性,以及它们在器官中的精确位置。在一项新的研究中,德国亥姆霍兹协会马克斯-德尔布吕克分子医学中心的Nikolaus Rajewsky教授、以色列希伯来大学的Nir Friedman教授及其团队近期在Nature期刊上发表了这种新
2019年12月17日讯/生物谷BIOON/---一种三维计算机模型(或者说算法)使得科学家们能够快速地确定哪些基因在哪些细胞中有活性,以及它们在器官中的精确位置。在一项新的研究中,德国亥姆霍兹协会马克斯-德尔布吕克分子医学中心的Nikolaus Rajewsky教授、以色列希伯来大学的Nir Friedman教授及其团队近期在Nature期刊上发表了这种新的方法以及从中获得的新见解,论文标题为“Gene expression cartography”。
Rajewsky教授是一位有远见的人:他想要确切地理解在疾病进展期间人体细胞中到底发生了什么,旨在能够识别和处理最初出现的细胞变化。Rajewsky教授解释道,“这不仅要求我们破译单个细胞中的基因组活性,而且还要在器官中对它进行空间跟踪。”比如,为了准确地诊断疾病并选择最佳疗法,癌症中免疫细胞的空间排列(“微环境”)极为重要。“总的来说,我们缺乏一种在分子水平上捕捉和了解组织的(病理)生理学特性的系统方法。”
针对不同组织类型的图谱
通过Rajewsky教授、Friedman教授、哈佛大学的Mor Nitzan博士和“基因调控元件系统生物学”项目负责人Nikos Karaiskos博士之间的合作,这些研究人员成功地使用一种特殊的算法为非常不同的组织类型---哺乳动物中的肝脏和肠上皮,以及果蝇和斑马鱼的胚胎,小脑的某些部分和肾脏---中的单个细胞构建出基因表达空间图。Rajewsky教授说,“有时纯粹的理论科学足以在高级科学期刊上发表---我认为这种情况在未来会更加频繁地发生。我们需要在机器学习和人工智能上加入投入。”
Karaiskos解释道,“利用这些计算机生成的图谱,我们如今能够精确地追踪特定基因是否在组织某部分的细胞中有活性。如果没有我们开发的这种三维计算机模型,这一点是不可能实现的。我们将这种模型命名为novoSpaRc。”
空间信息在以前的研究中丢失了
直到最近几年,人们才能够大规模地高精度地确定器官或组织中的单个细胞在任何给定时间从它的基因组中获得的信息。这要归功于新的测序方法,比如多重RNA测序,它可以同时分析大量RNA分子。当基因变得活跃并表达蛋白时,RNA就在细胞中产生。Rajewsky早就意识到了单细胞测序的潜力,并在他的实验室中建立了它。
Rajewsky解释说:“但是,要让这项技术起作用,必须首先将待研究的组织分解为单个细胞。”这个过程导致有价值的信息丢失:比如,在解码特定细胞的基因活性时,它在组织中的原始位置就丢失了。因此,Rajewsky和Friedmann正在寻找一种使用单细胞测序数据来开发数学模型的方法,该数学模型可以计算整个基因组(甚至在复杂组织中)基因表达的空间模式。
Rajewsky和在柏林医学系统生物研究所开展研究工作的Robert Zinzen博士领导的团队在两年前已经取得了第一个突破。在Science期刊上,他们获得了果蝇胚胎的虚拟模型(Science, 2017, doi:10.1126/science.aan3235)。它以前所未有的空间分辨率显示了哪些基因在哪些细胞中有活性。这种基因定位是在84个标记基因的帮助下实现的:原位实验确定了这些基因在某个时间点上在卵形胚胎中的位置。这些研究人员证实他们的模型可以在活的果蝇胚胎中开展进一步的复杂原位实验。
由成千上万个拼图块和颜色组成的拼图
Karaiskos说:“不过,在这种模型中,我们逐个地重建了每个细胞的位置。这是可行的,这是因为我们只需要处理数量较少的细胞和基因。这一次,我们想知道的是,在几乎没有或没有任何以前的信息的情形下,我们是否可以重建复杂的组织。我们能够了解有关基因表达在复杂组织中是如何控制和调节的原理吗?”这种算法的基本假设是,当细胞相邻时,它们的基因活性或多或少相似。他们从相邻细胞的基因组中获得的信息要比相距较远的细胞中的更多。
为了验证这一假设,这些研究人员使用了现有的数据。对肝脏、肾脏和肠上皮而言,不存在更多的信息。他们只能够通过使用重建的组织样本来收集少量的标记基因。在一种情形下,只有两个标记基因可用。
Karaiskos在试图描述他在对这种模型进行计算的过程中面临的困难任务时,解释道,“这就像把一个巨大的拼图放在一起,上面有大量不同的颜色,可能有10000多种。如果正确地拼出了这个拼图,那么所有的颜色就会形成一个特定的形状或图案。”每个拼图块代表待研究组织中的一个细胞,每一个颜色代表一个可通过RNA分子读取的活性基因。
无论采用何种测序技术,该方法均有效
Karaiskos说:“我们如今有了一种方法,它使得我们不论使用哪种测序方法都能够在计算机中基于从单细胞测序获得的数据构建待研究组织的虚拟模型。关于单个细胞空间位置的现有信息可以输入到这种模型中,从而进一步完善它。”然后,借助于novoSpaRc,就有可能确定每个已知基因在组织中的哪些位置是有活性的,并经表达产生蛋白。
如今,Karaiskos和他的同事们也致力于使用这种模型追溯甚至预测组织或整个有机体中的某些发育过程。但是,Karaiskos承认可能存在某些与novoSpaRc算法不兼容的特定组织。他表示,这可能是一个值得期待的挑战:一个尝试解决新难题的机会!(生物谷 Bioon.com)
参考资料:
1.Mor Nitzan et al. Gene expression cartography. Nature, 2019, doi:10.1038/s41586-019-1773-3.
2.Nikos Karaiskos et al. The Drosophila embryo at single-cell transcriptome resolution. Science, 2017, doi:10.1126/science.aan3235.
3.3-D maps of gene activity
https://phys.org/news/2019-11-d-gene.html
图片来自AG N. Rajewsky Lab, MDC。
Rajewsky教授是一位有远见的人:他想要确切地理解在疾病进展期间人体细胞中到底发生了什么,旨在能够识别和处理最初出现的细胞变化。Rajewsky教授解释道,“这不仅要求我们破译单个细胞中的基因组活性,而且还要在器官中对它进行空间跟踪。”比如,为了准确地诊断疾病并选择最佳疗法,癌症中免疫细胞的空间排列(“微环境”)极为重要。“总的来说,我们缺乏一种在分子水平上捕捉和了解组织的(病理)生理学特性的系统方法。”
针对不同组织类型的图谱
通过Rajewsky教授、Friedman教授、哈佛大学的Mor Nitzan博士和“基因调控元件系统生物学”项目负责人Nikos Karaiskos博士之间的合作,这些研究人员成功地使用一种特殊的算法为非常不同的组织类型---哺乳动物中的肝脏和肠上皮,以及果蝇和斑马鱼的胚胎,小脑的某些部分和肾脏---中的单个细胞构建出基因表达空间图。Rajewsky教授说,“有时纯粹的理论科学足以在高级科学期刊上发表---我认为这种情况在未来会更加频繁地发生。我们需要在机器学习和人工智能上加入投入。”
Karaiskos解释道,“利用这些计算机生成的图谱,我们如今能够精确地追踪特定基因是否在组织某部分的细胞中有活性。如果没有我们开发的这种三维计算机模型,这一点是不可能实现的。我们将这种模型命名为novoSpaRc。”
空间信息在以前的研究中丢失了
直到最近几年,人们才能够大规模地高精度地确定器官或组织中的单个细胞在任何给定时间从它的基因组中获得的信息。这要归功于新的测序方法,比如多重RNA测序,它可以同时分析大量RNA分子。当基因变得活跃并表达蛋白时,RNA就在细胞中产生。Rajewsky早就意识到了单细胞测序的潜力,并在他的实验室中建立了它。
Rajewsky解释说:“但是,要让这项技术起作用,必须首先将待研究的组织分解为单个细胞。”这个过程导致有价值的信息丢失:比如,在解码特定细胞的基因活性时,它在组织中的原始位置就丢失了。因此,Rajewsky和Friedmann正在寻找一种使用单细胞测序数据来开发数学模型的方法,该数学模型可以计算整个基因组(甚至在复杂组织中)基因表达的空间模式。
Rajewsky和在柏林医学系统生物研究所开展研究工作的Robert Zinzen博士领导的团队在两年前已经取得了第一个突破。在Science期刊上,他们获得了果蝇胚胎的虚拟模型(Science, 2017, doi:10.1126/science.aan3235)。它以前所未有的空间分辨率显示了哪些基因在哪些细胞中有活性。这种基因定位是在84个标记基因的帮助下实现的:原位实验确定了这些基因在某个时间点上在卵形胚胎中的位置。这些研究人员证实他们的模型可以在活的果蝇胚胎中开展进一步的复杂原位实验。
由成千上万个拼图块和颜色组成的拼图
Karaiskos说:“不过,在这种模型中,我们逐个地重建了每个细胞的位置。这是可行的,这是因为我们只需要处理数量较少的细胞和基因。这一次,我们想知道的是,在几乎没有或没有任何以前的信息的情形下,我们是否可以重建复杂的组织。我们能够了解有关基因表达在复杂组织中是如何控制和调节的原理吗?”这种算法的基本假设是,当细胞相邻时,它们的基因活性或多或少相似。他们从相邻细胞的基因组中获得的信息要比相距较远的细胞中的更多。
为了验证这一假设,这些研究人员使用了现有的数据。对肝脏、肾脏和肠上皮而言,不存在更多的信息。他们只能够通过使用重建的组织样本来收集少量的标记基因。在一种情形下,只有两个标记基因可用。
Karaiskos在试图描述他在对这种模型进行计算的过程中面临的困难任务时,解释道,“这就像把一个巨大的拼图放在一起,上面有大量不同的颜色,可能有10000多种。如果正确地拼出了这个拼图,那么所有的颜色就会形成一个特定的形状或图案。”每个拼图块代表待研究组织中的一个细胞,每一个颜色代表一个可通过RNA分子读取的活性基因。
无论采用何种测序技术,该方法均有效
Karaiskos说:“我们如今有了一种方法,它使得我们不论使用哪种测序方法都能够在计算机中基于从单细胞测序获得的数据构建待研究组织的虚拟模型。关于单个细胞空间位置的现有信息可以输入到这种模型中,从而进一步完善它。”然后,借助于novoSpaRc,就有可能确定每个已知基因在组织中的哪些位置是有活性的,并经表达产生蛋白。
如今,Karaiskos和他的同事们也致力于使用这种模型追溯甚至预测组织或整个有机体中的某些发育过程。但是,Karaiskos承认可能存在某些与novoSpaRc算法不兼容的特定组织。他表示,这可能是一个值得期待的挑战:一个尝试解决新难题的机会!(生物谷 Bioon.com)
参考资料:
1.Mor Nitzan et al. Gene expression cartography. Nature, 2019, doi:10.1038/s41586-019-1773-3.
2.Nikos Karaiskos et al. The Drosophila embryo at single-cell transcriptome resolution. Science, 2017, doi:10.1126/science.aan3235.
3.3-D maps of gene activity
https://phys.org/news/2019-11-d-gene.html
版权声明 本网站所有注明“来源:生物谷”或“来源:bioon”的文字、图片和音视频资料,版权均属于生物谷网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:生物谷”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
87%用户都在用生物谷APP 随时阅读、评论、分享交流 请扫描二维码下载->