空间转录组学技术(如 10x Visium、Slide-seq 和 Stereo-seq)的最新进展彻底改变了对组织内基因表达模式的研究。然而,仅仅获得组织内特定物理坐标的基因表达谱不足以全面了解生物系统的复杂性。为了获得更深入的见解,必须辨别组织内每个空间点的生物学身份。
2024年4月,复旦大学脑科学研究院/脑功能与脑疾病全国重点实验室诸颖团队,在《自然通讯》(Nature Communications)上发表了题为“Pianno: a probabilistic framework automating semantic annotation for spatial transcriptomics(Pianno:为空间转录组学自动进行语义注释的概率框架) ”的研究成果(图1)。作者开发了空间转录组语义注释工具Pianno,能够为组织内的空间点自动定义结构或细胞类型,从而结合来自多个维度的信息,加强对复杂生物系统的解释。
图1. 文章标题
作者将计算机视觉中对数字图像的“语义分割”概念迁移至空间转录组数据,创新性地将标记基因的空间表达处理为伪模式图像,设计了模式检测器,为后续贝叶斯分类器提供稳健的先验分布。该分类器结合马尔可夫随机场(MRF)与空间泊松点过程(sPPP),充分利用了 sPPP 建模RNA-seq计数数据分布的能力,同时考虑了空间点的位置信息。在MRF先验模型的设计中,作者充分考虑了转录组和空间位置的局部相似性,以及点之间的整体一致性。在这项研究中,作者在来自不同空间技术平台的数据集中,展示了 Pianno 在注释不同解剖结构、病灶区域以及细胞类型空间分布方面的卓越性能。此外,作者使用Pianno替代劳动密集型人工标注程序,结合无监督聚类方法,揭示物种特异性的细胞类型空间分布,从而以大脑进化研究为例,展示了Pianno在揭示新生物学见解上能够发挥的作用。
图2. Pianno整体框架
复旦大学脑科学研究院诸颖研究员为本研究通讯作者,诸颖课题组2023届硕士周雨秋为本研究的第一作者。该研究得到国家重点研发计划“生物与信息融合(BT 与 IT 融合)”重点专项、科技创新 2030 —“脑科学与类脑研究”重大项目、国家自然科学基金、上海市科技重大专项和张江实验室等基金的资助。
论文地址:https://doi.org/10.1038/s41467-024-47152-4