pg电子官网

国家生物信息中心相助开发基于深度学习模型的空间转录组精细区分率细胞注释算法STASCAN

细胞在组织和器官内的空间位置与其功效紧密相关。新兴的空间转录组技术能够在组织中原位捕获转录信息,为研究人员解析基因表达谱从而解码细胞空间漫衍、破译组织的空间结构、理解庞大的生物学功效提供了条件。

目今主流的空间转录组技术分为两种,基于成像的技术和基于高通量测序的技术。其中,基于高通量测序的技术因为拥有成熟的商业产品应用更为广泛。然而,基于高通量测序的空间转录组技术往往受限于粗粒度的区分率,其在简单捕获域中丈量多个细胞的混淆转录本,且捕获域间隙间保存大片未丈量的组织区域。同时,虽然连续丈量的空间转录组切片可用于构建三维细胞图谱以破译器官结构,但高昂的技术本钱往往只允许对一小部分连续的组织切片进行测序,从而导致了Z轴偏向受限的区分率,阻碍了三维图谱的建立。

现有的盘算要领通过反卷积等方法实现了捕获域内混淆细胞类型注释,但未对捕获域间未丈量区域细胞类型进行填补,提升的区分率有限。别的,现有要领往往只关注基因表达信息,未结合形态学信息进行细胞注释,注释准确度也有待提高。

10月22日,国家生物信息中心杨运桂团队和pg电子官网数学与系统科学研究院张世华团队相助在Genome Biology?宣布了题为STASCAN deciphers fine-resolution cell-distribution maps in spatial transcriptomics by deep learning?的研究论文,针对差别空间转录组技术、差别生物组织建立解码细胞空间精细漫衍、解析特异组织结构的新工具STASCAN。

STASCAN基于深度学习模型,整合空间转录组基因表达数据和组织学图像,实现组织切片未丈量区域细胞类型预测及丈量区域捕获域内细胞细分注释。STASCAN的焦点优势在于,它不但能以高精度进行细胞类型注释并显著增强细胞空间区分率,还可解析原始区分率下无法识别的精细组织结构,并进一步揭示详尽的细胞类型小生境,加速研究人员对发育和疾病的理解。别的,STASCAN仅基于相邻切片的组织学图像生成细胞漫衍图,从而能够构建更详细的3D细胞图谱,减少实验本钱。

STASCAN首先在公共涡虫空间数据集中进行原始区分率下的基准测试,其实现优于其他算法的精准细胞注释,且能够仅从图像预测细胞类型。STASCAN进一步于涡虫数据集中应用三个功效�?�,揭示了原始区分率下无法识别的精细组织结构、精准定位细胞混淆物的组成及其在亚区分率下的差别位置、仅基于邻近染色图像实现细胞漫衍预测,最终乐成构建超原始区分率六倍的精细细胞三维漫衍图谱。

别的,STASCAN乐成应用于来自差别空间转录组学技术的跨物种的多个数据集。STASCAN在人类肠道数据集中准确定位肠道组织差别细胞层的界限;在人类肺数据集中特异识别微米级精细结构;在人类心肌数据集中准确预测测序缺失区域中的潜在细胞漫衍,重绘人体心肌梗死组织中的空间结构变革;在小鼠胚胎脑数据集中解码细胞空间精细漫衍,精准复刻小鼠脑发育历程中组织解剖学结构。

综上所述,STASCAN提供了一种强大的工具,用于整合空间基因表达信息和组织学图像进行精细区分率细胞注释,在解码细胞空间精细漫衍息争析特异组织结构方面展现出显著优势。随着空间转录组技术的快速生长和数据的不绝积累,STASCAN将对大规�?占渥甲槭莸恼掀饰鎏峁┗∏坑辛Φ闹С�。

国家生物信息中心博士研究生吴盈为本文第一作者,pg电子官网数学与系统科学研究院张世华研究员和国家生物信息中心杨运桂研究员为本文配合通讯作者。本事情获得国家重点研发计划、国家自然科学基金等项目资助。

PG电子·(中国)官方网站

STASCAN模型框架图

论文链接

附件下载:
网站地图