点击本文中加粗蓝色字体即可一键直达新药情报库免费查阅文章里提到的药物、机构、靶点、适应症的最新研发进展。
肿瘤微环境被认为是一个复杂的细胞生态系统,包含多种细胞类型。除了癌细胞,实体肿瘤中还有大量的血管内皮细胞、成纤维细胞以及多种免疫细胞,例如肿瘤相关巨噬细胞和肿瘤浸润淋巴细胞等。研究显示,这些细胞类型的比例与多种癌症的进展密切相关。因此,准确测定肿瘤微环境中各细胞类型的比例对深入了解肿瘤的形成和发展、优化治疗策略具有重要意义。
目前,流式细胞术和单细胞RNA测序(scRNA-seq)能够直接测量肿瘤微环境中细胞的比例,但这些方法通常费用较高。为了降低成本,研究人员开发了多种基于批量RNA测序(bulk RNA-seq)数据的计算方法,例如EPIC、MuSiC、CIBERSORTx、Scaden和Kassandra等。然而,由于不同肿瘤类型中,癌细胞的基因表达谱差异显著,使用统一模型准确预测多种肿瘤中各细胞类型的比例仍具挑战。
针对此问题,中国科学院深圳先进技术研究院合成生物学研究所李雪飞副研究员团队与香港浸会大学田亮副教授团队合作,开发了一种利用深度学习和公开单细胞数据集的解卷积算法。该算法能较为精确地估算19种实体肿瘤中的16种细胞类型丰度。相关成果于11月8日在线发表于PNAS杂志。
为合成高质量的训练集,该研究整合了来自六种实体肿瘤的12个scRNA-seq数据集,提供了合成虚拟肿瘤bulk RNA-seq数据的丰富参考。通过新提出的采样方法segment sampling,虚拟肿瘤数据中包含了更多样的细胞比例组合。在此过程中,利用基因过滤和表达谱过滤提升了数据质量,专注于与不同细胞类型高度相关的基因。
在该深度神经网络(DNN)结构中,DeSide创新性地使用了两个全连接网络:pathway网络和GEP网络,分别从生物信号通路和基因表达谱提取特征。pathway网络通过引入粗颗粒度的特征,增强了输入数据的多样性。
DeSide使用sigmoid函数作为DNN输出层的激活函数,这一设计先预测非癌细胞的比例,再计算出肿瘤细胞的比例,减少了直接预测肿瘤细胞比例的误差。这种方法在同类算法中首次引入,展现了显著的创新性。
该研究显示,DeSide在预测肿瘤各种细胞类型的比例方面优于现有算法,表现出色的准确性和广泛性,尤其在未含于训练集的癌症类型中。
研究还进行了患者生存分析,探讨了DeSide在临床应用中的潜力。结果显示,通过DeSide预测的细胞比例与患者生存密切相关,可有效进行病情评估和分型。
未来,DeSide有望进一步揭示癌症中不同细胞间的关键相互作用,为临床治疗提供新的靶点。DeSide算法基于单细胞数据集与深度学习方法,提供了一种高效估算肿瘤细胞比例的方法,助力肿瘤研究和治疗策略的优化。
免责声明:新药情报内容编辑团队专注于介绍全球生物医药健康研究的最新进展,本文旨在提供信息交流,不代表任何立场或治疗方案推荐。如需专业医疗建议,请咨询正规医疗机构。