一、写在前面
最近看到了一篇纯生信的《Journal of Translational Medicine》(IF=6.1),可以看到,虽然现在各期刊对纯生信的文章不是很友好,但只要有好的分析思路,纯生信依旧能发出Q1文章。骨髓增生异常综合征 (MDS) 是一种复杂的造血恶性肿瘤,其特征是骨髓 (BM) 发育不良,伴有贫血、中性粒细胞减少或血小板减少等症状。MDS 在预后方面表现出相当大的异质性,约 30% 的患者进展为急性髓系白血病 (AML)。目前可用于 MDS 的 scRNA-seq 数据集仅关注 CD34 造血祖细胞。作者认为,使用整个 BM 细胞进行 MDS 研究可能对于理解 MDS 的病理生理学提供更多信息。作者共抽取了5名MDF患者及4名健康人群的BM进行了scRNA-seq分析,其中 3 名被归类为造血功能缺陷高风险,2 名被归类为低风险。虽然没有观察到突变负荷显着增加,但高危 MDS 患者在造血干细胞和祖细胞 (HSPC) 和粒细胞-巨噬细胞祖细胞 (GMP) 之间的阶段表现出 T 细胞活化和异常骨髓生成。异常骨髓生成的转录因子分析表明,表观遗传调节因子染色质结构蛋白编码基因HMGA1在高危MDS组中高度激活,在低危MDS组中度激活。CellOracle对HMGA1的扰动模拟了小鼠谱系阴性 BM细胞中造血功能不足。通过作者新开发的MarcoPolo流程将 MDS和AML细胞投影到 BM 细胞参考上,直观地可视化了髓系白血病发展和造血层次结构异常之间的联系,表明即使队列规模达到 1,000 名患者或更多,将所有患病骨髓细胞整合到一个共同的参考图上在技术上是可行的。我们可以一起看看作者的分析思路。
1.png
二、主要内容
1、MDS患者的BM单细胞注释结果
经过scRNA-seq的基础分析(教程可参考:少走点单细胞的弯路)后,共获得分别来自5名MDS患者的69,625个细胞和来自4个健康供体的36,896个细胞,这些细胞共被分为14种细胞类型(Figure 1B)。可以清楚地观察到 5 名MDS患者中有3名的中性粒细胞原、中性粒细胞和单核细胞的产生量都显着降低。另外两名MDS患者的这些成熟髓样细胞的比例相当,但BM中的HSPC分数更高(与其银屑病病史一致)。作者将3 例成熟髓细胞水平极低的 MDS 患者分为高危 MDS 组,另外 2 名为低危 MDS 组。在MDS高危组中,中性粒细胞和单核细胞的分数显着降低,表明MDS1,2和5患者骨髓生成不足(图1C,D)。高危MDS和低危MDS组之间的髓样/淋巴比例似乎相反,表明这种血液疾病的组之间可能存在过渡阶段。
2.png
Figure 1
2、MacroPolo对BM细胞的注释揭示了MDS与AML之间的联系
本文作者的课题组开发了名为MacroPolo的pipeline,能够在3min内注释1w个细胞的BM单细胞数据,或者祖细胞、成熟细胞的髓系细胞参考图谱(图2A)。结果显示, 4 名健康供体的 HSPC、GMP 和成熟髓系细胞(单核细胞和中性粒细胞)的数量平衡,而来自高危MDS组的3名MDS患者显示出成熟髓系细胞的密度低得多(Figure 2B-F)。
3.png
Figure 2
3、造血轨迹显示高危 MDS 组的粒细胞发生异常
已有人或小鼠BM细胞的数据证明HSPC到成熟中性粒细胞和单核细胞的发育轨迹,当使用基于扩散图的算法Palantir模拟MDS细胞的拟时序时,作者观察到HSPCs和GMP细胞的伪时间状态在高风险和低风险MDS组中都发生了显着改变(图3B)。单核细胞发育看起来正常。然而,在中性粒细胞原和中性粒细胞发育过程中观察到拖延状态,这与高危MDS组中这两种细胞类型的产生减少一致。造血中公认的标志物或转录因子的表达也与预期一致:HSPC标记物CD34在两个MDS组中的表达过活化,GMP维持标志物MS4A3和MPO的表达受到抑制,包括SPI-1、CEBPD、FOS、S100A8在内的成熟中性粒细胞标志物的表达也降低,成熟单核细胞标志物 CD14 的表达似乎正常(Figure 3C)。巨核细胞-红系祖细胞 (MEP) 标记物 EGR1 的表达在 MDS 组中似乎受到抑制(Figure 3C)。这与贫血和血小板减少症普遍见于MDS患者的观点一致。在分析改变的通路时,作者还发现高风险 MDS 组具有典型的干扰素 α 和 γ 信号传导和炎症通路上调,这在低风险 MDS 组中没有观察到。
4.png
Figure3
4、染色质表观遗传调节因子 HMGA1 及其调节子在高危 MDS 患者中过度激活
为了识别MDS单细胞转录组学数据集中的关键转录或表观遗传调节因子,作者使用SCENIC(SCENIC单细胞转录因子预测|学习手册)、SCENIC-plus和Van算法对转录因子及其调节子(下游效应基因)进行了无偏的数据挖掘。作者首先对HSPCs和GMP细胞中的调节活性进行了排序。前14个调节因子的活动热图如图所示(Figure 4A)。作者发现,而 5 名 MDS 患者中有 4 名由 1 至 3 个调节因子主导,例如,在MDS1、3、4患者的HSPCs和GMP细胞中,HMGA1调节子在细胞池中占主导地位。HMGA1调控因子的等级水平也升高,而CEBPD和EGR1的等级水平降低(图4B-D)。HMGA1的表达在MDS高危组中均匀且显着地过激活,与此前报道相一致。RACK1被预测为HMGA1的下游效应子,作者也发现其在高危MDS组中的表达也上调。为了进一步验证上述分析结果作者里利用GSE24552当中包含的MDS患者CD34分选的scRNA-seq数据集,同样发现MDS组的HMGA1和RACK1表达也显着升高。另一个来自159名MDS患者和17名健康对照(GSE58831)的CD34祖细胞的批量RNA-seq数据集也支持这样的结果。HMGA1和RACK1在拟时间轴上的表达表明其对HSPC和GMP维持的作用可能至关重要。用于CellOracle对高质量BM细胞(图14G)的6个分支进行了注释,在Cebpd和Hmga1的干扰后,作者成功地模拟了异常造血(HSPC 比例较高,祖细胞比例较低),与人类的 MDS 表型类似。综上所述HMGA1及其调节子在高危MDS组中过度激活,作者认为降低HMGA1的表达或活性是未来研究中改善MDS的重要策略选择。
5.png
Figure 4
6.png
Figure S1
5、T 细胞微环境在高危 MDS 中作用
在诊断过程中,作者注意到几个克隆性造血相关基因发生了突变(见表1)。在基于SComatic的体突变检测中,未观察到显著的体细胞突变负荷(Figure 5B)。然后,作者探究了MDS患者的细胞间通讯(教程可参考:《细胞通讯》CellChat学习手册)是否发生了变化。如图所示,高危MDS组在BM环境中表现出更强的细胞通讯强度(Figure 5C),特别是在计算HSPCs和GMPs时。在对MDS组的T细胞活性进行评分时,作者观察到高危MDS组对CD8T和DNT细胞的炎症水平、耗竭活性、细胞毒性活性和免疫监视水平增加(图5D-G)。基于这些使用构成 scRNA-seq 数据集的 T 细胞的比较,作者们得出结论,高风险 MDS 组的 T 细胞比低风险 MDS 组的 T 细胞活化程度更高。
7.png
Figure5
三、最后聊聊
作者在没有补充实验的情况下利用自测数据库和来源于GEO的两个数据库中证明了,染色质动力学相关的表观遗传调节因子 HMGA1 在 MDS 造血过程中被重新编程。算是一篇纯生信的单细胞数据分析文章的良好范文,感兴趣的同学可以阅读一下原文。
Guo, X., Jin, W., Wen, Y. et al. Computing cell state discriminates the aberrant hematopoiesis and activated microenvironment in Myelodysplastic syndrome (MDS) through a single cell genomic study. J Transl Med 22, 673 (2024). https://doi.org/10.1186/s12967-024-05496-x