做完单细胞内容后,大家对于目标细胞群体应该有了初步的认识,但是仍然会有很多问题值得商榷,例如:

  1. 细胞类型鉴定完之后,可能会发现对照组和处理组的细胞类型差不多,但是表型却大同小异。同样类型的细胞,为什么在不同样本中的表现差异如此之大?基因表达不同的缘故吗?那又是什么因素导致相同类型的细胞基因表达差异如此之大?
  2. 通过降维聚类,特征相似的细胞聚集在一起。基因表达相似,便代表这一群细胞行驶的功能是一样的吗?既然特征相似,为什么细胞和细胞之间,在二维平面上的分布还是有一定距离?聚类之后的细胞分布,和细胞在组织上的真实分布有什么关系?
  3. 细胞的异质性是真实存在的,而在单细胞水平下是研究是以群(cluster)为最小单元,这样分析是否合理?以群为单位,是否会掩盖或忽略掉细胞之间的关键信息?
  4. 单细胞水平下分析得到的细胞分化发育轨迹,或细胞和细胞之间的通讯联系,在空间上是否真实分布在临近区域?不同细胞之间的联系,是直接,还是间接?或者反过来,单细胞水平下分析得到的功能相似的细胞群体,在组织中的分布,一定是在同一区域吗?

这些问题,如果仅仅靠单细胞一个层面的数据,是很难解释清的。所以需要在单细胞的基础上,联合空间转录组,二者相互印证,才能获取更真实的信息。

如何设计空间转录组实验方案

目前空间转录组价格还是比较贵的,一张 slides 要几万。但是一张 slide 有 4 个捕获区域,就是可以处理 4 个冷冻切片,这里可以做的文章就大了。之前单细胞的设计,我们选取了 Control:Case = 3:3 的模式。如果所研究的病理组织信息可以集中体现在一张切片上,那么一张空间 slides 上放置 Control1+Case3,或者 Control2+Case2 都是可以的。前者处理组的切片数为 3,目的是为了更好的分析处理之后不同样本之间的异质性。后者是一种比较稳妥的方案,对照组和处理组都设置了重复,可以规避掉切片质量不均导致空间结果不好的风险。如果需要多张切片才能完整描述所研究的病理组织信息,那就得设置多张空间 slides,甚至需要一张 slides 来描述同一个组织的不同病理区域。这个时候,基于经费的考虑,可以先选择一个处理组的样本做空间转录组,拿到有意思的结果之后,可以慢慢补充其他处理组样本的空间结果。至于对照组的空间结果是否需要补充,这个后面会提及。关于单细胞联合空间转录组的样本设计,还有一个很重要的点,是否需要对同一个样本同时进行单细胞和空间?这个问题,必须在一开始就想清楚,否则会导致整个课题的失败。

我的建议是,如果条件允许,选择多个组学在同一个样本上进行,特别是针对人的病理或肿瘤样本。

所以在样本准备时候,就要将组织一分为二,一半用来做单细胞,另外一半冻存起来为空间转录组做好备份。小鼠样本组织通常都比较小,实施起来比较麻烦,可以选择一只小鼠做单细胞,另取一只小鼠做空间。小鼠模型的背景均一性较好,这样操作也可以。但是对于肿瘤样本,建议最好还是在同一个样本同时进行单细胞和空间转录组。

如何进行单细胞和空间转录组的联合分析?

一、通过单细胞细胞类型鉴定结果辅助判定空间转录组的细胞类型

空间转录组分辨率达不到单细胞水平,10x 目前一个 spot 捕获 1~10 个细胞,所以如果仅仅通过空间转录组的数据是无法精确判定每个 spot 的主要细胞类型的。
Nature Biotechnology 上发表了一个 MIA 算法,可以很好的解决空间数据冗杂的现象。
同时,结合空间转录组提供的组织水平的 HE 染色信息,也可以对单细胞鉴定到的细胞类型进行修正。

二、通过空间转录组快速定位单细胞分析获得 marker 基因

单细胞数据分析可以预测到很多 marker 基因,但是并非所有 marker 基因都能被验证出来。
一部分原因是由于分析预测的 marker 基因具有假阳性的可能,一部分原因也是由于验证过程中没有明确的观测区域导致。
单细胞测序获得的亚型,往往需要复杂的免疫荧光验证,如果有空间转录组的数据,也可以快速整合,定位单细胞测序得到的亚群在空间中的位置。

三、 对比不同分组空间结果,深入挖掘单细胞数据

常见的两种样本设计方案里,多张切片的方案中提到先做处理样本的空间转录组,毕竟大家更为关注处理之后组织类型的变化过程。
如果只做了处理样本的空间转录组的话,此时课题设计是以单细胞为主,空间为辅,文章中的讨论需要注意主次。
如果经费充足的话,建议同时补充对照组的空间转录组,对比不同类型样本之间空间信息的差异,可以深入探讨一系列的问题