对于NIPT而言,胎儿浓度是十分重要的信息。美国医学遗传学与基因组学学会(ACMG)在2016年更新的NIPS声明中,对胎儿浓度与NIPS(NIPT)检测效力的讨论,建议如下:

● 对于采血孕周符合要求的受检者,如果发生了胎儿浓度低引起的无法报告结论,建议行诊断检测,不宜重新采血。
● 应为严重肥胖者提供NIPS以外的非整倍体筛查方案。
● NIPS检测报告应包含明确的胎儿浓度信息。
● 检测机构应建立并监控胎儿浓度的分析和临床有效性。
● 在报告NIPS结果时,对于“无结论(no-call)”的原因,应详细说明。
NIPT面市多年,对胎儿浓度的研究投入不少,方法也层出不穷,性能上嘛,进展是有,但是与理想依然有距离。
2017年,关永涛教授领衔的以贝叶斯算法为核心的NIPT数据分析方法,登陆美国 ACMG 会刊 《Genetics in Medicine》。这一方法建立了基于性染色体信息推断胎儿浓度作为先验,计算贝叶斯因子判定染色体异常,大幅提高检测效率的同时,也留下了一个悬而未决的问题:胎儿浓度的估算对于假定的女胎样本并不是十分理想,这不但限制了NIPT结果准确性的提高,也不便对于性染色体异常情况进行判定。
经过近两年的研究,优迅医学对于胎儿浓度计算给出了新的思路和新的方法,同样在《Genetics in Medicine》上刊出。

天才想法的诞生——前人的肩膀
如此重要的胎儿浓度,如何更精确的定量,科研人员的尝试方向紧追研究与技术发展。
1、基于Y染色体的方法
• 基于PCR定量
Lo et al. Am. J. Hum. Genet. 1998
Zimmermann et al. Clin. Chem. 2005
Lun et al. Clin. Chem. 2008
• 基于高通量测序
Chiu et al. BMJ. 2011
Hudecova, et al. PLoS One. 2014
Xu et al. Genetics in Medicine. 2017
2、基于cfDNA的特点
• 基于cffDNA长度
Chan et al. Clin. Chem. 2004
Yu et al. Proc Natl Acad Sci. 2014
• 短片段序列在基因组中不均匀分布
Kim et al. Prenat. Diagn. 2015
• 核小体定位+ 游离DNA长度
Straver, R. et al. Prenat. Diagn. 2016
3、DNA甲基化的特性
• 胎盘特异性的DNA甲基化
Chan et al. Clin. Chem. 2006
Nygren et al. Clin. Chem. 2010
• 全基因组甲基化
Lun et al. Clin. Chem. 2013
4、SNP位点的特性
• 需要母亲和父亲的基因型
Liao et al. Clin. Chem. 2011
Lo et al. Sci. Transl. Med. 2010
• 需要母亲的基因型
Jiang et al. NPJ Genom. Med. 2016
• 对选定SNP位点的靶向测序
Zhang et al. Nat Med. 2019
市面上方法这么多,英国的一组研究人员(Matthew et al., 2018),对其中一些方法进行了比较发现,基于Y染色体的方法对于男胎胎儿浓度的推断相对准确,女胎浓度的推断,各种方法,都远不及基于Y染色体进行男胎推断那么理想。
SNP分析染色体浓度的关键——杂合性
要想突破女胎难题,就得告别性染色体的思路,通过常染色体信息进行分析,才有突破的希望,优迅医学同样把关注点放在了SNP遗传特点的分析上。之前的报道,有的需要进行额外的靶向富集,有的需要较高深度的测序,兜兜转转,方法虽然在改进,但是这对于临床上作为筛查的NIPT而言,方法虽可行,但是成本上的增加,成为了向临床转化的阻碍。
在保持较低的测序深度的同时,仍然可以准确分析胎儿浓度的方法,才是NIPT需要的好方法。可是低深度测序,真的能测到足够的位点吗?
答案自然是够的,在低覆盖度的情况下,依然有相当数量的SNP被超过1条reads所覆盖。这一点可以根据每个位点处的泊松分布来进行简单推断。实际数据中也是一样的:

上表是利用千人基因组项目(1000 genomes project)的数据模拟在不同深度情况下,对SNP覆盖情况的统计。表† 是千人基因组的统计,表‡ 是少数基因频率大于0.01同时出现在1000G和gnomAD中的SNP计数。
根据上表,即使在0.2x的情况下,也有1M以上的SNP被两条以上reads覆盖,对于这些SNP位点,我们就能定义杂合性了。

SNP的杂合性为什么能推断胎儿浓度呢,我们做一个天真的假设,假设一个理想的情况,某个SNP位点上基因频率符合哈代温伯格定律,所有的测序都没有错误,那么对于任意一个,有AB两种碱基可能性的位点呢,如果A基因的概率是p,B基因出现的概率就(1-p),那么我们可以把这个位点基因类型的联合概率分布推算出来


假设胎儿浓度是h,就能写出来每种情况下,测到1个A的概率。


如果我们简单的只考虑覆盖到2reads的SNP位点的情况,每个位点有AA,AB,BB三种情况,这三种情况发生的概率可以通过上面的表格推算出来就是下面

如果我们假设p是标准随机分布的话,对于刚好测到杂合AB的这个情形,它的概率就可以计算成一个只跟h相关的函数:1/6(1+h-h²),这件事情太美好了,说明能算出来啊。

从naive 到 full
但是naive 模型说明了,这个思路走的通,所以我们把刚才过于理想的地方都修整修整。
母亲的近交系数F1加上,胎儿的近交系数F2加上,测序错误e也加上:


欲知详情,请看文献
https://www.nature.com/articles/s41436-019-0636-5
检验性能的时刻到了!
根据Matthew et al., 2018中所言,对于男胎,通过Y染色体定量是相对准确的,但是女胎样本的各种方法,都不太令人满意,因此最好的检验方式就是,用男胎性染色体定量方法做比较了。

既然对于男胎胎儿我们可以通过Y染色体实现准确的FF定量,那么我们不妨将我们的新方法与之比一比。图中是我们回顾了69个真实的男胎临床样本得到的数据,两个数据结果一致性非常棒了,R²= 0.971。偏离的两个小星星可不是我们的结果不好,反而是结果不要太好,发现了两个龙凤胎!(胎儿总浓度是男胎浓度的两倍)
准确推断胎儿浓度,结合优迅医学之前建立的贝叶斯方法(Xu et al., 2017)相比较通常使用的Z-score方法,检测效力(power)有效提高,常染色体准确定量胎儿浓度的方法,给贝叶斯因子的计算提供了可靠的先验。而贝叶斯方法,允许我们将个体化的先验信息例如孕妇年龄等情况引入对结果的判断,避免了采用基于正态分布的常规方法(z-score)在cut-off附近与实际情况拟合度不佳,对准确性的影响。

总结:
准确定量胎儿浓度对NIPT有三好
结合优迅医学的贝叶斯算法,NIPT结果更准;
准确定量胎儿浓度,可以报告浓度过低“no call”而不是报出检测效力不足的结果,避免可能的假阴性;
不依赖性染色体定量胎儿浓度,可以更准确的检出性染色体的异常。
参考文献
Dang M, Xu H, Zhang J, Wang W, Bai L, Fang N, et al. Inferring fetal fractions from read heterozygosity empowers the noninvasive prenatal screening. Genet Med. published online, doi: 10.1038/s41436-019-0636-5
Hestand, Matthew S., et al. Fetal fraction evaluation in non-invasive prenatal screening (NIPS). European Journal of Human Genetics 27.2 (2019): 198-202
Xu H, Wang S, Ma LL, Huang S, Liang L, Liu Q, et al. Informative priors on fetal fraction increase power of the noninvasivwe prenatal screen. Genet Med. 2018;20:817–824