唐氏筛查:新环境下的再平衡(兼谈我对中孕期四联筛查的忧虑与思考)

作者:秋凉 | 发布日期:
再平衡

这个月我私底下干了一件不太敢告诉老板的事情——我以三联唐氏筛查的收费做了一个月四联唐氏筛查,以此计算一个月下来的经济损失可不是一笔小数目——这么做主要是为了检测质量的稳定,出于临床安全考虑,我想以老板的高瞻远瞩还是很容易理解的。这年头,像我老板这种绝不以经济利益挂帅、一切以医疗安全为重的领导实在是不可多得——当然,这也不能成为你们告密的理由,谁要是走漏了风声我跟谁急。

虽然唐氏筛查是一项非常成熟的技术,但是在切换新方法的时候我还是非常谨慎。根据上海市卫计委2015年底的文件要求,产前诊断中心应该在辖区内部署政府全额支付的中孕期四联唐氏筛查。之前我们使用的中孕期筛查方法一般都是三联筛查,部分单位也在使用二联筛查。对于我们来说,四联筛查其实算是一个新项目。

这件事情的起因可以追溯到2010年我们承担的上海市公共卫生三年行动计划,在2015年以卫计委文件的形式制定了上海市唐氏综合征干预网络实施方案,2016年新增了中孕期四联唐氏筛查收费标准,同时调整了社保支付标准。我早先作为三年行动计划课题组的主要成员参与项目,后来作为论证专家参与了方案的制定。因此,我写这篇文章的目的之一也是给自己写一个信誉背书,表明自己对这件事情的基本态度,毕竟我全程参与了这件事情。

有同行专家在私下对于我们力推中孕期四联筛查颇有微词。我想很明确地表示,四联筛查绝不是我所力推的。在当年三年行动计划的结论中(那份结题报告是我写的),我们根据筛查的可及性建议选择中孕期作为筛查覆盖的窗口——因为很多孕妇在建卡的时候已经错过了早孕筛查时间窗,作为政府项目,讲究全覆盖,必然要考虑到整个孕妇群体。在中孕期的三种常见方案中,我们认为三联筛查和四联筛查都是合理的选项,其中三联筛查成本更低,而四联筛查效率更高。当时的报告并没有给出选择四联筛查的结论。这项研究的成果至今没有撰写任何学术论文,原因是我个人认为10000例样本的数据偏少,我自己对于这项研究获得的结果持有怀疑(并不是说我们做的不好,其实这项研究的回访工作已经做得非常到位,但是实验设计的样本量偏少是客观制约。实验样本量在我接手项目的时候已经基本确定,并且根本上取决于项目预算的多少),所以其实当时我也希望有可能后续再做20000例孕妇的数据。当然这一诉求最后没有实现。

在后期的专家论证中,以四联筛查效率更高为理由推荐做四联筛查是很难反驳的。部分专家也一直在强调早孕筛查的效率更高,但是基调既然已经定在中孕筛查,所以选择四联筛查并没有太大的问题(事实上我对于早孕筛查和中孕筛查有许多可能不够成熟的看法,我个人也并不认同关于早孕血清学筛查一定优于中孕筛查的逻辑)。在三联筛查和四联筛查中,四联筛查的主要缺点是价格高。但是既然政府愿意支付更高的价格以换得更好的效率,无论怎么看都是一件为民着想的好事。

事实上在唐氏综合征干预网络方案最初的讨论会上,我还是希望政府可以把筛查方案的选择权下放给产前诊断中心,因为不同中心基于自己的经验会有不同的观点。比如有些中心建卡孕妇的孕周很小,有能力通过早孕筛查来覆盖孕妇,这种情况下早孕筛查也可以成为合理的选择。然而行政部门也有自己的苦衷,他们希望以一种统一的方法执行某项任务,方便管理与质控,而这也是这类公共卫生项目的一般逻辑。因此,中孕四联筛查是一个相对较好的折中,起码这是一种被大量文献证明的效率最高的中孕期血清学筛查方法,好于之前普遍使用的二联与三联筛查,又方便统一规划和管理。

在项目的实验室准备完成以后,早先我并没有考虑做那么长时间的“免费”筛查。由于我们的筛查样本并不少,一周就可以完成中位数的设置。然而,在预实验过程中,出现了令我担忧的问题。在我类比中孕期三联筛查和四联筛查的结果时,发现四联筛查获得的假阳性率要远低于三联筛查,临界风险值的比例也下降比较明显。

以我们在上周一个批次完成的筛查为例。筛查总数358例,依照四联筛查计算,唐氏综合征高风险孕妇18例,临界风险28例,假阳性率5.02%,临界风险与假阳性的占比总共是12.8%。依照三联筛查计算,唐氏综合征高风险孕妇24例,临界风险42例,假阳性率6.7%,假阳性与临界风险占比总共是18.4%。

一个批次的数据并没有代表性,事实上这个批次的阳性率偏高(本批次HCG MoM值的均值略高,uE3的MoM值均值略低,均在控),但是一个趋势性的问题已经在过去几周的检测中被观测到,即在采用同样截断值的情况下,中孕期四联筛查的阳性率低于三联筛查。

这其实是一个根据理论能够推得的结论。由于唐氏筛查的检出率和假阳性率是跷跷板关系,所以在评价不同方法的效率时通常采用固定一头的方法。一般我们会固定假阳性率。在SURUSS报告中,将假阳性率固定在5%,评价不同方法的检出率。

然而,在实际工作中,我们往往会固定截断值。由于截断值是一个人为定义的指标,不同方法在该截断值下所获得的假阳性率是有差异的。我们来考虑以下两句话:

  • 事实A. 在假阳性率为5%的情况下,中孕四联筛查对唐氏综合征胎儿的检出率高于中孕三联筛查。
  • 问题B. 在中孕四联筛查假阳性率为5%而中孕三联筛查假阳性率为6.7%的情况下,哪种方法的检出率更高?

请问,事实A能否为问题B给出客观的答案?

我认为是不能的。在我们完成三年行动计划的10000例案例中,如果以5%的假阳性率计算,中孕三联筛查和四联筛查获得的检出率是一致的(这一与SURUSS报告矛盾的结论是我怀疑样本总量不足的原因之一,当然我们也提出了其他假设)。然而,假设我改变截断值,以第7位唐氏综合征胎儿为水平画一条新的线,则在同样达到7/10检出率的情况下,中孕四联唐氏筛查的假阳性率会降低。在当时的报告中我已经明确表述过,实际临床工作中不可能依据这样的数据来改变截断值,所以对于这条“假阳性率降低”的结果其实需要更大的阳性样本队列来支持。

对于唐氏筛查这样一种敏感性和特异性均存在缺陷的筛查方法来说,通常要考虑两个方面的平衡:假阳性率过高带来的不必要羊膜腔穿刺风险,以及假阳性率过低带来的更多漏检风险。所以,假阳性率其实是一个动态平衡,一个关于产前诊断量和唐氏综合征检出率的平衡。很多孕妇不理解为什么自己好端端的会被划为高风险。因为唐氏综合征筛查的原理决定了如果没有那么多误判的高风险(假阳性)就必然会漏检更多唐氏综合征的胎儿。其实,唐氏筛查可以用一句话来概括:

在保持后续产前诊断量合理的情况下保证合理的唐氏综合征胎儿检出率。

理解这句话,就能理解唐氏筛查,也能理解医生的无奈。问题在于,无创DNA的出现在一定程度上打破了这一平衡。由于无创DNA对唐氏综合征的检出率几乎可以达到99%的水平,“保持后续产前诊断量合理”这一假设就变得不再成立——因为有大量孕妇在唐氏筛查高风险以后选择无创DNA而不是羊水染色体核型分析。在这种情况下,我对唐氏筛查的侧重点会更倾向于提高检出率,而不是控制假阳性率。也就是说,在无创DNA被广泛应用的新环境下,唐氏筛查需要再平衡

事实上,唐氏筛查临界风险的提出正是产前诊断领域的医生和学者对这一问题的应对之道,无非“再平衡”这个词语是我自己的发明。唐氏筛查在高风险以外再提出一个临界风险,就是为了让更多孕妇能够接受无创DNA检测,从而降低唐氏筛查带来的漏检风险。临界风险其实等同于把截断值降低到1/1000;极端情况下,如果把“临界风险”的截断值降低到无穷小,就等同于用无创DNA来替代目前的中孕期唐氏筛查方案——感谢大学数学和物理老师赋予我的极限概念。

换句话说,我们其实应该思考在无创DNA已经被广泛接受的环境下,唐氏综合征的截断值到底在哪里平衡才是合理的。我想这需要认真细致的队列研究给出科学的解释,甚至需要多个类似的队列来加以论证。然而,在方向上我相信这个平衡是向更高的检出率倾斜的。因此,在我看到三联筛查和四联筛查比较的数据以后,对于四联筛查感到了一丝忧虑,因为在截断值不变的情况下四联筛查降低了假阳性率,这似乎是走了一个逆向的再平衡。

当然,在缺乏系统回访数据的情况下,我并无法对四联筛查与三联筛查做评判。不排除这种可能:在降低了假阳性率的情况下四联筛查依然获得了与三联筛查相同的检出率,甚至检出率更高。我期待在未来两年的实践中通过组织严密的研究来获得明确的答案。但是,困扰我的问题在于,我担心最终的结论与上面的可能相反,这意味着我们用更低的假阳性率换来了更高的漏检率,而无创DNA本身又是唾手可及的检测,这对于个别家庭来说也许是不应该发生的灾难。

毫无疑问,我已经在想办法解决这一问题,这也是专业赋予我们的责任。然而一个月的观察还是能够给予我一些新的思考。说实话,我对唐氏筛查从来没有过好感——在有无创DNA的今天就更别提了,我甚至不理解在上海这种一个破房子就是千余万的城市里唐氏筛查存在的必要在哪里——但是,不得不承认,种种复杂的因素决定了唐氏筛查依然会存在,并且依然会成为大多数孕妇预防唐氏综合征的唯一选择,哪怕在上海这样的一线城市。因此,与其理想主义地叫嚣无创DNA有多好,不如脚踏实地地把唐氏筛查做好,在这一点上其实政府职能部门的眼光还是远远好于我这种不经世面的类中二者流。

两周前在深圳做大会演讲时说到大家都开始觉得NIPT是常规检测,其实并非如此。有太多细节我们并不了解,却觉得无关紧要,这是值得担心的问题。过去一年,因为无创DNA检测数量骤增,突然发现自己欠缺了很多知识,而更多临床遇到的实际问题也无法依靠阅读文献获得解答。现在想来,唐氏筛查又何尝不是如此?在我们觉得甚至唐氏筛查应该逐渐被无创DNA淘汰的时候,谁能回答我这个5% vs 6.7%的问题?

因为某些机缘巧合,我也被认为是唐氏筛查领域里的专家。然而,如果我国的专家就只有我这样的水平,恐怕连我自己都无法认同——所幸有更多老师在专业水平和视野方面要远强于我,这大概也是值得欣慰的地方——很多时候可能我们都太过执着于去论证某些“观点”,而忘记了对客观的陈述。对于唐氏筛查来说,在今天的新环境下再争执哪种方法更好已经没有太大的意义。我想做的是,通过对结果的认真观察和随访,获得一个有客观数据支持的再平衡点。也许我们需要的不是去界定一个1/270或者1/1000的截断值,而是去分析我们的数据,充分利用无创DNA和其他更先进的技术手段,赋予唐氏筛查更好的临床应用价值——既然无法消灭它,唯一的办法就是把它做得更好。