当前位置:主页 > 亲子鉴定资讯 >

亲子鉴定中的统计学:99.99%是怎么算出来的?

几乎每一份亲子鉴定报告的结论部分都会写:“累积亲权指数为XXXXX,亲权概率为99.99%以上。”很多人看到这个数字,觉得“哦,很准”,但同时也有人困惑:99.99%是不是意味着还有万分之一的可能性不是亲生的?这个数字到底是怎么计算出来的?为什么是99.99%而不是100%?今天,我们就抛开复杂的数学公式,用最通俗的方式,讲一讲亲子鉴定背后的统计学原理。

一、从“似然比”说起——亲权指数的本质

1.两个对立假设
法医物证学在做亲子鉴定时,会建立两个对立的假设。
假设一(H1):被检测的男子是孩子的生物学父亲。
假设二(H2):被检测的男子不是孩子的生物学父亲,孩子的父亲是人群中某个随机的男性。
2.每个位点都能算出一个比值
在每一个STR位点上,我们可以计算:在假设H1下出现孩子这个基因型的概率,除以在假设H2下出现孩子这个基因型的概率。
比如某个位点,如果被检测男子是父亲,孩子得到他某个数字的概率是1/2;如果男子不是父亲,孩子得到这个数字的概率等于该数字在人群中的频率,比如1/10。
那么这个位点的亲权指数就是(1/2)÷(1/10)=5。意思是“在这个位点上,支持亲生的可能性是反对亲生的可能性的5倍”。
3.为什么要把所有位点乘起来?
不同位点之间是独立遗传的,互不干扰。
统计学上,多个独立证据联合起来,总的支持力度就是每个证据支持力度的乘积。
如果21个位点中,每个位点的亲权指数都大于1,乘在一起就会变成一个巨大的数字。

二、实例演示:一份报告中的数字是怎么来的?

1.一个简单的位点举例
假设某个STR位点有三种常见的重复次数:12、13、14。
孩子在这个位点的数字是12和14。
母亲的数字是12和12(纯合子)。
那么孩子必须从父亲那里得到14这个数字。父亲如果有14,就能提供;如果没有14,就不能提供。
2.计算过程
假设父亲提供的样本显示他有13和14。
在H1(亲生)下,父亲把14传给孩子的概率是1/2。
在H2(非亲生)下,随机一个男性带有14的概率,等于14这个数字在人群中的频率,假设是0.1。
那么这个位点的亲权指数=0.5÷0.1=5。
如果第二个位点算出来也是5,第三个位点算出来是8,那么三个位点乘起来就是5×5×8=200。
3.21个位点乘起来的结果
实际检测中,21个位点的亲权指数从几到几百不等,大多数位点都在10以上。
把它们全部乘起来,常见的累积亲权指数可以达到几百万、几千万甚至几十亿。
比如21个位点平均每个为10,乘起来就是10的21次方,那是一个天文数字。

三、从累积亲权指数到亲权概率

1.简单的转换公式
亲权概率=累积亲权指数÷(累积亲权指数+1)。
如果CPI=9999,代入公式:9999÷10000=0.9999,即99.99%。
如果CPI=999999,代入公式:999999÷1000000=0.999999,即99.9999%。
2.为什么不是100%?
注意分母是“CPI+1”,永远比CPI大一点点,所以亲权概率永远小于100%。
这个数学上的“小于1”是因为我们永远无法完全排除“极巧合事件”的可能性——比如孩子碰巧和这个陌生男子在所有位点上都相同。
但当CPI足够大时,亲权概率就是小数点后面无数个9,和100%在实际意义上没有区别。
3.为什么报告只写99.99%?
很多鉴定机构为了保守,统一将结论表述为“99.99%以上”,即使实际算出来是99.9999%。
这是行业惯例,避免委托人误解为“绝对100%”,因为理论上存在基因突变的极微小可能。
理解这一点很重要:99.99%不是不准确,而是科学家严谨的表达方式。

四、排除报告为什么是100%?

1.排除原则
如果孩子有一个数字,被检测男子没有,且这个数字显然不能来自母亲(母亲也没有),那么该位点就是“排除位点”。
鉴定标准规定:至少三个或以上独立位点出现排除,才能下排除结论。
2.排除概率是确定的
在排除位点上,不需要计算概率。因为生物学上,父亲必须提供孩子一半的DNA,如果某个位点父亲连对应的数字都没有,那他绝对不可能是父亲。
所以排除报告的准确率是100%,没有任何理论上的例外(除非实验室错误)。
排除结论不会写“99.99%”,而是直接写“排除亲子关系”。

五、常见的统计学误区澄清

1.“99.99%就是一万个人里错一个”
错。99.99%是指在这个案例中亲生的可能性是99.99%,不是指鉴定方法本身的错误率。
方法本身的错误率极低,主要来自样本污染或操作失误,而不是统计学上的“万分之一”。
2.“位点越多,准确率越高”
正确。检测位点越多,累积亲权指数越大,亲权概率越接近100%。
但15个位点以上的准确率已经极高,加到21个、30个更多是为了应对突变或近亲等复杂情况。
3.“人群频率数据从哪里来?”
每个STR位点的不同数字(等位基因)在人群中的出现频率,是通过大量健康无关个体的调查统计得到的。
中国人群有中国人群的频率数据库,欧洲人群有欧洲人群的数据库。
正规鉴定机构使用中国人群的频率数据,如果误用其他人群的数据,计算结果会有偏差。
亲子鉴定报告上那个醒目的“99.99%”不是噱头,也不是魔术,而是一套严密的统计学推理。它告诉我们:在现有证据下,支持亲生的可能性是对立可能性的数万甚至数亿倍。这个数字不会说谎,但前提是样本真实、位点足够、数据库匹配。理解了这个数字的来历,你就能读懂报告里每一个数字的含义,也能更有底气地和鉴定机构沟通——毕竟,数学才是这个世界上最诚实的语言。

Copyright © 2023-2025 福州亲子鉴定中心 版权所有  网站备案号