班佛定律(大陆称:本福特定律),快速识别数字造假,不需要计算,只需要看一眼数据,就可以轻松判断数据的真实性。(图片来源:Adobe Stock)
即使不是会计审计人员,你的一生中也会遇到很多数字,比如说报销单,运营数据,财报数据等,既使你投资的是一个小卖店或者小餐馆,也需要关注每个月销售数据是否正常。加上今年美国总统选举疑点重重,原本川普团队说自己已经赢了,睡了一觉醒来,拜登选票突然“神奇”增加,突然翻盘,后续又爆出某选区6000张投给川普的选票错投给拜登,使得2020的美国大选存在严重舞弊的疑点。(相关阅读:美国大选笑话:“总统是谁?”)
如何一眼识别出数字是否造假?今天就替大家介绍美国物理学家发现的班佛定律(大陆称:本福特定律),快速识别数字造假,不需要计算,只需要看一眼数据,就可以轻松判断数据的真实性。
班佛定律(本福特定律)
班佛定律(大陆称:本福特定律),快速识别数字造假,不需要计算,只需要看一眼数据,就可以轻松判断数据的真实性。(图片来源:Adobe Stock)
一般人普遍认为,真实的数据中,0-9的十个数字出现机率应该是随机的,也就是各有10%的机率,如果某个数字出现机率过高,就可能是假数据。
但实际上真实数据却不是你所想像的这样,1881年,美国天文学家西蒙·纽康观察早期用来进行对数计算的手册较前方的页面较后方破旧,而发现了现在被称为本福特定律的统计定律。这现象使他建立了该定律的原则,即任意一个数据列表中,倾向由数字“1”开始的机率较其他数字高。
1935年,美国的物理学家法兰克·班佛再次发现这个现象,还通过了检查许多数据来证实这点。他在翻阅对数表时无意间发现,对数表的头几页比后面的页更脏一些,这说明头几页在平时被更多的人翻阅。
这项发现引起了班佛的好奇心,他进一步统计了生活中的其他大数据,比如人口数据、棒球数据等,发现这些数据中都有一个共同的特征,就是数据中以1为开头的数字出现的频率并不是1/9,而是30.1%。而以2为首的数字出现的频率是17.6%,往后出现频率依次减少,9的出现频率最低,只有4.6%。
意即,1-9出现在数字首位的机率是一条平滑曲线,1的出现机率远高于其他数字,是9的5倍。这就是著名的班佛定律(本福特定律),它可以用于检测数据是否造假。当你看数据报表时,只要扫一眼1出现在数字首位的数量是否是9的5倍,即可以在1分钟内判断数据的真实性。
班佛定律说明在{\displaystyle b}进位制中,以数{\displaystyle n}起头的数出现的机率为:
{\displaystyle P(n)=\log _{b}(n+1)-\log _{b}(n)=\log _{b}\left({\frac{n+1}{n}}\right)}
班佛定律不但适用于个位数字,连多位的数也可用。
在十进制首位数字的出现机率(%,小数点后一个位):
班佛定律不但适用于个位数字,连多位的数也可用。(图片来源:维基百科)
末尾数字造假识别
前面讲的本福特定律是通过首位数字识别造假,接着我们再了解一下:如何通过末尾的2位数字识别数据造假。
数据最后两位出现的机率和首位是不一样的,末两位出现的机率是均匀分布的,00-99每个数值出现的机率是1%,所以可以通过末两位数据出现的机率识别数据造假。
末两位数据造假有几个常见的特征:
1,末两位数据是否会出现递减现象。有实验发现,人们在编造数据的时候,会经常出现末尾数据递减现象,比如末二位数据会经常出现10、21、32、43、54、65、76、87、98等数据。如果你浏览数据发现这种现象偏多,那造假的可能性较大。
2,一半编造数据的人很少用00和55这两个数字当结尾。他们普遍认为这两个数字显得不够“随机”,所以当你在查看数据报表时,看不到这两位数字时,可能就要思考一下数据的真实性了。
如何通过末尾的2位数字识别数据造假?(图片来源:Adobe Stock)
用本福特定律发现假帐的例子
最典型的案例是2001年,美国最大的能源交易商、年收入破千亿美元的安然公司破产事件。安然曾在全球500强中排名第七,却突然申请破产。事后人们用本福特定律对安然公司公布的财务报表进行了检验,发现安然财报中公布的每股盈利数据是不符合本福特定律的。
国内股市也有类似案例,2014-2015年金亚科技股价在6个月涨幅超过400%,但是金亚科技的财报数据明显不符合本福特定律,2016年1月金亚科技承认财务造假。
中国导演英达在美国因涉嫌洗钱被捕
美国实行个人报税,税务系统会自动识别虚假报税嫌疑,最常用的手段也是本福特定律。系统发现异常后,会有专人立案调查。
2017年著名演员英达在美国因洗钱被拘捕。当年英达居住康州,在2011-2012年3月间,先后把46.4万美元存入他和他妻子的联名账户。根据联邦法律,美国的金融机构在接收1万美元以上的现金交易时,会要求客户填写“现金交易报告”,英达为了避过监控,每次存钱金额都低于1万美元,前后分50次存入。
英达夫妇俩还在4家银行开了6个账户,被指控是为了避人耳目。英达的结构性拆分行为,会出现9字头存款数据过多,不符合本福特定律,因此被税务局盯上。
据了解,英达出生于演艺世家,身兼演员和导演的身份,与前妻宋丹丹育有一子英巴图,两人离婚后,他娶了现任妻子梁欢,再诞下一子,梁欢的父亲范荣康是《人民日报》前副主编。
本福特定律也可检验数据异常的选举舞弊。(图片来源:Adobe Stock)
本福特定律也可检验数据异常的选举舞弊
本福特定律已经成为会计师们判断销售数据、财务报表等数据是否造假的依据之一,除此之外,也可用来检验选举中是否存在舞弊现象。例如在本次2020的美国总统大选中,就有网友表示:拜登在包括威斯康星州密尔沃基、伊利诺州芝加哥和宾夕法尼亚州阿勒格尼的曲线均不满足“本福特定律”,而与此同时,川普在这些相关地区的曲线却又正好基本符合该定律,举证此次美国选举疑似存在舞弊现象,此时就静待司法调查解开真相了。
密歇根的图表显示拜登的选票突然“神奇”增加。(图片来源:推特截图)
看完这篇文章觉得
排序