统计学传奇大师C. R. Rao去世了,享年102岁。
学过统计学的人都对他的名字不陌生——
(资料图)
Cramér–Rao不等式正是以他和Harald Cramér的名字命名。
而他在《统计与真理》扉页上写下的一句话,也在中文世界广为流传:
在终极的分析中,一切知识都是历史;
在抽象的意义下,一切科学都是数学;
在理性的世界里,所有判断都是统计学。
从1920年到2023年,Rao教授的一生几乎与整个现代统计学的发展历史同步。
2021年,一篇发表在《国际统计评论》上的文章评价他的一生为“统计学的一个世纪”:
他的职业生涯,与从皮尔逊和费希尔,到大数据和人工智能的现代统计学历史紧密相关。
传奇统计学家
C. R. Rao 1920年9月出生于印度。
他的统计学生涯开始于上世纪40年代:先是1943年分别拿下了安德拉大学数学硕士学位和加尔各答大学统计学硕士学位,后又赴英国剑桥大学国王学院攻读博士,师从现代统计学奠基人之一的罗纳德·费希尔(Ronald Fisher)。
初出茅庐,Rao就已经展现出过人的天赋。
1943年,他在加尔各答大学的统计学硕士论文拿下了87%的高分。这一纪录在加尔各答大学至今未被打破。还有评审人评价这篇论文“达到了博士水平”。
1945年,时年25岁的Rao发表了统计学界重磅论文《Information and the Accuracy Attainable in the Estimation of Statistical Parameters》。
就在这篇短短10来页的论文中,Rao证明了Cramér–Rao不等式和Rao-Blackwell定理。两者都是现代统计学方法论的重要组成部分。
简单来说,Cramér–Rao不等式给出了无偏的参数估计的误差下界,为估计量的性能提供了一个基准,任何估计量的方差都不能低于该下界。
Rao-Blackwell定理则描述了如何将任意粗糙的估计量转化为通过均方误差准则或任何一种类似准则优化的估计量。核心思想是用数据中的有效信息做估计,会比直接用全部数据更好。
同时,这篇论文也奠定了信息几何理论的框架——信息几何在如今的人工智能研究中有广泛的应用,还被用在大型强子对撞机的希格斯玻色子测量上。
具体而言:
-Rao引入了参数空间中概率分布之间的距离或散度的概念。
-将参数化族视为黎曼流形,并把Fisher信息矩阵作为黎曼度量张量。
-提出用Fisher-Rao距离来度量两个概率分布之间的差异性。
-这篇论文是最早将微分几何方法应用到概率模型的工作之一。
△Rao和Cramér、Blackwell的合影
1946年,Rao奔赴剑桥,拜入Fisher门下。1948年,在Fisher的指导下,他提出了著名的“得分检验(Score Test)”。
得分检验是统计假设检验的三大方法之一,根据似然函数的梯度来评估统计参数的约束。
相比于Wald检验和似然比检验,其主要优点是计算方便。
对于今天的统计学工作者而言,得分检验可以说是必备的统计学基础知识。
就在今年,102岁的Rao教授获得了统计学最高成就奖国际统计奖(International Prize in Statistics)。
获奖理由是:他70多年前的工作至今仍对科学界有着深远的影响。他1945年发表在《加尔各答数学会公报》上的论文,展示了三个基本结果,为现代统计学铺平了道路,并提供了当今科学界广泛使用的统计工具。
Rao教授一生获奖无数,拥有印度、英国、美国和意大利等8个国家科学院院士头衔。
值得一提的是,他生前培养了50多名博士,华盛顿大学医学院生物统计学系主任Dabeeru C.Rao、美国统计协会Fellow、印度统计学家Debabrata Basu等人都是他的学生。
并且百岁之际,他也并没有完全退休,仍然担任宾夕法尼亚州立大学的名誉教授和布法罗大学的研究教授。
One More Thing
有关开头提到的C. R. Rao的名句,在百岁之时,他本人做出了小小的修改。
印度媒体援引他本人的说法时,最后一句变成了:All methods of acquiring knowledge are essentially statistics。
即,所有获取知识的方法本质上都是统计学。