当前位置:首页 > 概率统计小故事
但直到1909年才由波莱尔给予证明,证明的难度比伯努利的提法大得多.设想一下,如果当时伯努利就采用该提法,他也许在有生之年不能完成这一工作.由于波莱尔的结论比伯努利的结论强,现今人们又把他们的结论分别称之为强大数定律和弱大数定律.
6. 狄莫佛的研究动因
亚伯拉罕?狄莫佛出生在法国一个信教徒家中,19岁那年因宗教信仰的原因曾被捕入狱,并度过了两年铁窗生涯.出狱后为逃避迫害,21岁的他流亡到伦敦,做了一名教师.在那里,他在教书之余继续研习数学,主要是阅读刚出版不久的牛顿的著作《自然哲学的数学原理》.后来,他在数学领域内取得了多方面成就,并于1697年当选为英国皇家学会会员,这一年他刚届而立.狄莫佛的一项广为人知的成果是著名的狄莫佛公式:
(cos??isin?)n?cos(n?)?isin(n?)
(但狄莫佛并未把公式写成这种形式).
在1718年,狄莫佛出版了《机遇论》(Doctrine of Chances)一书,此书奠定了他在概率史上的地位.该书一共出了三版,分别在1718年、1738年和1756年.人们常说概率史上有三部里程碑性质的著作,狄莫佛的《机遇论》乃其一.另两部为伯努利的《推测术》及拉普拉斯于1812年出版的《概率的分析理论》.
有趣的是,吸引狄莫佛投身到二项概率的研究契机,并不是为改进伯努利在该项研究上的结果.事实上,1718年版的《机遇论》一书表明,狄氏对伯努利颇有一番看法.狄莫佛之所以注意到这一问题,与下述偶然情况有关.
1721年,一个叫亚历山大?喀明的人向狄氏提出了一个问题:A、B二人在甲家赌博,每局A获胜的概率为p,B获胜的概率为q?1?p,共赌N局.以X记A获胜局数.约定:若X?Np,则A付给甲X?Np;若X?Np,则B付给甲Np?X.问甲所得期望值是多少?按定义,此期望值为
- 9 -
NDN?E(|X?Np|)??|i?Np|b(N,p,i),i?1
?N?iN?ib(N,p,i)???i??pq,i?0,1,?,N??其中.狄莫佛在Np为整数条件下得到了
DN?2Npq?b(N,p,Np),
(8)
且他只对p?1/2的特例给出了证明.不过,其证法易推广到一般的p.狄氏声称此公式他在1721年得到,但证明首次发表是在1730年.现在我们容易在一般情况下证明
DN?2?q?b(N,p,?),??[Np]?1.
(9)
此处及以下的[a]表示不超过a的最大整数.易验证,当Np为整数时,公式(8)与(9)一致.
b(N,p,i)的计算不易.因此,(8)与(9)回答了喀明所提出的问题,但在N较大时,
狄莫佛想找到一个便于计算b(N,p,i)的近似公式
b(N,p,?)?2?Npq?exp(?2Npq). (10)
7. 泊松公式、泊松分布与泊松大数定律
泊松(Possion)的名字对学概率论与数理统计的人来说,可谓耳熟能详.原因主要在于泊松近似公式,以及更重要的源于该近似公式的泊松分布,泊松分布的重要性和知名度在离散型分布中仅次于二项分布.泊松的另一个重要工作是把伯努利大数定律推广到每次试验中事件发生的概率可以不同的情况,现称泊松大数定律.
继狄莫佛给出二项概率近似计算公式(10)之后,丹尼尔和拉普拉斯也给出了二项概率近似计算公式,但这些公式在现今的教科书上已很少提及,只有泊松近似公式则不然,其形式为
N??limb(N,p,k)?e???k,k! (11)
- 10 -
limNpk?0,1,2,?,N??其中??N,.公式(11)在教科书上通称为泊松逼近公式、泊松近似
公式或泊松公式.它是泊松在1838年于《概率在法律审判的应用》一书中所引进,此公式适用于p很小,N很大而Np又不很大时,这正好填补了狄莫佛公式(10)的不足,因后者只适用于p不太接近于0和1的时候.不过,从历史上看,狄莫佛早在1712年已做出了这个结果.
8. 贝叶斯及其传世之作
托马斯?贝叶斯(Thomas Bayes,1701-1761)其人在18世纪上半叶的欧洲学术界,恐怕不能不算是一个很知名的人物.在他生前,没有发表过片纸只字的科学论著.那时,学者之间的私人通信,是传播和交流科学成果的一种重要方式.许多这类信件得以保存下来并发表传世,而成为科学史上的重要文献,例如前面提到的费尔马和巴斯噶的通信,伯努利与莱布尼兹的通信等.但对贝叶斯来说,这方面材料也不多.在他生前,除在1755年有一封致约翰?康顿的信(其中讨论了辛普森有关误差理论的工作)外,历史上没有记载他与当时的学术界有何重要的交往.但他曾在1742年当选为英国皇家学会会员(相当于科学院院士),因而可以想到,他必定曾以某种方式表现出其学术造诣而为当时的学术界所承认.如今,我们对这个生性孤僻、哲学气味重于数学气味的学术怪杰的了解,是因他的一篇题为“An essay towards solving a problem in the doctrine of chance(机遇理论中一个问题的解)”的遗作.此文发表后很长一个时期在学术界没有引起什么反响,但到20世纪以来突然受到人们的重视,成为贝叶斯学派的奠基石.1958年,国际权威性的统计杂志《Biometrika》(生物计量)重新刊载了这篇文章.此文也有中译本(见廖文等译《贝叶斯统计学——原理、模型及应用》的附录4,中国统计出版社1992年版).
此文是他的两篇遗作之一,首次发表于1764年伦敦皇家学会的刊物《Philosophical Transactions》上.此文在贝叶斯生前已写就,为何当时未交付发表,后来的学者有些猜测,但均不足定论.据文献记载,在他逝世之前4个月,他在一封遗书中将此文及100英镑托付给一个叫普莱斯的学者,而贝叶斯
- 11 -
当时对此人在何处也不了然.所幸的是,后来普莱斯在贝叶斯的文件中发现了这篇文章,他于1763年12月23日在皇家学会上宣读了此文,并在次年得以发表.发表时普莱斯为此文写了一个有实质内容的前言和附录.据普莱斯说,贝叶斯自己也准备了一个前言.这使人们无法确切区分:哪些思想属于贝叶斯本人,哪些又是普莱斯所附加的.
贝叶斯写作此文的动机,说法也不一.一种表面上看来显然的说法是为了解决伯努利和狄莫弗未能解决的、二项分布概率p的“逆概率”问题,因为当时距这两位学者的工作发表后尚不久,有人认为他是受了辛普森误差工作的触动,想为这种问题的处理提供一种新的思想.还有人主张,贝叶斯写作此文,是为了给“第一推动力”的存在提供一个数学证明.这些说法现在都无从考证.
上面提到“逆概率”这个名词.在较早的统计学著作中这个名词用得较多,现在已逐渐淡出.顾名思义,它是指“求概率这个问题的逆问题”:已知事件的概率为p,可由之计算某种观察结果出现的概率如何.反过来,给定了观察结果,问由之可以对概率p做出何种推断.推广到极处可以说,“正概率”是由原因推结果,是概率论;“逆概率”是由结果推原因,是数理统计.
9. 拉普拉斯的“不充分推理原则”
贝叶斯工作发表后很长一段时期,都没有得到学术界的注意,因而他的这种思想未能及早地发展成为一种得到广泛应用的统计推断方法.但是,也有些学者独立地朝这个方向思考,提出类似的思想并付诸实用,其中最重要的当属拉普拉斯.
拉普拉斯在1774年的一篇文章中提出了所谓的“不充分推理原则”(principle of insufficient reasoning).他的思想大致如下:如果一个问题中存在若干个不同的原因(cause) A1,A2,?,An,则在没有理由认为其中哪一个特别有优势时,概率应各取1/n,即认为各原因有同等机会出现.在统计问题中,
- 12 -
共分享92篇相关文档