「華人戴明學院」是戴明哲學的學習共同體 ,致力於淵博型智識系統的研究、推廣和運用。 The purpose of this blog is to advance the ideas and ideals of W. Edwards Deming.

2011年5月25日 星期三

The Taming of Chance 驯服偶然: 統計故事史

The Taming of Chance 驯服偶然: 統計故事史

Amazon.com: The Taming of Chance (Ideas in Context) (9780521388849 ...

- [ 翻譯這個網頁 ]
"The Taming of Chance contains a wealth of information and is very pleasant reading. The various pursuits that impinge on the taming of chance and the ...

Ian Hacking - Wikipedia, the free encyclopedia

- [ 翻譯這個網頁 ]
The Taming of Chance (1990); Scientific Revolutions (1990); Rewriting the Soul: Multiple Personality and the Sciences of Memory (1995); Mad Travellers: ...

驯服偶然

作者: 伊恩.哈金(加)
译者: 刘钢
出版社: 中央编译出版社
出版年: 2000-

内容简介 · · · · · ·

   20世纪的哲学家和科学家认为宇宙是概率性的,因而偶然便是实在的。统计定律反 映出宇宙的本质,虽然有的事物有其固有的不可预测的一面,但是统计规律的实在性最终被认为是理性的。本书则通过曲折复杂的历史佚事反映出统计规律是何以登 堂入室的。内容的丰富使作者的哲学思想难于把握,但正是奋争在这扑朔迷离之中才是值得一试的。 本书从大尺度上描绘了观念转变的过程,弥补了科学社会学中案例研究和标准形式的识知研究的不足。有些论证值得商榷,尤其是哈金描述的“革命”,在我看来, 就从未在他所认为的意义下发生过。但是哈金的思想过于复杂,很难被这些反驳意见所驳倒。关于涂尔干和高尔顿的写作上,对很难说清的方面把握恰到好处,论证 雄辩,这正是本书闪光之处。

作者简介 · · · · · ·

  作者简介
  哈金为加拿大多伦多
  大学哲学系、科学技术哲
  学与科技史研究所教授。
  1962年获剑桥大学博士学
  位。曾在剑桥大学、斯坦
  福大学任教。哈金长期从
  事科学哲学和科学史研究,
  著述影响甚大,并被广泛
  引用。1975年出版的《概
  率的突现》,成为学术畅
  销书。《驯服偶然》同样
  获得巨大成功,问世不久
  便被评为“20世纪100部英
  语写成的最佳作品”之一。
  

目录 · · · · · ·

目录
致谢
译者前言
1 大思路
决定论在19世纪遭受了侵蚀,为偶然的自主定律腾出
了空间。受离中趋势定律支配的正常人模型取代了人性的
思想。这两种转变是平行的并互促互动。偶然使世界显得
不那么反复无常:偶然是真实的,因为它使秩序脱离于混沌。
在我们关于世界和人的观念中,非决定论的成分越大,所预
期的控制程度也就越高。
这些事件始于拿破仑时代末期的雪崩般的统计数字
人的多种行为,尤其是异常行为如犯罪和自杀,得到了点查。
年复一年,这些行为似乎具有令人吃惊的规律。社会的统计
定律似乎要从官方的有关异常行为的数表中脱颖而出。有
关平均值和离中趋势的数据形成了正常人的理念,从而导致
了一些新的社会工程,以及若干新的方式以便改造不合需求
的社会阶层
19世纪初,人们认为统计定律可还原为潜在的决定论
事件,但此类定律的盛行逐渐而又反常地使决定论遭到贬
低。人们把统计定律视为有其自身道理的定律,而统计定律
的偏差则被归入自然现象 于是,出现了一种新的“客观知
识”,这就是新技术的产物,其目的是为了获取有关自然和社
会过程的信息。新的统计准则出现了,它们是这类知识的见
证。因而,正当的统计定律不仅用于描述,而且还用于解释
和理解事件的进程。偶然被驯服了,在这个意义上,偶然成
为自然和社会基本进程的要素
2 必然性信条
19世纪,据说“偶然”仅仅是个语词,不代表任何事物,或者
说它是庸俗的观念,指运气甚或瞎猫碰死耗子之类,因而有教养
的人对它是不屑一顾的。每个事件,至少在现象界,均必然地来
自先前的一些事件。就连学医的大学生,尽管在他们那个学科
领域拒绝接受普适的定律,但却赞成某些有关必然因果关系的
特殊的和个别的训练,而不会支持重要的偶然性
3 公开的业余人士 秘密的行政官僚
18世纪,官员们收集有关税收、征兵以及确定国力的统
计数据。这些信息对政府而言是保密的。业余人士和学术
界的人在数目字事实上有过从甚密的交往,各种数目字事实
曾得以广泛发布,但却从未系统地集中起来过 普鲁士被用
来作一例证
4 官僚机构
拿破仑之后的和平时期,欧洲各国纷纷成立收集并出版
关于所有生活方式和行政管理的统计机构。它们设立新的
机构以利于收集和传播这类信息。这使1820―1840年间雪
崩般的统计数字的出版成为可能 继续以普鲁士为例证
5 理性的开明专制
仅有数目字不足以说明问题。普鲁士人未能形成有关
统计定律的理念。但在西方这种理念问世了,尤其是在法国
和英国。在大革命前的法国,一直就有理性道德科学的传
统。后来,大量的统计数字将其转变为一种经验的道德科
学,但仍保留了有关规则和定律的开明观 孔多塞这位理性
选择的理论家的例子,以及官僚们将其取而代之,并形成统
计思想的例子
6 疾病的量
1815年以前,统计概括大都限于出生、死亡和婚姻方
面。由英国议会作的一项研究精确地表明,一类新的“生物”
定律是如何出现的,何时出现的,这就是疾病的统计定律。
1825年成立小型特别调查委员会
7 科学的丰产区
从更一般情况看,世界正在数目字化。1832年,巴贝奇
提出的有关收集自然和艺术常数的建议很好地证明了这一
事实。这是一项关于一类新的和广泛存在的数目字的声明
常数将被用来了解和管理世界
8 自杀是一种癫狂
雪崩般出版数目字之所以引起注意,关键在于罗列了行
为异常者的数字,尤其是在法国。1815年引发了一场争论:
谁更具有自杀倾向,巴黎人还是伦敦人?当时,根本不可能
有什么结果,十年之后才有可能得出结论,因为成立了收集
和出版这方面数据的新机构。
自杀在统计学中是一个反复出现的主题。在医学帝国
主义的一个例子中,存在着一种隐含的三段论:癫狂由医生
来治疗,自杀是一种癫狂,所以有关自杀的统计数据与其他
医疗统计数据一样地进行处理。因而,医疗的因果关系适用
于自杀现象 当时这些理论被用于所有与行为异常有关的
统计数据
9 立法哲学的实验基础
到1820年代,官方的数表尚不能说明某地区自杀的数
目和类型。这些数据,以及像犯罪和受苦人的信息,被认为
是支持了孔多塞的理性道德科学 新的道德经验科学涉及
人类不良品行的统计定律
10 无认证、无细节、无对照、无价值的事实
首次企图将医疗统计数据用作治愈率功效的证据:有
关布鲁塞新生理医学的辩论,与之相对照的是一种治疗胆
石症新方法的细致分析
11 由什么样的多数来决定?
孔多塞和拉普拉斯曾试着用一些先验的方案来解决指
定最有效的陪审团体系的问题。他们没有经验数据。法国
司法部为他们提供了新的犯罪统计数据 泊松将新信息应
用于陪审团体系的统计方法
12 大数定律
在研究统计学的审判规程的过程中,泊松于1835年首
创“大数定律”一词,并证明了一个重要的极限定理。这为
统计数学应用于社会事务提供了进一步的理论说明。它似
乎还解释了在社会事务中存在统计稳定性的原因
13 士兵的胸围
凯特尔于1844年论证道,有限次数的抛硬币的相对频
率(二项式定律,在天体测量中也叫作误差律)给出一条符
合人的标志和行为的经验分布曲线(钟型曲线或正态分布
曲线)。该曲线似乎给出了有关人的新统计定律的精确形
式。因果关系的观念,甚至包括医疗模式,开始重新安排以
使统计定律与决定论相一致
14 社会制造了罪恶
统计宿命论的问题始见端倪 倘若这一定律是关于某
地区每年都有那么多人应该去自杀,那么,显而易见,这部
分人便逃脱不了自杀的命运。表面上看,这场争论似乎空
洞乏味,却反映出越来越多的人察觉到社会控制的可能性
以及道德责任的涵义
15 天文学的社会构想
统计宿命论,尤其是自杀的例子,继伯克尔著名的《英
国文明史》之后,在德国继续升温。随之而来的辩论焦点集
中在这种新定律――统计定律的原子论和整体论观念之间
的基本差异之上。这些差异反映了西方自由主义者和东方
集体主义者社会观方面的不同
16 矿物学的社会构想
人们可以不用平均数而以一种非常不同的方式进行定
量。乌托邦传统的理论家勒普拉采用了某单个家庭的预算
来代表一个阶层的生活方式,并提出一套全然不同的社会
科学构想。这与普鲁士统计局局长所采用的家庭预算形成
鲜明的对比 有待解决的是,什么才算是客观知识的思想。
17 最古老的贵胄
统计学在杂耍剧场遭到了嘲弄,还引起孔德、陀思妥耶
夫斯基和尼采的强烈回应。即便是那些想为突发奇想或重
新发现有关纯粹偶然的古老思想寻找一片净土的人,对偶
然、对其定律及其用途也是矛盾重重
18 卡西尔的论点
卡西尔论证道,20世纪有关决定论的思想是相当最近
的事,在1870年前后才出现。因而,量子力学并不拒斥古
老的因果性观念,却与新的因果性观念不相容。他的建议
中有道理的地方在于,1850―1880年间出现的关于必然性
的思想中存在着一种激烈的冲突 对“决定论”一词的用
法、该词在1780年代的词源以及在1860年代的新用法进
行讨论
19 正常状态
“正常”一词一直被用来进行描述和评价,但用来指通
常的或典型的仅在19世纪才出现。这种用法首次出现在
生理学文献中,其代表人物为布鲁塞,后来由孔德将其转化
为政治纲领的一部分。正常状态取代了有关人性的思想,
人性的思想在启蒙时期是富有生机的核心概念,从而演变
为两种观念。一种为凯特尔―涂尔干把正常状态作为正当
和善的观念。另一种即高尔顿将正常状态视为平庸而需要
改进的观念。在这两种观念中,正常状态的思想自身所呈
现的为客观性和公平性的保证,是“是”与“应当”之间的一
座中性桥梁
20 像宇宙力那样实在
涂尔干的数目字社会学是在医学、统计学和自杀的概
念基质上形成的。有关正常和病理的思想借自生理学,并
在社会科学中作了相应的变通。在有关犯罪人类学的辩论
中,涂尔干断言犯罪和自杀是正常的 正常值误差是社会
发病率的指标。它们受社会定律和社会力的支配,它们具
有独立于个体的实在性。涂尔干继凯特尔的创造之后,仍
在创立新的实在理论
21 统计定律的自主性
凯特尔的钟型曲线在英国得到了命名,被称为正规定
律。这一定律对于大范围现象的描述被认为是真实的或近
似真实的,而且它解释了从乍一看是无序的现象中出现规则
的原因。高尔顿重新思考了凯特尔有关统计稳定性的论述。
统计推理技巧方面的进展表明,统计定律是如何独立于潜在
的决定论结构的。必然的原则尚未被放弃,但相对于统计的
权力而言,它是缺乏时代感的,既不能预言也不能解释现象。
22 普鲁士统计学的一段经历
尽管统计学给出了某些规整性的概念,如正常状态之
类,这些概念可能成为治理人民的基础,但要记住,统计学
在抽象应用方面作用不大。它们在行使权力中是直接的和
可见的要素。有关犹太人统计数据的争论,在1880年于柏
林举行的反犹太人辩论中便表明了这一点。
23 偶然的宇宙
偶然的逻辑不可能在所有的变化中都保持不变。皮尔
斯完全否认必然的信条。他的理论基础是统计稳定性上的
归纳推理逻辑。他在实验设计中引入了人工随机过程。在
所有的统计推理中有两个相互竞争的基本原理,其中一个
就是他提出的。他关于实在的实用主义观念,使真理最终
成为我们所发现的那种事物。他信奉绝对的偶然,并信奉
宇宙中各种自然定律充其量也不过是近似的,而且是从随
机过程中演化来的。偶然不再是瞎猫碰死耗子,而是自然
定律以及所有合理的归纳推理的核心所在。当他那激进的
非决定论被视为世界的概率化以及我们对这种概率化的知
识的必然结果时,也就不那么引人注目了。总之,他认为我
们生活在一个充满偶然的宇宙中,原因并不在于论证,而在
于概率和统计学正向我们生活的各个方面渗透
索 引
译名对照表

---

馴服偶然與數目字治理

⊙ 劉 鋼

哈金(Ian Hacking)著,劉鋼譯:《馴服偶然》(北京:中央編譯出版社,2000)。

  加拿大著名學者哈金(Ian Hacking)在當今英語世界中頗具盛名。他的《馴服偶然》(The Taming of Chance) 一書於1999年被「當代文庫」(Modern Library)叢書編委會評選為「本世紀英語世界最優秀的一百部非小說類作品」之一,在國際學術界影響很大。該書初版於1990年,1991年和 1992年有過重印。中央編譯出版社的「新世紀學術譯叢」於2000年出版了該書的漢譯本。哈金生於1936年,1956年畢業於英屬哥倫比亞大學數學與 物理學系;1958年又獲劍橋大學三一學院道德科學系學士學位;1962年獲劍橋大學文學碩士和哲學博士學位。自1982年起任加拿大多倫多大學哲學系和 科學史與科學技術哲學研究所教授。哈金長期從事統計思想史的研究,《馴服偶然》是他花費十年心血寫成的力作。

   我國學術界對黃仁宇先生的作品和思想比較熟悉。十多年前,我參加了中國科學院組織翻譯李約瑟 (Joseph Needham)《中國科學技術史》的工作,在翻檢文獻時,見到他對黃先生關於「明代的漕運」這個專題的評價,李約瑟說黃先生的研究是一切圍著數目字轉。 而哈金的《馴服偶然》便是一部關於西方國家在現代化過程中如何利用數目字治理國家的書。黃先生曾頗有感慨地談到中國傳統的治國方式是「間架性的設計」,即 不由它「自身做主摸索而成,乃是由政治家鳥瞰的態度裁奪」。他認為這是「超時代的政治早熟」。正如李約瑟評價朱子時所說,在沒有產生一個牛頓式的宇宙觀之 前,先已產生了一個愛因斯坦式的宇宙觀。這種理念應用於社會政治方面,則出現這樣的情況,「一般政令上面冠冕堂皇,下面有名無實。結果則是中國的億萬軍 民,不能在數目字上管理」。在黃先生看來,中國最大的問題在於名與實之間沒有成功地得到鏈接,也就是說,中國不能用數目字治理國家。

   於是,數目字治理便成為我們必須要補上的一課。實際上,「數目字治理」就是「現代化」的一種隱喻。我 們對於「現代化」的理解似乎總是一種時間的觀念。不論在英語還是漢語世界,均是如此。如中國學者何傳啟便提出人類社會的現代化過程分為四個時代、十六個階 段。然而,仔細探究一下,事情好像又不盡然。「現代化」一詞的英語是modernization。這個詞的詞根是拉丁語的modo,即「模態」的意思,所 謂「模態」就是要求人們這樣做,不要那樣做等等。轉義為「模型」、「型範」、「模子」的涵義,它規範著人們的行為方式。所以說「現代化」更像是一個「模型 化」的過程,因而更傾向於一個空間的觀念。那麼現代化的模型是個甚麼樣子的呢?我們說西方現代化基本上是按適應工業化大生產的「模型」安排的。中國有句成 語叫做「請君入甕」,「甕」就是個有形的「模子」,而「現代化」這個「模子」卻是無形的,但是每個人卻都要服從其「邊界條件」。

  確定現代化的「邊界條件」是件很複雜的事情和漫長的過程,其中涉及到管理者對國家的各種構想。但是這些構想如果不付諸實施,就只能是空想。西方的現代 化始於何年何月已不可考。從「現代」(modern)一詞問世的1585年算起,大致不會出大的問題。這個年代基本也就是始於十四世紀歐洲的文藝復興年 代。後來經過宗教改革、地理大發現、工業革命等階段來到後現代。「後現代」一詞始見於1949年,也就是說,西方的現代化經過了三百多年的風風雨雨已經結 束了。西方社會目前處於一種「後現代狀況」。那麼在過去的三百多年間,這個使西方人「就範」的「模子」究竟是甚麼?其奧秘何在?這個話題便是哈金在《馴服 偶然》一書中所要講的故事。

  哈 金本人將他的思想方法歸結為統計性的,因而他的世界圖景是統計學意義下的,即非決定論意義的。哈金 認為,他所持的這種思想方法或推理風格是晚近才有的,確切地說,「僅僅是1660年前後才問世的,而且直到十九世紀之前,統計的思想並沒有大的躍進」。那 麼,十九世紀後西方社會究竟發生了甚麼事情?在哈金看來,西方社會發生了一場「概率性革命」(probabilistic revolution)。凡是標以「革命」的事件,總是伴有劇烈的活動,而這場概率性革命的顯著特徵便是西方社會出現了印刷數目字的「雪崩」,最終導致數 千年決定論的觀念遭受「侵蝕」。決定論遭受侵蝕的結果便是社會逐漸「成為統計學意義下的了。一批類似自然定律但只與人有關的新形式的定律問世了」。

  人們不禁要問,這類與人有關的新定律意義何在?新的定律「對人和世界的支配不 是更少了,而是控制更強 了……這便是偶然被馴服的原因所在」。這些根據概率論表述的新定律的內涵為「正常」和「偏離正常」的狀態,即我們熟知的那條高斯曲線。這便是令西方人就範 的那個無形的模子。人既然可以根據這兩種狀態來表示,那麼人性這個說不清楚的概念,便逐漸被「正常人」的概念取而代之,大家不再討論啟蒙時代所遺留下的人 性的問題了。這類有關社會和人的定律涉及偶然。偶然雖然在本質上是統計學意義的,卻是不容改變的,甚至是自調節的。同這些定律的集中趨勢保持一致者就是正 常人,而處於兩端者(離中趨勢)則是病理學意義的人。多數人都試圖使自己成為正常人,這反過來又影響到何為正常的問題。這類偏好在原子那裡找不到,人文科 學所顯示的是物理學中尚未發現的互動效應。

  吃喝拉撒睡,喜怒哀樂哭是人的自然屬性。可人是不允許像獸那樣活著的,人還有他的社會屬性。馬克思曾說,人是一切社會關係總和。那麼,作為社會關係總 和的人的屬性又是通過甚麼體現出來的呢?在哈金看來,是通過統計數字。統計使一個嶄新的人問世了,其本質是由一千個數字編織而成的:

  為了獲得一種精確的表現,統計研究伴隨著一個人的一生。它負責這個人的出生、洗禮、接種、中小學教育以及由此而來的成功、他的勤逸、離校,以及隨後而 來的高等教育和發展;而且一旦他長大成人之後,還負責他的體格以及從戎的能力。統計學伴隨他以後的人生道路,它記錄了這個人所選擇的職業,在甚麼地方成家 以及治家等;如果他從年輕時便為老年儲存了豐富的資源;他何時、在多大年齡結婚以及他娶了甚麼人為妻──不論事情是向好的方向發展還是向不好一邊滑落,統 計學都將照料著他。如果他經歷過沉船、遭受過物質的、道德的或精神的毀滅,統計學也照樣記錄。統計學只有當這個人死去之後才離開他──在他死後還要確認他 去世的準確年齡並記錄下他的死因。

  這便是西方「卷宗社會」(dossier society)的基礎。在這樣的社會裡,利用人們日常生活所留下的各種數據,便可以掌握人的生活方式、習慣、下落、社會關係等等。因而,每個國家也都以 其自己的方式在統計學上表現出來。這類關於人的系統數據採集不僅影響到對一個社會的構想方式,也極其深遠地改變了我們的選擇,從擇業行為到思維方式。

   馬克思主義經典作家曾一針見血地指出,問題不在於解釋世界,而在於改變世界。西方對社會的改變源於一 種理念,即通過點查和分類可以改善(控制)有異常行為的亞人口群體。然而,並非任何數目字都能起這個作用。許多定律般的規律都與異常現象相關:自殺、犯 罪、遊民、癲狂、賣淫、疾病等。由於十九世紀末雪崩般的統計數字,人的多種行為,尤其是異常行為,被列入官方的統計研究的範疇。通過研究發現,這些現象年 復一年似乎具有驚人的規律。有關社會的統計定律便是從這種關於人的異常行為的研究中發現的。其目的又是甚麼呢?根據平均值和離中趨勢的數據所形成的正常人 的思想,開始實施若干社會工程,以便「改造不合需求的社會階層」。正如優生學的創始人高爾頓(Francis Galton)於一百年前所說,概率定律的首要目的便是「在最具野性的混亂之中以寧靜和完全平淡的方式實施帝王式的統治」。

  道理似乎人人都懂,關鍵還要看故事是否精彩。哈金講故事的方法也不同於以往的我們熟悉的科學哲學和科學史的舊套路。他用的是法國當代哲學家福柯 (Michel Foucault)的知識考古學的講法,以歷史和思想史的研究闡述其哲學思想。走進作者的世界,就好比進入一座博物館,每一章便是由各種數目字事實布置起 來的展廳。沿著博物館的長廊走下去,兩廂的展廳向我們展示了西方社會發生的那場持久的、全方位的概率性革命,使我們從一個側面看清了西方社會何以呈現出今 天這幅圖景的原因。

  然而,「偶然」真被「馴服」了嗎?果真如此,自由意 志又當何如?這個問題哈金的回答非常巧妙。所謂「馴服」是統計學意義下的,作為個體,正如他所引用的馬拉梅(Stephane Mallarme)的詩:「孤注一擲絕不會破壞偶然性」。不論當骰子是在永恆的環境下擲出的──這可以使我們靜觀宇宙的星群;或者是在完全個人偏好的環境 下擲出的──這可以將我們個人的命運封緊,「偶然均湧入我們感官的每一條通道。」


《二十一世紀》(http://www.cuhk.edu.hk/ics/21c) 《二十一世紀》2003年2月號總第七十五期

---

R. A. Fisher, the life of a scientist by Joan Fis...
---

統計:從政治算術到一門科學(Statistics: from political arithmetic to a science)

統計:從政治算術到一門科學(Statistics: from political arithmetic to a science)
國立臺灣師範大學數學系洪萬生教授/ 國立臺灣師範大學數學系洪萬生教授責任編輯

「統計」是一個多義的名詞,而且,常常在面對質疑的意見時,被用來保證其可信度。我們有時使用它來談論資料,特別是指數值資料 - 例如,「93%的統計數值是編造的」。當在這些意義下使用時,統計(statistics)是個複數名詞:數據的每一小部分都是一個統計量(statistic)。當統計(statistics)作為單數名詞使用時,它所指涉的,是一門產生及分析這些數據的科學。這門科學有著悠久的歷史根源,但卻是在二十世紀初期才發展興盛起來。

統 計學與機率論息息相關,這可以解釋何以有些大學數學系將「機率與統計」合開為一門課程。不過,統計和機率卻是直到十八世紀初期,才共同發展成對 「不確定性」之數學研究的兩個緊密相關領域。事實上,它們是對相同的基本情況進行相反兩邊的考察。機率論探討吾人已知群體的未知樣本可以說些什麼?例如, 知道了投擲一對骰子一次可能得到的所有數值組合,那麼,下次投擲得到點數和為7的可能性是多少?統計學則是從調查一個小型的樣本,探究吾人對未知的群體可 以說些什麼?例如,知道在十六世紀一百位倫敦居民的壽命,我們是否可以推論出一般倫敦人(或是歐洲人,或是一般的人類)也可以活一樣久?

譬如說吧,第一本對機率論與統計學作廣泛充分討論的著作,是1713年由伯努利(Jacob Bernoulli)出版的《猜度術》(Ars Conjectandi)。 這本書分成四個部分,前三個部分討論排列、組合和流行的賭博遊戲之機率理論。在第四個部分,伯努利陳述了這些數學概念在例如政治、經濟或死亡率等領域有更 嚴肅及更有價值的應用。然則我們必須收集多少數據,才能合理地相信從數據所做出結論是正確的?(例如,為了要正確預測選舉的結果,我們需對多少公民進行民 意調查)?伯努利證明了:樣本愈大,結論正確的可能性愈高。而這,正是現在稱之為「大數法則」的著名定理。

樣本當然關係到數值資料的蒐 集。在歷史上,譬如羊群的大小,穀物的供應量,軍隊的人數等等紀錄,都有著相當古老的傳統。這些種類的資料所繪成的表 格,可以在古代文明中最早遺留下的史料裡尋得。他們被政治或軍事的領導人用來預測或防範可能發生的飢荒、戰爭、政治上的結盟或是國家其它的事務上。事實 上,統計這個字的來源就是state(國家):它在十八世紀時被敲定,原指國家事務的科學性探究,但很快地重點被轉移至政府有興趣的政治或人口統計資料。

這種資料的收集,在人類有政府時就存在了。事實上,有些學者認為對這些資料的需求,就是數目本身被發明的原因之一。不過,一直到過去幾個世紀,人們才開始去思考如何去分析及瞭解這些數據的意義。1662年,格朗特 (John Graunt) 出版了《關於死亡清單的自然與政治觀察》(Natural and Political Observations Made upon the Bills of Mortality)。 這些死亡清單是倫敦每週及每年葬禮的紀錄,而早在16世紀中葉開始,就由政府來收集歸檔。格朗特將1604-1661年間的記錄整理成數值的表格,然後, 他敘述了所觀察到的模式:男嬰出生人數比女嬰多,女性活得比男性長,每年的死亡率(除非是有傳染病流行)大致上是一個常數等等。對一組同時出生的100位 倫敦人所組成的「典型」團體,他也估計了每十年的死亡人數。他這些被稱為倫敦壽命表(London Life Table)的表格化結論,代表了對平均壽命數值化估計的開始。

格朗特和伯提(William Petty, 1623-1687)一起建立了「政治算術」(Political Arithmetic)這門學問,也就是嘗試藉由如死亡清單這類資料的分析, 而獲得國家人口資訊。接著,很快就有其他人利用較好的數學方法來處理。例如,英國天文學家哈雷(哈雷彗星就是以他的名字命名)就編輯的一套1693年死亡 率表格,作為他研究保險年金的基礎。他因此成為精算科學(actuarial science)的創立者,這門學問針對平均壽命或其他人口統計趨勢,進行數學特性的研究。這類研究很快就成為保險業的科學基礎,依賴的是對各種不同保單 所冒風險的精算。

數據的可靠性對十八世紀歐洲的科學或商業而言,都是重要的議題。天文學被認為是決定經度的鑰匙,而經度測量的可靠性, 則是遠洋航海安全的關鍵。天文 學家為了決定行星軌道,也作了大量的觀測,但是,這些測量容易產生誤差,因此,如何從「混亂」的數據中,抽取出正確的結論,就變成是一件相當重要的事。同 時,保險公司開始收集各種數據,但是,那些數據都包含著偶然性所導致的變異,所以,吾人也必須按某種方式去區別什麼是真地會持續發生,而什麼又只是因為誤 差或機遇變異所導致的波動?針對這些問題,1733年,棣美弗(Abraham de Moivre)描述了我們現在所說的常態曲線(或正規曲線),作為二項分佈的近似。他使用這個想法(後來被高斯及拉普拉斯重新發現),去改善伯努利為了得 到精確結論所需觀測次數之估計。不過,棣美弗和他同時代的人並不總是能給出合適的答案,來回答對於真實世界的情況所提出的基本問題:觀測所得數據中的某些 特徵,到底在多少程度上,可以反應出吾人所研究的群體(或現象)的狀況?

法國數學家勒讓德(Adrien-Marie Legendre)發明了「最小平方法」,帶動了十九世紀統計理論的走向,而且從那時起,這個方法就是統計學家的標準工具。他利用這個方法,來從觀測所得 的數據中提取出可靠的資訊。不久後,高斯和拉普拉斯獨立地使用機率論來證明勒讓德的方法,也重新對它加以陳述使其更便於使用。於是,這個極有威力的工具便 逐漸在歐洲的科學家社群中傳播開來,這是因為它在進行大量數據依賴的研究,尤其有關天文學及測地學時,表現得十分有效。

在十九世紀,統計方法也隨著比利時人克威特列特(Lambert Quetelet)的開創性工作,而開始滲透到社會科學。1835年,克威特列特出版了一本書討論他所謂的「社會物理學」(social physics)的著作,在該書中,他嘗試運用機率的定律去 研究人類的特徵。他那新穎的「平均人」(the average man)概念,即在一個給定的情境下,對人類特徵的一個以數據為基礎的統計性構念,成為後來研究中吸引人的焦點。但是,它也被批評為過度延拓數學方法,將 其使用到多數人認為不可量化的人類行為(如道德)之上。事實上,在19世紀時,除了心理學之外,大部分的社會科學領域都對統計方法的滲入表示出相當抗拒的 態度。

統計由於在十九世紀獲得了許多進展,它便開始從機率論的陰影之中走出來,而成為數學的一個獨立學門。它的成年禮,是達爾文最年長 的一個表兄弟嘉爾頓 (Francis Galton)爵士在1860年代為遺傳學所做的研究。嘉爾頓是當時優生學運動的一份子,希望藉由選擇性的生育來改良人類的種族。因此,對於理解某些特徵 在母群體中是如何的分佈及如何(或者是否)遺傳,他有著很濃厚的興趣。為了彌補無法控制影響遺傳無數變因的缺點,嘉爾頓發展了兩個創新的概念:迴歸與相 關。在1890年代,高頓的洞察力被愛格伍斯(Francis Edgeworth)以及皮爾遜(Karl Person)和他的學生優爾(G. Udny Yule)所精練及延拓。優爾最後將嘉爾頓及皮爾遜的想法,發展成為迴歸分析中一個有效的方法論,其中,他使用了勒讓德最小平方法的一種微妙的變形。在二 十世紀,這個進展大大有利於生物及社會科學中廣泛使用的統計方法。

當統計理論成熟時,它的應用變得愈來愈明顯。二十世紀中許多大公司均 聘僱有統計學家。保險公司聘請精算師來估算在平均壽命及個人不可預期事件的考量 下,應收取的保險金額。其他公司則雇用統計學家來監控品質管制。因此,愈來愈多的統計理論上的進展,是藉由非學院人士之研究所取得。譬如,筆名「學生」 (Student)的哥薩(William S. Gosset),原在愛爾蘭金氏 (Guinness) 黑啤酒釀造廠工作。他最精彩的論文是處理抽樣方法,即從小樣本中提取出可信賴之資訊的特別方法。

不過,20世紀初期最重要的統計學家,費雪(R. A. Fisher, 1890-1962)莫屬。由於同時具有理論上及實務上的洞察力,費雪得以將統計奠基在嚴密的數學理論上,使之成為一個強而有力的科學工具。他的《研究者的統計方法》(Statistical Methods For Research Workers),對很多世代的科學家而言,是一本劃時代的著作。還有,他的《實驗設計法》(The Design of Experiments))則強調:為了獲得良好的數據,吾人應該要從為了提供那些數據所設計的實驗開始下手。費雪的研究將統計工具穩固地建立,而成為任何科學家所必備的工具。

今 日,我們看到統計技術應用到廣泛且大量的人類事務上。民意調查、品質控制方法,以及教育上的標準化測驗等等,都已經成為每天生活中司空見慣的部 分。尤其,電腦幫助統計學家處理大量數據的工作,也開始影響統計的理論與實務。因此,統計已不再被認為是數學的一個分支,即使它的理論基礎仍然充滿了數學 特性。統計史家史蒂格勒(Stephen Stigler)認為現代統計學既是一種邏輯也是一個方法論。在短短的幾個世紀中,對數據所提出的數學問題所播下的種子,已經成長茁壯為一個有自我目的及 標準的獨立學門,它對科學與社會兩方面,有著越來越重要的影響。

參考書目:
Porter, Theodore M. (1986). The Rise of Statistical Thinking 1820-1900. Princeton, NJ: Princeton University Press.
比爾‧柏林霍夫 / 弗南度‧辜維亞 (2008).《溫柔數學史》,台北:博雅書屋。
齊斯‧德福林 (2011).《數學的語言》,台北:商周出版社。

沒有留言:

網誌存檔