SENSE隨筆131012「IQ Test」的歷史(下篇)

SENSE隨筆131012

IQ Test的歷史(下篇) :決定天才或低能的合法劊子手

Thomas執筆

 

7. 智力測驗的高峯

1916年史丹福大學心理學家Lewis Terman改良Binet的測驗,出版了Standford-Binet Intelligence Scale。 它最大的不同之處就是在於引用了德國心理學家William Stern的「智商」概念,將心智年齡除以生理年齡再乘以一百就是他的「智力商數」(Intelligence Quotient)。***

「IQ」一詞作為更容易被人理解的方式,開始被全面推廣起來。這個做法為智力測驗帶來空前的市場成功,人們總是喜歡接受簡單明了的東西,即使它以徧概全。Standford-Binet Intelligence Scale一直不斷被改良,至今已經是第五版了。

它的應用度十分廣泛,第一次世界大戰期間,它被用來進行選取入伍軍人的測驗。 前此檢測新兵經由一對一面試,效率很低,集體智力測驗的好處就在於進行一次過大量篩選。

它也被應用到教育方面,Terman更揚言:「一個孩子的『可教度』(the limits of a child’s educability)可以從他入學第一年的智力測驗中見到端倪。」很多學校把智力測驗作為篩選分班的標準。

有了測量智力的「客觀標準」,優生學者更以為可以知道人們的遺傳智力,於是智力測驗把優生學的執行推至高峰。 1924年一件名為Buck v. Bell的案件,令美國多個州依據此案例通過了 “優生絕育法”***,有紀錄可稽的就有六萬多人因為被界定為弱智而強制絕育。 這段歷史成為了天真的美國人揮之不去的污點。

 

8. 智力測驗再改良

雖然Terman所造的智力測驗在市場上很成功,但還是有行家認為它有很多技術上的問題。 1939年,David Wechsler跟據Standford-Binet Intelligence Test在統計方法上作了改良。 他不再用心智年齡的概念,而是先設定100分為平均值,然後在每一點平均值以上或以下的標準差standard deviation加減15分。標準差位於平均值兩點以為之資優,以下為智障。他開發的智力測驗中文版稱為「韋氏智力測驗」,英文是WAIS(Wechsler Adult Intelligence Scale),兒童版是WISC(Wechsler Intelligence Scale for Children)。現時最新的是第四版,香港心理學會也是採用這個測驗的。

韋氏智力測驗另一個不同的地方是把智商分作兩種類型:語言智商Verbal IQ及操作智商Performance IQ。他對智商持一個比較開放的態度,他認為只代表一些思維能力,而並非優生學者所認為的「唯一重要或至高無上的因素」。他主張還有其他non-intellective的因素影響一個人的能力,他也嘗試測量這些其他因素,只是沒有成功而已。

現時WAIS IV已經更精細,它分為10個副測驗subtest,分別歸類為4個指數:Verbal Comprehension Index (VCI)、Perceptual Reasoning Index (PRI)、Working Memory Index (WMI)、Processing Speed Index (PSI);4個指數又整合為一個Full scale IQ。此外還有另外5個副測驗,專門用以識別一些學習障礙的問題。

 

9. 對智力測驗的批評

A) 智力的定義問題

智力測驗也一直受到很多批評,其中一個重要批評是:心理學家們其實沒有一個清晰和共通的智力概念。

面對這些批評,Terman卻反駁道:「咬定在測量智力之前必須交代什麼是智力,完全沒有必要。…..我們能測量電流,遠早於我們了解什麼是電流。」他雖然沒有說錯,但基於智力理論上的「假說」而執行及推廣的社會政策,卻經已危害到基本人權。而且他們把智力測驗置於一個「至高無上」的地位,作為分辨善惡的標準,早已忘記它只是一個建基於主觀的假說而已,它的應用已超過科學的範疇。

美國心理學會主席Robert J. Sternberg在《智力簡史》一書中用「瞎子摸象」的譬喻指出:「人們探索智力的本質,但不能看到智力的具體,所以他們只好運用隱喻去把智力行為概念化。」 因此心理學家所謂的「測量」與一般的測量大有區別,而人們卻誤以為兩者的客觀性是一致的,這做成了極大的危險。

B) 學習因素

另外一個批評是,智力測驗不能夠準確地找出它所聲稱能測量到的天生遺傳的智力。 在美國《Atkins v. Virginia》案件中,辯方律師以被告有智力障礙為由,引用法案中保護智力低於70者可以免去死刑的權利。

當時心理學家用韋氏三版來測驗被告的智力,測驗結果為59分,本來被告可免死刑。但案件不停地多次上訴,其間再做智力測驗,第二次是64分,最後一次為76分,高於智力障礙的標準。對於這17分的增長有很多不同的解釋,有人認為那是由於多年審訊令被告獲得「學習」,提升了語言及理解能力;也有人認為是重複測驗令被告熟識了題目。不論什麼原因,這事件也反映出,就算天生遺傳的智力是不變的,智力測驗並無法排除學習因素***,進而找出所謂「天生的智力」。

 

C) “Flynn Effect” —- 為何孫兒分數比爺高?

最致命一擊的批評是所謂的〝Flynn Effect〞,它是由紐西蘭政治科學家James Flynn提出的。 他作了一個不同世代的智力分數研究, 採用了Raven’s Progressive Matrics。 這測驗當中的六十條問題是不用文字作答的,因此它被相信為能夠測量最純粹的智力g-factor。 但是研究發現,人們的智商每年都在上升,其中一個例子是三十年來荷蘭士兵的智商平均上升了二十點。此外,Stanford-Binet Intelligence Scale在全球表現中也出現每一世代上升九至十八分的現象。由於遺傳差異不可能全球地、一致地、短期地出現如此大的變化,我們可以相信智力測驗的分數並不能代人們天生遺傳的智力。

Flynn指出:「 心理學家們不應再說IQ Test測量了人的智力。他們應改口說,測量的是『抽象解決問題的能力』(abstract problem-solving ability)。這個術語指出的正好是我們的無知:在IQ測驗中我們要人解決的,都是與生活脫節的問題,或者過分抽象以致不再屬於現實的世界。 解決這種問題的能力也脫離了真正解決生活問題的能力,我們通常稱之為『智慧』intelligence。除此之外,我們所知不多。」

 

10. 總結:客觀與數字

生物學家古爾德Stephen Jay Gould一直反對使用智力測驗作為標準檢測, 針對當時一本鼓吹優生學的書《The Bell Curve》,他寫了一本名為《The Mismeasure of Man》的著作進行反駁。 他認為科學家很多時候使用數字以表客觀,但對數字所作的詮釋卻是主觀的。*** 人們很容易誤以為使用數字就必然代表客觀事實,有些科學家往往忘記了理論所夾雜的主觀假設可能是徧見,智力測驗的失敗正好說明了這點。

原文精闢,以下直接引用作為對智力測驗的歷史總結:

“Science is rooted in creative interpretation. Numbers suggest, constrain, and refute; they do not, by themselves, specify the content of scientific theories. Theories are built upon the interpretation of numbers, and interpreters are often trapped by their own rhetoric. They believe in their own objectivity, and fail to discern the prejudice that leads them to one interpretation among many consistent with their numbers.”

 

參考書目:

《智力測驗的歷史 IQ A smart history of a failed idea》Stephen Murdoch

《了不起的演化論 Evolution: The remarkable history of a scientific theory》 Edward J. Larson

《Intelligence a brief history》 Anna T. Cianciolo and Robert J. Sternberg

《The Mismeasure of Man》 Stephen Jay Gould