1. 首頁
  2. 考試

淺談考試成績的差異顯著性分析

淺談考試成績的差異顯著性分析

淺談考試成績的差異顯著性分析

【摘 要】本文嘗試運用數理統計學中的顯著性檢驗的基本思想和常用的excel軟體簡單介紹了考試成績中班級之間、校際之間的平均分、優秀率、及格率的差異顯著性檢驗,即U檢驗的計算方法與主要步驟;以及教改結題報告的成績分析涉及各種檢驗方法——T檢驗、Z檢驗的區別及計算方法、主要步驟。簡單而言,本文是用統計學中的檢驗方法科學地分析什麼情況下兩個平均分、優秀率、及格率“差別不大”,“差別明顯”,“差很多”,希望能更加科學客觀地分析兩個均值間的差異,對有需要的老師有所幫助。

【關鍵詞】成績差異;U檢驗;T檢驗;excel軟體

一、引言

在每次考試成績統計中,平均分、及格率、優秀率依然是一個班級教學的主要考核指標,但由於這樣或那樣的原因,可能會有些學生缺考。特別是近年我市實行了中職技校春季招生政策,某些學校分流人數也許過半。如何才能科學地公平地進行統計分析,也是許多從事成績分析與管理的老師面臨的難題。

另外,在教改結題報告或階段性小結中,總要會對教改效果進行分析,也就難免對對比班與實驗班的考試成績中平均分、及格率、優秀率等資料作顯著性檢驗,來比較教改的效果是否明顯或不明顯。看了不少結題報告,其中涉及到的檢驗方法如U檢驗,Z檢驗,T檢驗等等,不一而足,讓人摸不著頭腦。即便是數學教師,由於在大學就讀時的教學內容側重點有所不同,或許對數理統計方面知識掌握不強,也很難明白這些檢驗方法孰是孰非,孰優孰劣,更別說非專業其它科目的教師。在作成績對比分析時,通常無從下手,或是委託統計能力強的老師幫忙,或是隨意給些似是而非的資料,抑或羅列考試成績,直接對比,不作任何檢驗,也就缺乏科學嚴謹性。

二、班、級考試成績差異顯著性分析

有些學校以班和年級考試人數與註冊人數比值作為相對係數對實考的分數進行了調整,其大致演算法是:年級在冊人數為N,缺考R人,某班在冊人數為n,缺考r人,則相對係數為[(n-r)/n]/[(N-R)/N],用此係數乘以該班實際考試成績,即為相對成績,然後再以各班的相對成績進行對比。這或許是一種方法,但這種調整,會對實考的成績進行了放大或縮小,個人認為沒有多少益處。事實上,一個班級本身或許也有人缺考,只不過沒別班那麼多,但平均分調整後可能偏離很多。

例1:一所學校九年級4個班,每個班註冊人數均為50,在一次考試中,某班平均分60,缺考20人,全級缺考100人,按上述方法折算該班平均分。解: =60*[(50-20)/50]/[(200-100)/200]=72,這是不科學的,也沒有什麼意義。

1、樣本均值與總體均值差異顯著性檢驗(U檢驗)

要檢查班級之間成績是否相差太大,目的並不是要排出名次,可以採用U檢驗(有些文章也稱Z檢驗,在ecxel軟體中,相應的變數也是Z。為避免與下文混淆,只有總體方差未知,本文方用Z檢驗,且二者計算不同,故此不用此名稱)。U檢驗的條件是:已知(或可以求出)樣本均值、樣本容量與總體均值、總體的標準差,可能採用U檢驗進行兩均值異顯著性檢驗。

統計學認為,不論x變數(考試分數)是連續型還是離散型,也無論x服從何種分佈,一般只要樣本容量(考試人數)n>20,就可認為平均值 的分佈是正態的, ,則 ,服從標準正態分佈,這就是進行U檢驗的理論依據。U檢驗主要步驟如下:

第一步,建立虛無假設,即先認為兩者沒有差異,用 表示

第二步,計算u統計量

U檢驗的統計量為 ,其中,

(a) = ( 為該班每一個學生的分數)是要檢驗班的平均分,excel軟體的公式為:=AVERAGE(該班的成績區域);

(b) = ( 為年級每一個學生的分數)是年級平均分,excel軟體的公式為:=AVERAGE(年級的成績區域);

(c) 為標準誤, 年級標準差,計算公式是 = excel軟體的公式為:=STDEV(年級的成績區域);

(d)n為該班人數,excel軟體的公式為:=COUNT(該班的成績區域)。以上的資料均由學生考試成績表統計得到。

從u統計量式子中我們看到,在兩個平均分的差值進行標準化過程中,u值要受到年級標準差σ該班人數n影響。一般而言,就一次考試中n相對穩定,經開方後值更小,影響不大;而u值與σ成反比,換句話說,年級中各人成績離散程度越大,兩個平均分差值的差異就越不顯著。

第三步,設定顯著水平ɑ,查表或計算接受域

檢驗前必須設定顯著水平ɑ,這是一個小機率數值,經常會選擇ɑ=0.05,此時置信度1-ɑ=0.95,也即檢驗的結果有95%可靠性,有5%的不可靠,這個誤差可能是由於偶然性造成的。在許多研究領域,0.05通常被認為是可接受錯誤的邊界水平。如果有必要,也可選擇ɑ=0.01,0.02等,使檢驗結果準確。由於標準正態分佈圖像是關於縱軸兩邊對稱的,0.95對應的置信區間佔據中間部分,而兩側共佔0.05,一側則佔0.025,所以在計算或查表時,應以1-ɑ/2作為引數進行。如顯著性水平ɑ=0.05,則查表或計算的是1-0.05/2=0.975對應的置信區間,excel軟體的計算公式為:=NORMSINV(0.975),回車後得1.959963985,一般取近似數1.96。由於影象對稱性,確定的置信區間為(-1.96,1.96),以這個區間為接受域。若令ɑ=0.01,則接受域(-2.578,2.578)。

第四步,觀察統計量u值是否落在接受區域 ,由此對樣本均值與總體均值作出顯著性差異判斷。如果u統計量在置信區間 (-1.96,1.96)內,接受H0,差異不顯著,否則拒絕H0,差異顯著;如果u統計量不在置信區間 (-2.578,2.578)內,則差異非常顯著。

例2.甲班某次參加考試36人,平均分66,年級平均分60,標準差為20分,檢驗甲班平均分與年級平均分是否有顯著性差異。 解:把相關資料代入 ,所以無顯著性差異。有些人認為相差5分就差很多,看來也是不科學的。

2、標準分的計算

由於標準分是綜合個體與總體分數排位等因素計算而來,因此標準分本身是經過差異分析得到的數值。值得一提的是,在計算高考或中考標準分中,excel的NORMSINV函式作用非常大,不用查標準正態分佈表,而且數值十分精確。換算公式T=100Z+500,其中Z=NORMSINV(Pi), Pi為某名次以下的人數佔考生總數的.百分比,相當於1-ɑ/2。例如10000人考試,則第1名的標準分為T=100Z+500= 100*NORMSINV(9999/ 10000)+500 872。

3、班、級的及格率、優秀率的檢驗

在成績分析時,及格率、優秀率也可以像平均分一那樣進行顯著性差異檢驗,那麼這兩項該如何進行呢?難點在於標準差怎麼求。

其實,從公式看:平均分、及格率、優秀率三個資料的分母均為考試人數,三者均為平均值。平均分是每個人的分數之和/考試人數,由於每個人都會有一個分數,直接相加可得。那麼及格率呢?表面看是及格率=及格人數/考試人數,在計算時,其實將每個人分數稍作處理:將達到及格的分數改為1,沒達到的改為0,excel軟體中可用公式=if(Ai>=60,1,0)及填充柄下拉簡單得到,Ai為每個原始分數所在單元格,然後對轉換後的資料求平均值(即及格率)與標準差了。然後把班、級的及格率代入u統計量式子中計算u值。優秀率也用相方法處理即可。

例2.乙班某次考試成績如下:

87 64 71 81 75 72 87 46 54 61 50 42 65 50 79

72 43 68 64 64 60 48 87 48 52 56 54 50 48 62

92 70 82 53 82 73 75 72 68 70

求此次考試的及格率及對應的標準差。

解:按及格分數為1,不及格分數為0轉換後為:

1 1 1 1 1 1 1 0 0 1 0 0 1 0 1

1 0 1 1 1 0 0 1 0 0 0 0 0 0 1

1 1 1 0 1 1 1 1 1 1

可以求出這組資料的平均值即及格率為=26/40=65%,標準差為S= =0.483。

年級的優秀率與及對應的標準差也如法炮製,再進一步如平均分一樣代入u統計量式子中計算就可以進行分析檢驗。需要指出的是,有些資料計算方法並非如此,這可能是轉換後的結果只有0、1兩個,不少人會認為這組資料服從兩點分佈或二項分佈,所以按兩點分佈求方差S2=p(1-p),在這裡p可以是及格率或優秀率,像上例S= =0.4770,出入比較大,很明顯這並不是兩點分佈。我認為每個人及格記1分,不及格記0分,班級的“平均數”就是及格率或優秀率,這樣理解更自然,按上例方法求標準差及進行檢驗可能更科學。

4、U檢驗運用條件

在已知樣本均值、樣本容量及總體的均值及總體的標準差,在每次考試中,這幾個資料還是比較容易得到的,u統計量服從標準正態分佈,即可以進行U檢驗。U檢驗涉及的計算較為簡單,把以上四個引數代入公式即得u統計量(如果u值為負則取絕對值),然後與臨界值比較,一般以1.96或2.578為臨界值,不再另外查表或計算,就可以分析樣本均值與總體均值是否具有顯著性差異,所以U檢驗在諸多領域運用廣泛。

三、教改結題報告中的成績分析(T檢驗,Z檢驗)

一般而言,教改成績就是實驗班與對比班兩個班的成績比較,能否僅憑這兩個班的平均分、優秀率、及格率的差值,立即得出教學效果是否明顯呢?統計學認為,這樣得出的結論是不可靠的,因為一個班的平均分具有統計意義,存在抽樣誤差,此資料是在一定範圍內波動的,故而我們需要進行顯著性差異檢驗。由於一個班多則也就50多人,少則也有20多人;所以每個班都可以看成一個樣本,兩個班就可看成從兩個總體中抽取出來的雙樣本,一個總體是實施了教改的,一個是沒有實施教改的。當然,這兩個總體在這種情形下更多是虛擬的,它們具體的一些資料(平均分,方差等)我們是無從知曉的,也就沒有辦法直接研究,只能透過研究樣本(即實驗班及對比班成績),由樣本的資料對總體進行估計,並進行差異顯著性檢驗,才能作出判斷。

1、Z檢驗與T檢驗的區別

不少文章對Z檢驗還是T檢驗這兩種方法作出了說明,兩個總體均值的差異顯著性檢驗中,在不知總體方差及均值情況下且統計量服從t分佈,可以使用Z檢驗或T檢驗。如果樣本容量n大於30,用Z檢驗,如果樣本容量n小於30,則用t檢驗,在這裡樣本容量n即為該班人數。很明顯,正如前文所說,一個班的人數一般都在30人之上,可以用Z檢驗。但假如一個班30人以下,另一班30人以上那怎麼辦?其實在計算機廣泛應用計算的今天,不管樣本容量n是多少,哪種檢驗都是可以使用的,且各種檢驗的基本原理是相同的。下面,不妨先了解這兩種檢驗方法的統計量。

首先,不論哪種檢驗都要用到以下資料:

(a)兩個班的平均分: ;

(b)兩個班的考試人數: ;

(c)兩個班的成績的方差 ,應用excel軟體的公式為=var(該班的成績區域),數量上,方差=標準差的平方。

t檢驗或z檢驗的主要步驟:

第一步,建立虛無假設,即先認為兩者沒有差異,用 表示

第二步:計算Z檢驗或T檢驗統計量

z= ①,t= ②(大分母部分稱為標準誤)。式子中, 是兩個班的平均分, , 是兩個班分數的方差, 是兩個班考試人數。從函式單調性而言,不論z或t,與u值類似,當兩班的方差增大時,其值減小,即兩班均分所代表的兩總體的均值的差值差異性也到受成績離散程度影響。

另外,從式子結構看,t統計量要複雜很多,這在計算工具落後的過去,這個計算當然是很繁瑣的。想當初,手中可能連計算器都沒有,開個方都可能需要手算。據說數學家陳景潤證明“1+2”時所用的草稿紙真的達到汗牛充棟地步,可堆滿房子,如果換了今天,估計他的稿紙也許高不盈尺。所以我們可以認為,Z檢驗其實只是T檢驗的粗略計算而已,二者其實都可使用,只是t值過程稍複雜,但應更精確。 第三步 查表或計算臨界值

在不知總體方差情形下,兩個平均值差服從t分佈,查表或計算t臨界值要有兩個引數,顯著水平ɑ,及自由度df。如果考查一個班,d ,如果進行兩個班對比,自由度d 。計算臨界值 ,excel軟體中公式為:=TINV(ɑ,df),若令ɑ=0.05,自由度從30至120,臨界值 都約為2,詳見下表:

自由度df 30 40 50 60 70 80 90 100 110 120

臨界值t0 2.042 2.021 2.009 2.000 1.994 1.990 1.987 1.984 1.982 1.980

而兩個班的人數基本上也在這個幅度內,像U檢驗一樣,根據原始資料算出的t值與臨界值 進行比較,為了簡化運算, 可以取近似數2。

同樣,在差異顯著情形下,非要區別出相差很多,以令ɑ=0.01,自由度30至120主要的臨界值 如下:

自由度df 30 40 50 60 70 80 90 100 110 120

臨界值t0 2.750 2.704 2.678 2.660 2.648 2.639 2.632 2.626 2.621 2.617

第四步 比較t值或z值與 ,作出統計推斷

與u檢驗類似,比較計算出來的t值或z值與臨界值 ,如果|t|< =2或|z| < =2,則認為要檢驗的兩個樣本均值差異不明顯,否則差異顯著。

在報告中,不妨將各次考試成績計算出來的t值用表格與圖表形式展示出來,這樣使資料條理更加清晰,也會使得內容更豐富,生動。

例3.某次考試原始成績(滿分100)如下:

實驗班30人:

90 54 56 84 78 84 78 78 82 50 82 76 80 56 80

80 76 78 68 70 60 64 68 50 70 72 47 68 74 72

對比班40人:

70 72 72 54 66 64 90 68 50 62 60 54 50 95 56

52 60 50 52 50 60 62 87 48 52 56 54 50 48 48

66 62 70 70 82 60 64 64 62 58

經計算得,實驗班平均分 ,方差 =132.3,對比班平均分 ,方差 =135.2;分別代入Z統計量及T統計量式子中得

z= = =3.255,

t=

= =3.25,二者差別不大,均大於臨界值 =2,所以可以認為教改驗效果明顯。

2、及格率、優秀率的檢驗

很多教改老師在成績分析時,主要是對實驗班及對比班的平均分進行顯著性差異檢驗,而及格率或優秀率的檢驗則很少人涉及,這或許不夠全面。與U檢驗一樣,對分數稍作轉換,然後對處理後的兩組資料像平均分顯著性檢驗方法一樣進行計算。

例3.如上述例子,作及格率差異顯著性分析,及格的分數改為1,不及格的改為0,則兩個班的分數表為:

實驗班30人:

1 0 0 1 1 1 1 1 1 0 1 1 1 0 1

1 1 1 1 1 1 1 1 0 1 1 0 1 1 1

對比班40人:

1 1 1 0 1 1 1 1 0 1 1 0 0 1 0

0 1 0 0 0 1 1 1 0 0 0 0 0 0 0

1 1 1 1 1 1 1 1 1 0

算得實驗班及格率: =80%,方差 0.251;對比班及格率: =57.5%,方差 0.166,代入式子

=2.01>2,同樣及格率的檢驗差異顯著性是明顯的。同樣方法也可以對優秀率進行檢驗。由於可以在excel表直接列表中用填充柄,計算極方便,此處不再贅言。

3、前後兩階段成績自身對比分析

如果說,實驗班與非實驗班的成績對比是橫比的話,那麼自身兩次成績的對比則是縱比。教改實驗從開始接手到結束是一個過程,加上一個班學生的成績也是一個動態變化,反映在教改期間的每一次在考試成績,所以很有必要進行前後兩階段成績自身對比分析。

其檢驗方法是:對每一名學生兩次成績求差, ,然後以所有的差作為樣本資料進行分析。

統計量為 ,其中 為這組資料的標準差。

例4.如例1中實驗班成績為:

90 54 56 84 78 84 78 78 82 50

82 76 80 56 80 80 76 78 68 70

60 64 68 50 70 72 47 68 74 72

而前一次考試成績為:

87 52 55 83 84 81 71 76 81 54

80 76 80 54 78 77 74 72 65 74

62 63 68 44 71 68 45 66 73 75

對應位置的兩個資料為同一名學生兩次成績,對這兩次成績平均分的進行差異顯著性檢驗。

解:兩組對應位置的資料求差得:

3 2 1 1 -6 3 7 2 1 -4

2 0 0 2 2 3 2 6 3 -4

-2 1 0 6 -1 4 2 2 1 -3

計算得, =1.2 =2.93 df=30-1=29,計算 =2.045, 差異性顯著,所以可以作出結論:教改效果明顯。

同樣,與平均分、及格率,優秀率一樣,透過對動態的差值計算的t值也可以透過表格與圖表表示出來,說明教改中實驗班與對比班成績差異是否顯著,教學效果是否明顯。

綜上所述,在教改成績分析中,不但要檢驗實驗班與對比班的平均分差異顯著性,還可以對兩班及格率、優秀率差值進行檢驗,甚至對同一個班前後幾次成績進行檢驗,這樣方能更科學地分析教改成效。

四、差異顯著性分析的意義

不管是U檢驗還是T檢驗或其它檢驗,其計算方法都是兩個均值的差除以標準誤,然後與臨界值比較,U檢驗的臨界值 ,T檢驗的臨界值在ɑ=0.05,自由度30至100時 ,然後作出差異顯著性判斷。超過甚至遠遠超過這個臨界點是我們每一位教師所追求的目標。但是現實中,大多教師是達不到這個目標的,原因有很多,因篇幅關係此處不作分析,我想既然是教學改革是實驗,當然就會存在失敗,這是客觀現象。我們應該更在乎過程,所以在成績分析時,也就沒有必要更改原始分數,非要達到“效果顯著”。

以上筆者試圖用統計知識,簡單介紹了考試成績中班級之間乃至校際之間的平均分、優秀率、及格率與的差異顯著性檢驗,以及教改結題報告的成績分析涉及各種檢驗方法,以期能對有需要的老師有所幫助,只是限於本人水平匱乏,文中必有許多不足之處,敬請各位給予指正為謝。

參考文獻:

[1] 佚名《Excel常用函式大全》

[2] 邢航《獨立樣本均數差異的顯著性檢驗及應用》 《中國集體經濟》 2008年第6期

[3] 鄭巧玲 何以平 《醫學論文中t檢驗誤用分析》 《中國科技期刊研究》2004年01期

[4] 《平均數差異顯著性檢驗統計檢驗力和效果大小的估計原理與方法》