- ·上一篇內容:使用R語言進行單樣本t檢驗
- ·下一篇內容:使用R語言進行線性相關分析
使用R語言對兩獨立樣本進行t檢驗
1、什么是兩獨立樣本t檢驗
根據樣本數據對兩個樣本來自的兩個獨立總體的均值是否有顯著差異進行判斷。
2、使用的前提條件
(1)兩個樣本應該是相互獨立的;
(2)樣本來自的兩個總體應該服從正態分布。
3、問題描述
設總體x1服從正態分布N(μ1,σ12),總體x2服從正態分布N(μ2,σ22),分別從兩個總體中抽取兩組樣本:(X11,x12,...,x1m)和(x21,x22,...,x2n),且兩個樣本相互獨立。則檢驗μ1和μ2是否有顯著性差異。
檢驗方法:
(1)提出假設
H0:μ1 = μ2
H1:μ1 ≠ μ2
(2)建立檢驗統計量
一般分兩種情況,方差齊而未知;另外一種情況兩總體方差不齊而未知。這兩種情況計算統計量t的方法不同。所以在實際中應判斷一下兩獨立總體的樣本方差是否相等,并選擇不同的方法來判斷。
(3)計算檢驗統計量的觀測值和p值
(4)在給定的顯著性水平上做出判斷決策
4、R語言中進行兩個獨立樣本t檢驗的方法
在R語言中使用t.test()函數可以實現對兩個獨立樣本的t檢驗。
t.test()函數的使用形式可以參見本站中的文章《使用R語言進行單樣本t檢驗》中關于t.test()函數的介紹。
5、R語言中進行兩個獨立樣本t檢驗舉例
(1)使用甲乙兩臺機床來加工同種零件,兩種機床加工零件的尺寸服從正態分布,且方差相同,為檢驗甲乙兩臺機床加工的零件尺寸均值是否一致(α=0.05),從兩種機床加工的零件中分別抽取若干零件測得的其尺寸如下:
甲:20.5,19.8,19.7,20.4,20.1,20.0,19.0,19.9
乙:20.7,19.8,19.5,20.8,20.4,19.6,20.2
在R中編寫程序如下:
#甲機床加工數據
x1<-c(20.5,19.8,19.7,20.4,20.1,20.0,19.0,19.9)
#乙機床加工數據
x2<-c(20.7,19.8,19.5,20.8,20.4,19.6,20.2)
#進行兩樣本t檢驗,指定方差相等
t.test(x1,x2,var.equal=T)
計算結果如下圖所示:
從計算結果來看,t=-0.85485,p-value=0.4081,由于計算的p值>0.05,則不能拒絕原假設,即認為兩臺機床加工零件的尺寸均值沒有顯著性區別,也即認為均值相同。同時結果也給出了兩臺機床加工零件尺寸樣本數據的均值分別為:19.925和20.14286。
由于題目中給出了兩臺機床的方差相同,所以這里在使用t.test()函數進行檢驗時,指定了參數var.equal=T.
(2)為了檢驗兩種供熱設備的能耗是否相同。測量兩種設備(電動氣閘和熱活化氣閘)的能耗數據如下 。您要確定是否有證據證明這兩種設備之間的差值不為零,以比較出這兩種設備的功效。
數據如下:
熱活化氣閘數據:
13.07,7.6,3.2,9.28,9.73,11.73,9.67,10.76,11.05,17.63,15.58,12.53,11.87,14.19,6.84,11.89,7.41,7.42,
10.83,9.44,12.94,13.15,11.69,7.73,11.94,13.62,17.07,14.66,9.56,12.37,8.33,8.67,11.27,11.67,9.37,8.93,
8.41,12.85,5.27,10.02,7.87,11.82,14.42,13.69,10.77,15.26,14.53,6.84,10.92,13.05
電動氣閘數據:
8.25,9.66,8.33,8.82,12.06,9.67,17.51,10.79,13.59,7.99,12.64,14.42,9.25,7.79,
11.29,10.26,9.46,14.77,7.21,4.29,9.81,8.41,6.78,16.3,9.01,11.41,12.37,13.28,7.24,
10.55,13.89,10.72,9.22,10.61,10.04,10.2,20.55,11.75,7.08,5.5
在R中編寫程序如下:
#熱活化氣閘數據
x1<-c(13.07,7.6,3.2,9.28,9.73,11.73,9.67,10.76,11.05,17.63,15.58,12.53,11.87,
14.19,6.84,11.89,7.41,7.42,10.83,9.44,12.94,13.15,11.69,7.73,11.94,13.62,17.07,
14.66,9.56,12.37,8.33,8.67,11.27,11.67,9.37,8.93,8.41,12.85,5.27,10.02,7.87,
11.82,14.42,13.69,10.77,15.26,14.53,6.84,10.92,13.05)
#電動氣閘數據
x2<-c(8.25,9.66,8.33,8.82,12.06,9.67,17.51,10.79,13.59,7.99,12.64,14.42,9.25,
7.79,11.29,10.26,9.46,14.77,7.21,4.29,9.81,8.41,6.78,16.3,9.01,11.41,12.37,
13.28,7.24,10.55,13.89,10.72,9.22,10.61,10.04,10.2,20.55,11.75,7.08,5.5)
#若方差相等
t.test(x1,x2,var.equal=T,conf.level=0.95)
#若假定方差不等
t.test(x1,x2,var.equal=F)
假定方差相等時的運行結果如下:
假定方差不等時的運行結果如下:
從上面兩個運行結果來看,p值都大于0.05,則可以認為兩種供暖設備的能耗在統計上沒有顯著區別。
在實際中可以使用R語言提供的相關函數(如var.test())對兩組數據的方差齊次性進行檢驗,以便選擇使用不同的方法進行檢驗。