การทดสอบสมมติฐานโดยใช้สถิติทดสอบที หรือเรียกว่า T-test เป็นการทดสอบที่ช่วยในการเปรียบเทียบค่าเฉลี่ยของชุดข้อมูลสองชุด และพิจารณาว่าชุดข้อมูลเหล่านี้เป็นประชากรกลุ่มเดียวกันหรือต่างกัน T-test จะถูกเปรียบเทียบกับค่าวิกฤตที่ได้รับจากตารางแจกแจง T
การแจกแจงแบบที (t-distribution) คิดค้นโดย William Sealy Gosset ในปี 1908 โดยใช้นามปากกาว่า Student เพราะว่าเขาทำงานในโรงเบียร์กินเนส เพื่อไม่ให้ความลับในโรงงานรั่วไหลออกไป
William Sealy Gosset ได้เขียนบทความลงในวารสารวิชาการ Biometrika ชื่อบทความ The probable error of the mean เกี่ยวกับการค้นพบ t-distribution จึงมีชื่อเต็มว่า Student’s t-distribution
รูปแบบของ T-Test
T-test มี 3 แบบดังนี้
- การทดสอบค่าเฉลี่ยของกลุ่มตัวอย่าง 1 กลุ่ม (One-sample test)
- การทดสอบค่าเฉลี่ยของกลุ่มตัวอย่าง 2 กลุ่มที่เป็นอิสระจากกัน (Independent sample t-test)
- การทดสอบค่าเฉลี่ยของกลุ่มตัวอย่าง 2 กลุ่มที่ไม่เป็นอิสระจากกัน (Paired samples t-test หรือ Dependent sample t-test)
1. การทดสอบค่าเฉลี่ยของกลุ่มตัวอย่าง 1 กลุ่ม (One-sample test)
การทดสอบค่าเฉลี่ยของกลุ่มตัวอย่าง 1 กลุ่ม ตัวอย่างเช่น
- ผลสัมฤทธิ์ทางการเรียนของนักเรียนชั้นมัธยมศึกษาปีที่ 1 หลังจากที่ได้รับการสอน สูงกว่าเกณฑ์ร้อยละ 70
- นักวิจัยต้องการทดสอบว่าคะแนน IQ เฉลี่ยของกลุ่มนักเรียนแตกต่างจาก 100 หรือไม่
- ผู้ผลิตธัญพืชสามารถนำตัวอย่างกล่องจากสายการผลิต และตรวจสอบว่าน้ำหนักเฉลี่ยของกลุ่มตัวอย่างแตกต่างจาก 1.3 ปอนด์ที่ ที่ระดับความเชื่อมั่น 95% หรือไม่
ใช้สูตร
$$t=\frac{\bar{x}-\mu_0}{\frac{\sigma}{\sqrt{n}}}$$
โดยที่:
$\bar{x}$ แทน ค่าเฉลี่ยของกลุ่มตัวอย่าง
$\mu_0$ แทน ค่าเฉลี่ยที่ใช้เป็นเกณฑ์
เช่น 1) ต้องการเทียบรายได้ต่อเดือนของประชากรในหมู่บ้านที่มีรายได้เฉลี่ยต่อเดือนเป็น 9,000 บาท จะได้ $\mu_0=9000$
2) ต้องการเทียบค่าเฉลี่ยการทดสอบหลังเรียนกับเกณฑ์ไว้ที่ 70% ของคะแนนเต็ม 30 คะแนน จะได้ $\mu_0=30×70\%=21$
$\sigma$แทน ส่วนเบี่ยงเบนมาตรฐาน
$n$ แทน จำนวนกลุ่มตัวอย่าง
2. การทดสอบค่าเฉลี่ยของกลุ่มตัวอย่าง 2 กลุ่มที่เป็นอิสระจากกัน (Independent sample t-test)
การทดสอบค่าเฉลี่ยของกลุ่มตัวอย่าง 2 กลุ่มที่เป็นอิสระจากกัน เช่น
- ผู้ป่วยที่มีความดันโลหิตสูงจะได้รับการสุ่มให้อยู่ในกลุ่มยาหลอกและกลุ่มการรักษา ผู้ที่ได้รับยาหลอกจะได้รับยาที่ไม่ได้ออกฤทธิ์ และผู้ที่ได้รับยาจะได้รับยาใหม่ที่คาดว่าจะลดความดันโลหิตได้ หลังจากที่อาสาสมัครได้รับการรักษาเป็นเวลาสองเดือนจะมีการใช้การทดสอบที สองตัวอย่างเพื่อเปรียบเทียบความดันโลหิตเฉลี่ยของกลุ่มยาหลอกและกลุ่มที่ได้รับการรักษา ผู้ป่วยแต่ละรายจะถูกวัดหนึ่งครั้งและอยู่ในกลุ่มเดียว
กรณีที่ความแปรปรวนเท่ากัน σ12 = σ22 ใช้สูตร
$$t = \frac{\bar{x}_{1} – \bar{x}_{2}}{s_{p}\sqrt{\frac{1}{n_{1}} + \frac{1}{n_{2}}}}$$
และ
$$s_{p} = \sqrt{\frac{(n_{1} – 1)s_{1}^{2} + (n_{2} – 1)s_{2}^{2}}{n_{1} + n_{2} – 2}}$$
กรณีความแปรปรวนไม่เท่ากัน ใช้สูตร
$$t = \frac{\bar{x}_{1} – \bar{x}_{2}}{\sqrt{\frac{s_{1}^{2}}{n_{1}} + \frac{s_{2}^{2}}{n_{2}}}}$$
จากนั้นนำค่า t ที่คำนวณได้ ไปเปรียบเทียบกับค่าวิกฤตที่ระดับความเป็นอิสระ (Degree of freedom: df)
$$\text{df} = \frac{ \left ( \frac{s_{1}^2}{n_{1}} + \frac{s_{2}^2}{n_{2}} \right ) ^{2} }{ \frac{1}{n_{1}-1} \left ( \frac{s_{1}^2}{n_{1}} \right ) ^{2} + \frac{1}{n_{2}-1} \left ( \frac{s_{2}^2}{n_{2}} \right ) ^{2}}$$
3. การทดสอบค่าเฉลี่ยของกลุ่มตัวอย่าง 2 กลุ่มที่ไม่เป็นอิสระจากกัน (Paired samples t-test หรือ Dependent sample t-test)
การทดสอบค่าเฉลี่ยของกลุ่มตัวอย่าง 2 กลุ่มที่ไม่เป็นอิสระจากกัน หรือสัมพันธ์กัน เช่น
- การทดสอบผลสัมฤทธิ์ทางการเรียนของกลุ่มที่ได้รับการสอนแบบใหม่ กับกลุ่มที่ได้รับการสอบแบบเดิม
- การทดสอบคะแนนก่อนเรียนและหลังเรียน
- การศึกษาเกี่ยวกับความดันโลหิตสูงของผู้ป่วยทั้งหมด โดยถูกวัดตั้งแต่เริ่มต้นการศึกษา และวัดหลังให้การรักษา
คำนวณได้จากสูตร
$$t = \frac{\overline{\text{D}}}{\frac{\text{S}_\text{D}}{\sqrt{n}}}$$
โดยที่:
$\overline{D}$ แทน ค่าเฉลี่ยของความแตกต่าง หรือค่าเฉลี่ยของคะแนนก่อนเรียน-หลังเรียน
$\text{S}_\text{D}$ แทน ส่วนเบี่ยงเบนมาตรฐานของความแตกต่าง
$n$ แทน จำนวนตัวอย่าง
เมื่อ $\overline{\text{D}}=\frac{\sum {\text{D}}}{n}$ และ $\text{S}_{\text{D}}=\sqrt{\frac{n\sum D^{2}-(\sum D)^{2}}{n(n-1)}}$ สามารถแปลงสูตรเพื่อให้ง่ายต่อการคำนวณได้ดังนี้
\begin{align}
t & = \frac{\overline{\text{D}}}{\frac{\text{S}_{\text{D}}}{\sqrt{n}}} \\
& = \frac{\frac{\sum D}{n}}{\frac{\sqrt{\frac{n\sum D^{2}-(\sum D)^{2}}{n(n-1)}}}{\sqrt{n}}} \\
& = \frac{\sum D}{\frac{{\sqrt{n^{2}}}\cdot \sqrt{\frac{n\sum D^{2}-(\sum D)^{2}}{n(n-1))}}}{\sqrt{n}}} \\
& = \frac{\sum D}{\sqrt{n}\cdot \sqrt{\frac{n\sum D^{2}-(\sum D)^2}{n(n-1)}}} \\
& = \frac{\sum D}{\sqrt{\frac{n\cdot (n\sum D^{2}-(\sum D)^2)}{n(n-1)}}} \\
& = \frac{\sum D}{\sqrt{\frac{n\sum D^{2}-(\sum D)^2}{n-1}}}\end{align}
จากนั้นนำค่า T ที่คำนวณได้ ไปเทียบกับค่าวิกฤต T (T critical) ในตาราง ที่ df=n-1 โดยค่า t ที่คำนวณได้จากกลุ่มตัวอย่าง
- ถ้าค่า T ที่คำนวณได้ น้อยกว่า T ในตาราง จะยอมรับ H₀
- ถ้าค่า T ที่คำนวณได้ มากกว่า T ในตาราง จะปฏิเสธ H₀ ยอมรับ H₁