การทดตรวจสอบสมมติฐานโดยใช้สถิติทดสอบที (T-test)

การทดสอบสมมติฐานโดยใช้สถิติทดสอบที หรือเรียกว่า T-test เป็นการทดสอบที่ช่วยในการเปรียบเทียบค่าเฉลี่ยของชุดข้อมูลสองชุด และพิจารณาว่าชุดข้อมูลเหล่านี้เป็นประชากรกลุ่มเดียวกันหรือต่างกัน T-test จะถูกเปรียบเทียบกับค่าวิกฤตที่ได้รับจากตารางแจกแจง T

การแจกแจงแบบที (t-distribution) คิดค้นโดย William Sealy Gosset ในปี 1908 โดยใช้นามปากกาว่า Student เพราะว่าเขาทำงานในโรงเบียร์กินเนส เพื่อไม่ให้ความลับในโรงงานรั่วไหลออกไป

William Sealy Gosset ได้เขียนบทความลงในวารสารวิชาการ Biometrika ชื่อบทความ The probable error of the mean เกี่ยวกับการค้นพบ t-distribution จึงมีชื่อเต็มว่า Student’s t-distribution

รูปแบบของ T-Test

T-test มี 3 แบบดังนี้

  1. การทดสอบค่าเฉลี่ยของกลุ่มตัวอย่าง 1 กลุ่ม (One-sample test)
  2. การทดสอบค่าเฉลี่ยของกลุ่มตัวอย่าง 2 กลุ่มที่เป็นอิสระจากกัน (Independent sample t-test)
  3. การทดสอบค่าเฉลี่ยของกลุ่มตัวอย่าง 2 กลุ่มที่ไม่เป็นอิสระจากกัน (Paired samples t-test หรือ Dependent sample t-test)

1. การทดสอบค่าเฉลี่ยของกลุ่มตัวอย่าง 1 กลุ่ม (One-sample test)

การทดสอบค่าเฉลี่ยของกลุ่มตัวอย่าง 1 กลุ่ม ตัวอย่างเช่น

  • ผลสัมฤทธิ์ทางการเรียนของนักเรียนชั้นมัธยมศึกษาปีที่ 1 หลังจากที่ได้รับการสอน สูงกว่าเกณฑ์ร้อยละ 70
  • นักวิจัยต้องการทดสอบว่าคะแนน IQ เฉลี่ยของกลุ่มนักเรียนแตกต่างจาก 100 หรือไม่
  • ผู้ผลิตธัญพืชสามารถนำตัวอย่างกล่องจากสายการผลิต และตรวจสอบว่าน้ำหนักเฉลี่ยของกลุ่มตัวอย่างแตกต่างจาก 1.3 ปอนด์ที่ ที่ระดับความเชื่อมั่น 95% หรือไม่

ใช้สูตร

$$t=\frac{\bar{x}-\mu_0}{\frac{\sigma}{\sqrt{n}}}$$

โดยที่:

$\bar{x}$ แทน ค่าเฉลี่ยของกลุ่มตัวอย่าง
$\mu_0$ แทน ค่าเฉลี่ยที่ใช้เป็นเกณฑ์
เช่น 1) ต้องการเทียบรายได้ต่อเดือนของประชากรในหมู่บ้านที่มีรายได้เฉลี่ยต่อเดือนเป็น 9,000 บาท จะได้ $\mu_0=9000$
2) ต้องการเทียบค่าเฉลี่ยการทดสอบหลังเรียนกับเกณฑ์ไว้ที่ 70% ของคะแนนเต็ม 30 คะแนน จะได้ $\mu_0=30×70\%=21$
$\sigma$แทน ส่วนเบี่ยงเบนมาตรฐาน
$n$ แทน จำนวนกลุ่มตัวอย่าง

2. การทดสอบค่าเฉลี่ยของกลุ่มตัวอย่าง 2 กลุ่มที่เป็นอิสระจากกัน (Independent sample t-test)

การทดสอบค่าเฉลี่ยของกลุ่มตัวอย่าง 2 กลุ่มที่เป็นอิสระจากกัน เช่น

  • ผู้ป่วยที่มีความดันโลหิตสูงจะได้รับการสุ่มให้อยู่ในกลุ่มยาหลอกและกลุ่มการรักษา ผู้ที่ได้รับยาหลอกจะได้รับยาที่ไม่ได้ออกฤทธิ์ และผู้ที่ได้รับยาจะได้รับยาใหม่ที่คาดว่าจะลดความดันโลหิตได้ หลังจากที่อาสาสมัครได้รับการรักษาเป็นเวลาสองเดือนจะมีการใช้การทดสอบที สองตัวอย่างเพื่อเปรียบเทียบความดันโลหิตเฉลี่ยของกลุ่มยาหลอกและกลุ่มที่ได้รับการรักษา ผู้ป่วยแต่ละรายจะถูกวัดหนึ่งครั้งและอยู่ในกลุ่มเดียว

กรณีที่ความแปรปรวนเท่ากัน σ12 = σ22 ใช้สูตร

$$t = \frac{\bar{x}_{1} – \bar{x}_{2}}{s_{p}\sqrt{\frac{1}{n_{1}} + \frac{1}{n_{2}}}}$$

และ

$$s_{p} = \sqrt{\frac{(n_{1} – 1)s_{1}^{2} + (n_{2} – 1)s_{2}^{2}}{n_{1} + n_{2} – 2}}$$

กรณีความแปรปรวนไม่เท่ากัน ใช้สูตร

$$t = \frac{\bar{x}_{1} – \bar{x}_{2}}{\sqrt{\frac{s_{1}^{2}}{n_{1}} + \frac{s_{2}^{2}}{n_{2}}}}$$

จากนั้นนำค่า t ที่คำนวณได้ ไปเปรียบเทียบกับค่าวิกฤตที่ระดับความเป็นอิสระ (Degree of freedom: df)

$$\text{df} = \frac{ \left ( \frac{s_{1}^2}{n_{1}} + \frac{s_{2}^2}{n_{2}} \right ) ^{2} }{ \frac{1}{n_{1}-1} \left ( \frac{s_{1}^2}{n_{1}} \right ) ^{2} + \frac{1}{n_{2}-1} \left ( \frac{s_{2}^2}{n_{2}} \right ) ^{2}}$$

3. การทดสอบค่าเฉลี่ยของกลุ่มตัวอย่าง 2 กลุ่มที่ไม่เป็นอิสระจากกัน (Paired samples t-test หรือ Dependent sample t-test)

การทดสอบค่าเฉลี่ยของกลุ่มตัวอย่าง 2 กลุ่มที่ไม่เป็นอิสระจากกัน หรือสัมพันธ์กัน เช่น

  • การทดสอบผลสัมฤทธิ์ทางการเรียนของกลุ่มที่ได้รับการสอนแบบใหม่ กับกลุ่มที่ได้รับการสอบแบบเดิม
  • การทดสอบคะแนนก่อนเรียนและหลังเรียน
  • การศึกษาเกี่ยวกับความดันโลหิตสูงของผู้ป่วยทั้งหมด โดยถูกวัดตั้งแต่เริ่มต้นการศึกษา และวัดหลังให้การรักษา

คำนวณได้จากสูตร

$$t = \frac{\overline{\text{D}}}{\frac{\text{S}_\text{D}}{\sqrt{n}}}$$

โดยที่:

$\overline{D}$ แทน ค่าเฉลี่ยของความแตกต่าง หรือค่าเฉลี่ยของคะแนนก่อนเรียน-หลังเรียน
$\text{S}_\text{D}$ แทน ส่วนเบี่ยงเบนมาตรฐานของความแตกต่าง
$n$ แทน จำนวนตัวอย่าง

เมื่อ $\overline{\text{D}}=\frac{\sum {\text{D}}}{n}$ และ $\text{S}_{\text{D}}=\sqrt{\frac{n\sum D^{2}-(\sum D)^{2}}{n(n-1)}}$ สามารถแปลงสูตรเพื่อให้ง่ายต่อการคำนวณได้ดังนี้

\begin{align}
t & = \frac{\overline{\text{D}}}{\frac{\text{S}_{\text{D}}}{\sqrt{n}}} \\
& = \frac{\frac{\sum D}{n}}{\frac{\sqrt{\frac{n\sum D^{2}-(\sum D)^{2}}{n(n-1)}}}{\sqrt{n}}} \\
& = \frac{\sum D}{\frac{{\sqrt{n^{2}}}\cdot \sqrt{\frac{n\sum D^{2}-(\sum D)^{2}}{n(n-1))}}}{\sqrt{n}}} \\
& = \frac{\sum D}{\sqrt{n}\cdot \sqrt{\frac{n\sum D^{2}-(\sum D)^2}{n(n-1)}}} \\
& = \frac{\sum D}{\sqrt{\frac{n\cdot (n\sum D^{2}-(\sum D)^2)}{n(n-1)}}} \\
& = \frac{\sum D}{\sqrt{\frac{n\sum D^{2}-(\sum D)^2}{n-1}}}\end{align}

จากนั้นนำค่า T ที่คำนวณได้ ไปเทียบกับค่าวิกฤต T (T critical) ในตาราง ที่ df=n-1 โดยค่า t ที่คำนวณได้จากกลุ่มตัวอย่าง

  • ถ้าค่า T ที่คำนวณได้ น้อยกว่า T ในตาราง จะยอมรับ H₀
  • ถ้าค่า T ที่คำนวณได้ มากกว่า T ในตาราง จะปฏิเสธ H₀ ยอมรับ H₁

แค่ครูสอนคณิตศาสตร์คนหนึ่งที่ใช้ออกซิเจนในการหายใจ