[Tóm tắt các kiến thức quan trọng] của Reading 11: Hypothesis Testing

[ Tóm tắt những kỹ năng và kiến thức quan trọng ] của Reading 11 : Hypothesis Testing

Các vấn đề cơ bản cần chú ý khi học Reading 11 trong chương trình CFA level 1

1. Một số khái niệm cơ bản

1.1. Giả thuyết và các bước kiểm định giả thuyết

Bạn đang đọc: [Tóm tắt các kiến thức quan trọng] của Reading 11: Hypothesis Testing

Giả thuyết (hypothesis) là một mệnh đề về một hoặc nhiều tổng thể.

Các bước kiểm định giả thuyết gồm có :

1.2. Giả thuyết không và giả thuyết đối

Giả thuyết không (null hypothesis) – ký hiệu H0, là giả thuyết được kiểm định. Giả thuyết không là một mệnh đề được cho là đúng, trừ khi mẫu sử dụng trong kiểm định đưa ra bằng chứng thuyết phục là mệnh đề này sai.

[Tóm tắt các kiến thức quan trọng] của Reading 11: Hypothesis Testing

Giả thuyết đối/giả thuyết nghịch/đối thuyết (alternative hypothesis) – ký hiệu Ha, là giả thuyết được chấp nhận nếu giả thuyết không bị bác bỏ.

Lưu ý :

Kiểm định giả thuyết thống kê không thể chứng minh một phương pháp tuyệt đối giả thuyết nào đúng, giả thuyết nào sai mà chỉ có thể kết luận chấp nhận/bác bỏ một giả thuyết với một xác suất sai lầm nhất định. Giả thuyết không là giả thuyết được kỳ vọng bị bác bỏ để chấp nhận giả thuyết đối.Giả thuyết không luôn bao gồm điều kiện “=”. Ví dụ:

1.3. Kiểm định một bên và kiểm định hai bên

Kiểm định một phía

(one-sided/one-tailed hypothesis test)

Kiểm định hai phía

(two-sided/two-tailed hypothesis test)

Bác bỏ Ho nếu giá trị thống kê kiểm định lớn hơn giá trị tới hạn .

Bác bỏ nếu giá trị thống kê kiểm định (test statistic) > giá trị tới hạn trên hoặc giá trị thống kê kiểm định (test statistic)

Ví dụ : kiểm định bên phải

Ví dụ : kiểm định hai bên

1.4. Giá trị thống kê và giá trị tới hạn

Kiểm định giả thuyết thống kê tương quan tới việc so sánh hai giá trị : giá trị thống kê kiểm định ( test statistic ) và giá trị tới hạn của thống kê kiểm định ( critical value ) .

Giá trị thống kê kiểm định (test statistic) là một đại lượng thường được tính bởi công thức và giá trị của đại lượng này là cơ sở để kết luận có bác bỏ giả thuyết H0 hay không.Giá trị tới hạn (critical value/rejection point) là giá trị để so sánh với giá trị thống kê kiểm định và đưa ra kết luận có bác bỏ giả thuyết H0 hay không.

1.5. Mức ý nghĩa và lực kiểm định

Kết luận từ kiểm định giả thuyết thống kê luôn tồn tại sai lầm với một xác suất nhất định, chia làm hai loại: sai lầm loại I (type I error) và sai lầm loại II (type II error).

Mức ý nghĩa (level of significance) của kiểm định là xác suất xảy ra sai lầm loại I – bác bỏ khi đúng, ký hiệu α.

Xác suất xảy ra sai lầm đáng tiếc loại II – không bác bỏ khi sai, ký hiệu β . Xác suất xảy ra sai lầm đáng tiếc loại I và Phần Trăm xảy ra sai lầm đáng tiếc loại II mang tính đánh đổi. Các yếu tố khác không biến hóa, nếu α giảm thì β tăng và ngược lại. Cách duy nhất để giảm đồng thời cả và là tăng size mẫu .

Lực kiểm định (power of a test) là xác xuất bác bỏ khi sai (kết luận đúng). Các yếu tố khác không thay đổi, nếu nhiều thống kê kiểm định có thể sử dụng cho một giả thuyết thì ta nên chọn thống kê kiểm định có lực kiểm định lớn nhất.

1.6. Mối quan hệ giữa khoảng tin cậy và kiểm định giả thuyết

Khoảng tin cậy (confidence interval) là một khoảng giá trị xung quanh giá trị kỳ vọng, mà ta kỳ vọng xác suất nó bao hàm giá trị thực là 100(1 – α) %, với α là mức ý nghĩa.

Khoảng an toàn và đáng tin cậy được xác lập bởi công thức :

(Tham số mẫu – Giá trị tới hạn x Sai số chuẩn) ≤ Tham số tổng thể

≤ (Tham số mẫu + Giá trị tới hạn x Sai số chuẩn)

Ví dụ, với mức ý nghĩa 5 %, mức an toàn và đáng tin cậy 95 %, nghĩa là Tỷ Lệ để tham số toàn diện và tổng thể thuộc khoảng chừng an toàn và đáng tin cậy bằng 95 % . Khoảng đáng tin cậy và kiểm định giả thuyết tương quan đến nhau trải qua giá trị tới hạn. Khoảng giá trị mà tại đó ta không hề bác bỏ giả thuyết Ho ( trong trường hợp kiểm định hai phía ) hoàn toàn có thể được viết lại như sau :

– Giá trị tới hạn ≤ Thống kê kiểm định ≤ + Giá trị tới hạn

1.7. Trị số p

Trị số p (p-value) là mức ý nghĩa thấp nhất mà giả thuyết không (Ho) có thể bị bác bỏ.

Kiểm định một phía:

Kiểm định bên trái: p-value là xác suất nằm phía dưới giá trị thống kê kiểm định tính đượcKiểm định bên phải: p-value là xác suất nằm phía trên giá trị thống kê kiểm định tính được

Kiểm định hai phía: p- value là tổng của xác suất nằm phía dưới giá trị thống kê kiểm định âm tính được cộng với xác suất nằm phía trên giá trị thống kê kiểm định dương tính được.

Ví dụ : Xét một phép kiểm định hai phía với giả thuyết về giá trị trung bình của toàn diện và tổng thể, với mức an toàn và đáng tin cậy 95 %. Giá trị kiểm định thông kê tính được là 2.3, cao hơn giá trị tới hạn = 1.96. Khi tra bảng phân phối z, ta có Xác Suất để nhận giá trị lớn hơn 2.3 là 1.07 %. Vì đây là kiểm định hai phía, nên ta sẽ phải nhân đôi số lượng này lên ( như hình ) để tính ra p-value . Vậy p-value = 2 x 1.07 = 2.14 % Kiểm định hai bên với trị số p là 2.14 % .

2. Kiếm định giả thuyết liên quan đến giá trị trung bình

2.1. Kiểm định giả thuyết về trung bình của một tổng thể

Kiểm định t

Kiểm định z

Điều kiện áp dụng

( 1 ) Không biết phương sai toàn diện và tổng thể, và tổng thể và toàn diện phân phối ( giao động ) chuẩn, hoặc ( 2 ) Không biết phương sai tổng thể và toàn diện, toàn diện và tổng thể không phân phối chuẩn và size mẫu n ≥ 30 ( 1 ) Biết phương sai toàn diện và tổng thể và toàn diện và tổng thể phân phối chuẩn, hoặc ( 2 ) Biết phương sai toàn diện và tổng thể, tổng thể và toàn diện không phân phối chuẩn và size mẫu n ≥ 30

Giả thuyết

Thống kê kiểm định

Giá trị thống kê kiểm định t với df = n – 1 được tính như sau :

(1), (2)

Giá trị thống kê kiểm định z được tính như sau :

(1)

(2)

Trong đó

= trung bình của mẫu

= trung bình giả thuyết của tổng thể

n = kích cỡ mẫu ( 1 ), ( 2 ) s = độ lệch chuẩn của mẫu ( 1 ) σ = độ lệch chuẩn của toàn diện và tổng thể ( 2 ) s = độ lệch chuẩn của mẫu

Quy tắc ra quyết định

Bác bỏ H0 nếu :

( a ) ( b ) ( c ) tương ứng với những cặp giả thuyết nêu trên Bác bỏ H0 nếu :

( a ) ( b ) ( c ) tương ứng với những cặp giả thuyết nêu trên

2.2. Kiểm định giả thuyết giá trị trung bình của hai tổng thể

Giả định phương sai hai tổng thể bằng nhau

Giả định phương sai hai tổng thể không bằng nhau

Điều kiện áp dụng

Hai toàn diện và tổng thể độc lập với nhau . Hai tổng thể và toàn diện tuân theo phân phối chuẩn .

Giả thuyết

Thống kê kiểm định

Thống kê t

với phương sai tổng hợp (pooled variance)

Thống kê t

Trong đó

= phương sai của mẫu thứ nhất

= phương sai của mẫu thứ hai

= số quan sát ở mẫu thứ nhất

= số quan sát ở mẫu thứ hai

Quy tắc ra quyết định

Bác bỏ nếu:

( a ) ( b ) ( c ) tương ứng với những cặp giả thuyết nêu trên

2.3. Kiểm định giả thuyết về trung bình của độ chênh lệch của hai tổng thể

Điều kiện áp dụng:

Hai tổng thể cùng phụ thuộc vào yếu tổ thứ ba nào đó. Khi đó, ta có thể thực hiện kiểm định so sánh theo cặp (paired comparisons) để kết luận liệu trung bình của độ chênh lệch giữa các quan sát của hai mẫu có khác nhau không.Hai tổng thể tuân theo phân phối chuẩn

Giả thuyết:

Trong đó :

Thống kê kiểm định: Thống kê t với df = n – 1 được tính như sau:

Trong đó :

Quy tắc ra quyết định: Bác bỏ Ho nếu:

( a ) ( b ) ( c ) tương ứng với những cặp giả thuyết nêu trên .

3. Kiểm định giả thuyết liên quan đến phương sai và hệ số tương quan

3.1. Kiểm định giả thuyết về phương sai của một tổng thể

Điều kiện áp dụng: Tổng thể tuân theo phân phối chuẩn.

Giả thuyết:

Thống kê kiểm định: Thống kê chi bình phương (chi-square), ký hiệu với df = n – 1 được tính như sau:

với

Trong đó :

Phân phối chi bình phương là một họ phân phối biến hóa khi số bậc tự do đổi khác. Phân phối chi bình phương bất đối xứng và không khi nào mang giá trị âm ( số lượng giới hạn dưới bởi điểm 0 ) .

Quy tắc ra quyết định: Bác bỏ nếu

( a ) ( b ) ( c ) tương ứng với những cặp giả thuyết nêu trên

3.2. Kiểm định giả thuyết về phương sai của hai tổng thể

Điều kiện áp dụng: Hai tổng thể tuân theo phân phối chuẩn và độc lập với nhau.

Giả thuyết:

Trong đó :

Lưu ý: Để thuận tiện, luôn chọn mẫu thứ nhất là mẫu có phương sai lớn hơn.

Quy tắc ra quyết định hành động : Bác bỏ nếu :

( a ) ( b ) ( c ) tương ứng với những cặp giả thuyết nêu trên .

3.3. Kiểm định giả thuyết về hệ số tương quan giữa hai biến ngẫu nhiên

Điều kiện áp dụng: Hai biến ngẫu nhiên tuân theo phân phối chuẩn.

Giả thuyết:

Thống kê kiểm định: Thống kê t với df = n – 2 được tính như sau:

Trong đó : r là thông số đối sánh tương quan của mẫu n là size của mẫu

4. Kiểm định phi tham số

Kiểm định tham số (parametric tests) được thực hiện dựa trên giả định (assumptions) về phân phối của tổng thể và đưa ra giả thuyết cụ thể về tham số tổng thể.

Kiểm định phi tham số (nonparametric tests) không quan tâm đến tham số tổng thể cụ thể nào hoặc có rất ít giả định về tổng thể. Kiểm định phi tham số áp dụng khi số lượng là yếu tố được quan tâm hơn so với tham số của phân phối hoặc khi dữ liệu hoặc phân phối không thỏa mãn giả thuyết của kiểm định tham số.

Kiểm định tương quan hạng Spearman (the Spearman rank correlation test) có thể sử dụng khi dữ liệu không tuân theo phân phối chuẩn. 

Author : Thanh Thuy Reviewer : Hoang Ngoc

0 Shares
Share
Tweet
Pin