Nhận xét chi-square là gì | Sen Tây Hồ

1. Lúc nào dùng χ2

Đánh giá Chi-square (χ2) bao gồm cả bài đánh giá Chi-bình phương 1 mẫu về tính độc lập (One-sample Chi-square take a look at of independence) và bài đánh giá Chi-bình phương 2 mẫu về tính đồng nhất (Twosample Chi-square take a look at of homogeneity) là giống nhau về cả tính toán và diễn giải.

Đánh giá χ2 là 1 đánh giá sắp đúng về mức ý nghĩa đối có sự hợp tác (affiliation) giữa 2 biến phân loại (categorical variables) lúc dữ liệu tại dạng đếm tần suất và mối chú ý tập trung vào số lượng đối tượng thuộc những loại khác nhau. Độ chính xác được đánh giá phụ thuộc vào thiết kế mẫu được dùng. Những tần suất là xem được trong bảng 2 × 2 (‘2’ trước tiên cho biết số hàng trong bảng và ‘2’ thứ 2 cho biết số cột). 2 thiết kế lấy mẫu phổ thông} là “đánh giá χ2 về tính độc lập” (χ2 take a look at of independence) có tổng số biên của hàng và cột ngẫu nhiên và “đánh giá χ2 về tính đồng nhất của tỷ lệ” (χ2 take a look at of homogeneity of proportions) có tổng số biên của hàng cố định hoặc là cột cố định.

(1) Đánh giá χ2 1 mẫu về tính độc lập có tổng số biên của hàng và cột ngẫu nhiên

Trong thiết kế này, 1 mẫu ngẫu nhiên được lấy từ 1 dân số duy nhất của những đối tượng nhưng có 2 thước đo cho từng đối tượng, ấy là những biến nhị phân hàng và cột. Tổng cỡ mẫu, n, là cố định nhưng những tần suất trong cả tổng số biên của hàng và cột là ngẫu nhiên và ko được biết trước hoặc cố định trước. Những tần số biên ngẫu nhiên phụ thuộc vào bí quyết từng đối tượng được phân loại trên cả 2 biến nhị phân. Nghĩa là, từng đối tượng sẽ được phân bổ vào 1 trong 4 ô trong bảng 2 × 2.

Dí dụ, 1 nhà nghiên cứu điều tra vai trò của giáo viên giáo dục đặc biệt trong chăm sóc trẻ em mắc chứng tự động kỷ có thể đặc biệt chú ý tới mối quan hệ giữa thời kì kinh nghiệm có tư bí quyết là giáo viên (biến cột) và cảm xúc chi phối của họ có tư bí quyết là giáo viên (biến hàng). 1 mẫu ngẫu nhiên duy nhất gồm 100 giáo viên giáo dục đặc biệt được chọn từ 1 dân số những giáo viên này. Những giáo viên giáo dục đặc biệt được hỏi 2 câu hỏi: họ đã chăm sóc trẻ em mắc chứng tự động kỉ được bao thời gian dài? (những câu trả lời được phân loại thành lớn hơn hoặc bằng 5 5 hoặc ít hơn 5 5), và cảm xúc chủ đạo của họ có tư bí quyết giáo viên là gì? (những câu trả lời được phân loại chủ yếu là giận giữ hoặc đồng cảm). Giả thuyết nghiên cứu là cảm xúc về vai trò của giáo viên giáo dục đặc biệt có liên quan tới thời kì kinh nghiệm làm cho việc. Giả thuyết vô hiệu là những biến hàng và cột là độc lập, ấy là tỷ lệ (số lượng) kỳ vọng ​​trong từng ô của bảng phát sinh sẽ bằng nhau và sẽ ko khác có số lượng xem được. Nói 1 bí quyết tổng quát hơn, ko có mối quan hệ giữa thời kì là giáo viên và cảm xúc chi phối về vai trò của giáo viên giáo dục đặc biệt.

Xem Thêm  NATO là gì? Giới thiệu về Tổ chức Hiệp ước Bắc Đại Tây Dương (NATO)

(2) Đánh giá χ2 2 mẫu về tính đồng nhất của tỷ lệ có tổng biên của hàng (hoặc cột) được cố định

Thiết kế này được dùng để so sánh sự phân phối của 2 tỷ lệ trong 2 dân số độc lập. Trong bảng phát sinh 2 × 2, từng biến được coi là nhị phân. Dí dụ: biến cột trong bảng 2 × 2 có thể đại diện cho 2 quần thể độc lập, nam và nữ, và biến hàng (biến phản hồi) có thể đại diện cho kết quả đánh giá được phân loại là đạt hoặc ko đạt. Nhà nghiên cứu có thể muốn điều tra xem tỷ lệ ứng viên đạt có liên quan tới nam nữ hay ko. Dí dụ: 1 mẫu ngẫu nhiên độc lập gồm 50 nam và 1 mẫu ngẫu nhiên biệt lập gồm 50 nữ sẽ được chọn. Tổng cột của nam và nữ trong dí dụ này được cố định bởi nhà nghiên cứu. Từng nam và nữ sẽ được phân loại thành 1 loại đạt hoặc ko đạt, tổng số biên của hàng là ngẫu nhiên (ko được nhà nghiên cứu cố định) và có thể chịu sai số mẫu. Ví dụ tỷ lệ ứng viên “đạt” được biểu thị bằng P, thì tỷ lệ ko đạt sẽ là 1-P (biến là nhị phân). Giả thuyết vô hiệu sẽ là tỷ lệ dân số (hoặc phần trăm) của nam và nữ vượt qua kỳ thi là bằng nhau, hay nói 1 bí quyết khác là ko có sự khác biệt giữa nam và nữ về tỷ lệ phần trăm vượt qua kỳ thi. 1 dạng tổng quát hơn của giả thuyết vô hiệu này là ko có mối quan hệ giữa nam nữ và thành tích thi.

2. Suy luận thống kê và giả thuyết vô hiệu

Suy luận thống kê là về tần suất, trong ấy số lượng những xem thuộc 1 loại cụ thể trong 1 nhóm là được so sánh có tỷ lệ những xem thuộc cùng 1 loại từ nhóm kia.

  • Những nhóm có thể chỉ tới 2 phép đo độc lập từ 1 dân số hoặc tới 2 dân số độc lập đã được chọn ngẫu nhiên. Dí dụ, trong 1 nghiên cứu về tác động của chương trình tư duy hăng hái tới sự tự tín của sinh viên (sự tự tín giao tiếp nâng cao lên / ko nâng cao lên), đánh giá χ2 1 mẫu về tính độc lập sẽ được dùng có thiết kế này để tìm ra bất kỳ mối liên lạc nào giữa sự tự tín và nam nữ hay ko.
  • Những nhóm cũng có thể đề cập tới 2 dân số độc lập, dí dụ, trong 1 nghiên cứu về mối quan hệ giữa nam nữ và thành tích thi, 2 nhóm học sinh cố định gồm 50 nam và 50 nữ sẽ được chọn (biến cột), tiếp tục được phân loại thành nhóm đạt và ko đạt (biến hàng). Sở hữu thiết kế mẫu này, đánh giá χ2 2 mẫu về sự đồng nhất của những tỷ lệ sẽ được dùng để đánh giá sự khác biệt giữa tỉ lệ nam và nữ vượt qua kỳ thi.

Đối có đánh giá χ2 1 mẫu về tính độc lập, những tham số được ước tính là tỷ lệ của từng ô của bảng 2 × 2 trong dân số. Giả thuyết nghiên cứu là những biến hàng và cột tương tác có nhau, nghĩa là chúng ko độc lập và tỷ lệ xem được trong 4 ô là khác nhau.

Xem Thêm  Mách bạn bí quyết chơi line 98 đạt điểm cao đỉnh ko cần chỉnh | scose

Tương tự động, đối có đánh giá χ2 2 mẫu về tính đồng nhất của những tỷ lệ, những tham số được ước tính là tỷ lệ của từng ô của bảng 2 × 2 trong dân số. Giả thuyết nghiên cứu là sự phân phối tỷ lệ (cho 1 biến phân loại) là khác nhau trong 2 dân số (biến phân loại kia có tổng biên cố định).

Giả thuyết vô hiệu cho cả χ2 1 mẫu và 2 mẫu là ko có mối quan hệ giữa những biến cột và hàng. Ví dụ giả thuyết vô hiệu là đúng, tỷ lệ 4 ô sẽ bằng nhau và ko có sự khác biệt đáng nói giữa tần suất ô xem được và tần số ô kỳ vọng.

Phân phối χ2 là được xác định hoàn toàn bởi 1 tham số duy nhất, bậc tự động do (df). Bất cứ lúc nào chúng ta đánh giá thống kê χ2, chúng ta cần xem xét df thích hợp. Trong ấy, df = (số hàng − 1) × (số cột − 1) và do ấy luôn là giá trị ‘1’ trong bảng 2 × 2. Đánh giá χ2 và df phân phối 1 xác suất cho sự khác biệt giữa những tần suất xem được và tần suất kỳ vọng. Lúc tần suất xem và tần suất kỳ vọng y chang nhau, thống kê χ2 sẽ bằng ko. Sở hữu bất kỳ độ lệch nào, giá trị χ2 càng lớn thì ý nghĩa thống kê càng lớn.

3. Những giả định đánh giá (Check Assumptions)

Những giả định cơ bản của cả đánh giá χ2 về tính độc lập và tính đồng nhất cho bảng 2 × 2 là:

  1. Những xem là đại diện tiêu biểu của những dân số chú ý.
  2. Dữ liệu tại dạng đếm tần suất xem.
  3. Những xem cần độc lập, có nghĩa là, 1 xem rơi vào bất kỳ hàng cụ thể nào của bảng phát sinh ko phụ thuộc vào cột nó tại trong (và ngược lại).
  4. Những xem chỉ nên rơi vào 1 ô của bảng phát sinh.
  5. Đánh giá χ2 ko nên được dùng lúc bất kỳ tần suất ô kỳ vọng ​​nào là . Tần số kỳ vọng bé là điểm yếu phổ thông} nhất trong việc dùng đánh giá Chi-square (nghĩa là dùng sai Chi-bình phương). Giá trị kỳ vọng của 5 là giới hạn thấp nhất tuyệt đối. Lúc kích thước mẫu tổng là ≥20, thì tần suất kì vọng ​trong 1 hoặc 2 ô có thể thấp tới 1 hoặc 2. Nhưng Chi-square là 1 quy trình mạnh mẽ và tần suất ô kỳ vọng ​​< 5 ko liên quan cơ bản tới tỷ lệ lỗi Loại I. Ý kiến chung dường như là những tần suất kỳ vọng bé là có thể chấp nhận được trong ít nhất 1 hoặc 2 ô có điều kiện kích thước mẫu tổng thể ≥20. Hiệu chỉnh của Yate’s (1934) cho tính liên tục (bằng bí quyết thêm 0.5 vào tần số ô được xem) được dùng có kích thước mẫu bé trong bảng 2 × 2. Những biến trong bảng phát sinh là đi rạc nhưng χ2 là phân phối liên tục, do ấy việc thêm 0.5 vào từng tần số ô xem được cho là sẽ cải thiện phép xấp xỉ χ2. Nói chung, phép hiệu chỉnh này ko cần trên cơ sở lý thuyết mà dựa trên ứng dụng của nó vì nó có thể dẫn tới việc mất nguồn ko cần thiết. Sở hữu cỡ mẫu bé, nên dùng phép thử chính xác của Fisher (Fisher, 1935) (vui lòng đọc đánh giá Fisher).
Xem Thêm  Hạt sen khô, bí quyết làm cho, công dụng, giá sắm bán phải chăng nhất loại ngon.

4. Thủ tục đánh giá χ2

Dí dụ, 1 nhà nghiên cứu cần đánh giá xem nam nữ và hiến máu tự động nguyện của sinh viên đại học có quan hệ có nhau ko. 1 tập dữ liệu gồm 50 sinh viên được thu thập. Biến nam nữ được chia làm cho những mức giá trị 1 = nam, 2 = nữ, và biến hiến máu tự động nguyện (bạn đã từng tham dự hiến máu tự động nguyện chưa?) được chia làm cho những mức giá trị 1= sure (có), 2 = no (ko).

Giả thuyết thống kê H0: Ko có mối quan hệ giữa khía cạnh nam nữ và sự hiến máu tự động nguyện của những sinh viên? Mức alpha được chọn là 5%.

Đánh giá χ2 so sánh tần số đếm được trong từng ô trong bảng phát sinh có tần số đếm kỳ vọng ​​cho từng ô (chúng ta cần ước tính tần số kỳ vọng). Số lượng ô kỳ vọng ​​được ước lượng theo giả định rằng giả thuyết vô hiệu là đúng, tức là ko có sự hợp tác giữa những biến hàng và cột.

Giá trị χ2 được tính cho từng ô trong bảng phát sinh được tính theo công thức:

Trong ấy, O là tần suất ô xem được, E là tần suất ô kì vọng.

Dữ liệu khảo sát đếm tần suất được trình bày trong bảng dưới đây:

Nhận xét chi-square là gì | Sen Tây Hồ

Những bước đánh giá χ2:

Bước 1: Tính giá trị kì vọng cho từng ô từ A tới D

  • ô A: EA= (25×30)/50 = 15
  • ô B: EB= (25×30)/50 = 15
  • ô C: EC= (25×20)/50 = 10
  • ô D: ED= (25×20)/50 = 10

Bước 2: Tính giá trị χ2 cho từng ô từ A tới D

  • ô A: χ2 = (18 – 15)2/ 15 = 0.6
  • ô B: χ2 = (12 – 15)2/ 15 = 0.6
  • ô C: χ2 = (7 – 10)2/ 10 = 0.9
  • ô D: χ2 = (13 – 10)2/ 10 = 0.9

Bước 3: Tính tổng đa số χ2

Tổng χ2 = 0.6 + 0.6 + 0.9 + 0.9 = 3.00

Bí quyết suy luận kết quả: Để đánh giá ý nghĩa thống kê của thống kê χ2 được ước lượng tại trên, chúng ta cần tính toán bậc tự động do thích hợp cho bảng phát sinh, tại đây df = 1. Tra bảng phân phối những giá trị χ2 tới hạn (vui lòng xem bảng phân phối χ2), mức alpha được chọn trước tiên là p≤0.05, giá trị χ2 tới hạn là 3.841, là giao điểm của cột alpha tại 0.05 và hàng df là 1. Vì giá trị χ2 được tính toán (3.00) bé hơn giá trị χ2 tới hạn (điều sẽ được mong đợi theo giả thuyết vô hiệu là ko tương tác giữa những biến hàng và cột) nên chúng ta ko thể chưng bỏ giả thuyết vô hiệu và kết luận rằng 2 biến số, sự hiến máu tự động nguyện và nam nữ là ko liên quan có nhau. Dù rằng tỷ lệ nam giới của 60% (18/30 × 100) so có nữ giới 40% (12/30 × 100) có sự khác biệt chút ít, nhưng sự khác biệt này là ko có ý nghĩa thống kê tại mức ý nghĩa p≤0.05, có nghĩa rằng sự hiến máu tự động nguyện và nam nữ là ko liên quan có nhau.