Chi Square Là Gì

     

Trở lại cùng với các nội dung bài viết của hoanganhmotel.com, bài viết lần này bọn họ sẽ tìm hiểu về kiểm nghiệm phi tham số cụ thể là kiểm định chi bình phương (Chi-square test). Trong series về cách thức phân tích tồn tại (Survival analysis) công ty chúng tôi từng nhắc đến sự khác hoàn toàn giữa các quy mô tham số (parametric models) và phi tham số (non-parametric models). Đối với mô hình tham số, họ phải giới thiệu giả định ban sơ về cỗ tham số được gửi vào mô hình, quy qui định phân phối phần trăm áp dụng đến các đối tượng nghiên cứu vớt trong tập dữ liệu. Tuy nhiên nếu không thể chuyển ra những giả định, quan trọng đặc biệt trường thích hợp dữ liệu tích lũy là tài liệu định tính, thì quy mô phi tham số sẽ được ưu tiên sử dụng.Bạn vẫn xem: bỏ ra square test là gì

Tương trường đoản cú trong triết lý thống kê, khi thực hiện kiểm định tham số đến các công dụng thu được từ phần nhiều nghiên cứu, họ cần xét đk được quan tâm là tổng thể nghiên cứu và phân tích có phân phối chuẩn. Mặc dù trường hợp, bạn làm so với theo gớm nghiệm của bản thân cho rằng tổng thể phân tích thực tế chưa phải như vậy, họ gồm quyền không chỉ dẫn giả định. Giỏi tổng thể nghiên cứu về thực chất đã ko thỏa đk này, thì các phương pháp kiểm định tham số quan yếu đưa vào sử dụng, cầm cố vào chính là kiểm định phi tham số.

Bạn đang xem: Chi square là gì


*

Kiểm định phi tham số tuyệt non-parametric hypothesis tests cung ứng kiểm định đưa thuyết tương quan đến tổng thể nghiên cứu mà ở kia không mang ngẫu nhiên giả định nào về quy hiện tượng phân phối, hay tất cả quy khí cụ phân phối ngẫu nhiên không theo phân phối chuẩn, cùng không cần ngẫu nhiên tham số nào như trung bình, độ lệch chuẩn, tỷ lệ,…thường vận dụng cho tài liệu định tính rộng là tài liệu định lượng. Các phương pháp kiểm định phi thông số đã xuất hiện thêm từ rất mất thời gian từ cuối trong thời hạn 1940 và vẫn còn hữu dụng cho đến ngày hôm nay.

Trong 2 nội dung bài viết lần này về kiểm định phi tham số, họ sẽ cùng tò mò đến một vài phương thức kiểm định phi tham số đặc trưng như Sign – test, Wilcoxon – rank test, Mann – Whitney test, Kruskal – Wallis test, và đặc biệt là kiểm định đưa ra bình phương đưa ra – squared demo được ứng dụng phổ cập hơn mà chúng ta thường nhắc đến ở các chủ đề nội dung bài viết trong Data mining mà gần nhất là Survival analysis. Bọn họ sẽ khám phá Chi-squared kiểm tra với những ví dụ dễ dàng trong phần 1 bài viết lần này.

Các triết lý liên quan đến thống kê, tương tự như quy phương pháp phân phối, lý thuyết kiểm định thông số như kiểm nghiệm là gì, bởi vì sao cần, … cửa hàng chúng tôi sẽ không nhắc lại chi tiết. Các bạn cũng có thể xem lại các bài viết qua links dưới đây:

Tổng quan liêu về Statistics: khái niệm và vận dụng của thống kê

Tổng quan về Statistics: Descriptive statistics (thống kê mô tả)

Tổng quan về Statistics: Inferential statistics (thống kê suy luận)

Tìm gọi về phương thức kiểm định tham số

Các dạng kiểm định tham số (trường vừa lòng 1 mẫu)

Các dạng kiểm tra tham số (trường thích hợp 2 mẫu)

Kiểm định chi bình phương (Chi-squared test)

Kiểm định chi bình phương áp dụng cho dạng tài liệu thống kê theo mô hình tần số. Mục đích ứng dụng thông dụng của kiểm định chi bình phương thứ nhất là kiểm soát xem bao gồm mối liên hệ, mối quan hệ giữa 2 biến, 2 yếu hèn tố đang xét đến. Yêu cầu kiểm tra mối contact giữa 2 biến mở ra nhiều vào các phương pháp phân tích như hồi quy Logistics, Survival analysis,… cùng trong thực tế khi chúng ta quan tâm đến sự khác hoàn toàn giữa 2 nhóm đối tượng nghiên cứu vãn thuộc lĩnh vực xã hội, tởm tế.

Một ứng dụng khác của kiểm định bỏ ra bình phương đó là “Goodness of Fit” dùng để làm kiểm tra giả định về quy luật cung cấp trong một tổng thể nghiên cứu và phân tích có đúng không, có hợp lý hay là không ví dụ đánh giá giả định ngân sách trung bình của người sử dụng cho những sản phẩm của bạn mỗi mon tuân theo triển lẵm chuẩn. Xuất xắc ví dụ cố thể, một chuyên viên phân tích bán hàng của một công ty cho rằng tỷ lệ lệch giá của sản phẩm A, B, C tuân theo cung cấp đa thức (Multinominal probability distribution) theo lần lượt là 40%, 25%, 35%.

Giả sử công ty sản xuất điện thoại có 3 sản phẩm A, B, C, có mức chi phí trung bình ngang nhau, không thật chênh lệch, dành riêng cho phân khúc quý khách hàng tầm trung, được khách hàng chọn lựa dựa trên các yếu tố thiết kế, tính năng. Xác suất doanh số phân khúc cỡ trung trong năm 2019 theo lần lượt là 40%, 25%, 35%.

Xem thêm: Nơi Bán Máy Đánh Tan Mỡ Bụng Giá Rẻ, Máy Tan Mỡ Bụng Giá Tốt Tháng 4, 2022

Trong năm 2020, sản phẩm B được công ty thiết kế, trí tuệ sáng tạo thêm các tính năng mới như camera AI, dấn diện khuôn mặt. Công ty muốn tò mò liệu việc thành phầm B được cải tiến như vậy sẽ tác động ảnh hưởng lên lệch giá của sản phẩm A, C như thế nào.

Công ty tiến hành tích lũy dữ liệu 300 khách hàng hàng, mỗi khách hàng mua 1 trong những 3 sản phẩm A, B, C. Bọn họ có bày bán đa thức với tỷ lệ doanh số cụ thể pA, pB, pC.

Nói một chút ít về cung cấp đa thức (Multinominal probability distribution), đó là quy qui định phân phối không ngừng mở rộng từ triển lẵm nhị thức (Binominal probability distribution). Ví dụ trong phân phối nhị thức, họ có xác suất quý khách hàng mua thành phầm A: pA cùng xac suất ko mua sản phẩm A sẽ là 1 trong những – pA; và pA + (1 – pA) = 1. Đối với đa thức, chúng ta có thể xét nhiều hơn thế các hiệu quả đạt được, như ví dụ nghỉ ngơi trên, nếu khách hàng không cài A, thì họ rất có thể mua B hoặc C; không mua B, thì hoàn toàn có thể mua A hoặc C; không tải C, thì hoàn toàn có thể mua A hoặc B. Họ sẽ tất cả pA – phần trăm mua thành phầm A, pB, pC thứu tự là tỷ lệ mua thành phầm B, tỷ lệ mua sản phẩm C.

Với page authority + pB + pC = 1

Quay quay lại với bài xích toán, bọn họ sẽ đặt giả thuyết:

H0: doanh số của 3 sản phẩm A, B, C tuân theo bày bán đa thức với tỷ lệ doanh số giỏi xác suất người tiêu dùng mua thành phầm A, B hoặc C thứu tự là page authority = 0.4 pB = 0.25 pC = 0.35

H1: lợi nhuận của 3 sản phẩm A, B, C ko tuân theo bày bán đa thức với phần trăm doanh số tốt xác suất khách hàng mua sản phẩm A, B hoặc C thứu tự là page authority = 0.4 pB = 0.25 pC = 0.35

Hoặc đơn giản:

H0: page authority = 0.4; pB = 0.25; pC = 0.35

H1: tỷ lệ doanh số ứng cùng với 3 sản phẩm A, B, C sẽ không phải là pa = 0.4 pB = 0.25 pC = 0.35

Cách thực hiện

Kiểm định đưa ra bình phương vận động dựa trên sự khác biệt giữa số quan liêu sát thực tế (tần suất thực tế) – Observed, ký kết hiệu Oi; với số quan tiền sát hy vọng đợi hay dự loài kiến (tần suất ao ước đợi dự kiến) – Expected, ký hiệu Ei. Với i là nhóm đang xét.

Xem thêm: Tải Phần Mềm Cân BằNg Âm Thanh CáC TậP Tin Audio, Cân Bằng Âm Thanh Các Tập Tin Audio

Từ “mong đợi”, giỏi “dự kiến” được hiểu đơn giản và dễ dàng như sau. Lấy một ví dụ nếu doanh nghiệp không tiến hành đổi mới sản phẩm B, thì xác suất doanh số của 3 sản phẩm A, B, C trong thời hạn 2020 có thể được muốn đợi sẽ buổi tối thiểu bằng 2019. Hoặc nếu không tồn tại gì xẩy ra trong năm 2020, xác suất doanh số 3 sản phẩm A, B, C dự loài kiến sẽ bởi năm trước.

Công thức kiểm định Chi-squared không còn xa lạ mà shop chúng tôi từng kể ở các chủ đề nội dung bài viết trước: