Trang chủ
Nghiên cứu khoa học - Sinh hoạt khoa học, công nghệ

Phân tích thống kê mô tả-Kiểm định giả thuyết thống kê

 đối với các thống kê cơ bản

I. PHÂN TÍCH DỮ LIỆU

1.PHÂN TÍCH THỐNG KÊ MÔ TẢ

- Các phương pháp cơ bản để tiến hành phân tích thống kê mô tả cho các biến:

+ Bảng tần số

+ Các đại lượng thống kê mô tả

+ Bảng kết hợp nhiều biến

+ Biểu đồ, đồ thị

1.1.Bảng tần số (cho cả biến định tính và định lượng)

Thực hiện trên SPSS:

Analyze => Descriptive Statistics => Frequencies

- Từ danh sách các biến, chọn biến cần phân tích và chuyển vào hộp

1.2.Các đại lượng thống kê mô tả (cho biến định lượng)

+ Các đại lượng đo lường mức độ tập trung: trung bình (mean), trung vị (median), số mode, tứ phân vị (quartiles)…

+ Các đại lượng đo lường mức độ phân tán: khoảng biến thiên (range), phương sai (variance), độ lệch chuẩn (standard deviation)…

+ Các đại lượng mô tả phân phối: hệ số Skewness và hệ số Kurtosis

 

Thực hiện:

Analyze => Descriptive Statistics => Descriptives

+Chọn biến định lượng cần phân tích vào khung Variable(s).

+Mở hộp thoại Options, chọn các đại lượng thống kê cần tính toán để mô tả cho phân phối của biến định lượng đó

-Lập bảng tần số kết hợp tính toán các đại lượng thống kê mô tả cho biến định lượng

Analyze => Descriptive Statistics => Frequencies

Chọn biến định lượng vào khung Variable(s)

Mở hộp thoại Statistics để lựa chọn các đại lượng thống kê mô tả cho biến định lượng đó

1.3. Bảng kết hợp nhiều biến

1.3.1.  Bảng kết hợp giữa các biến định tính

Analyze => Descriptive Statistics => Crosstabs

Analyze => Tables => Custom Tables

Row(s) : ô chứa biến dòng khi truy xuất bảng dữ liệu

Column(s): ô chứa biến cột khi truy xuất bảng dữ liệu

13.2. Bảng kết hợp giữa biến định lượng và biến định tính

Analyze => Tables => Custom Tables

 Chọn biến định lượng vào ô Rows

 Chọn biến định tính vào ô Columns

 Chọn hộp thoại Summary Statistics để tính toán các giá trị thống kê Row%, Col%

 Chọn hộp thoại Catagories and Total để thể hiện giá trị Tổng

1.4. Biểu đồ, đồ thị:

1.4.1. Các loại đồ thì cơ bản:

 - Biểu đồ thanh (Bar Chart): được sử dụng biểu diễn dữ liệu dưới dạng tần số hay tần suất %

-  Biểu đồ hình tròn (Pie Chart): sử dụng biểu diễn dữ liệu định tính dạng tần số hay tần suất % khi có ít nhóm

-  Biểu đồ đường gấp khúc (Line Chart) và diện tích (Area Chart): áp dụng tốt cho dữ liệu định lượng

II. KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

1.1.Quy trình:

Bước 1: Thành lập giả thuyết không H0

Ví dụ: H0: μ = μ0

Bước 2: Thành lập giả thuyết nghiên cứu H1

Ví dụ: H1: μ ≠ μ0 hoặc μ ≤ μ0 hoặc μ ≥ μ0

Bước 3: Xác định mức ý nghĩa α

Bước 4: Chọn các tham số thống kê thích hợp cho việc kiểm định, xác định miền bác bỏ, miền chấp nhận và giá trị tới hạn

Bước 5: Tính toán các giá trị của các tham số thống kê trong việc kiểm định dựa trên số liệu của mẫu ngẫu nhiên

Bước 6: Ra quyết định: Nếu các giá trị tính toán rơi vào miền bác bỏ giả thuyết H0 thì ra quyết định bác bỏ, ngược lại sẽ chấp nhận giả thuyết H0

Với SPSS, ta dùng giá trị Sig. để ra quyết định

  • Giá trị Sig. là xác suất phạm sai lầm loại I, như vậy nó có cùng ý nghĩa với mức ý nghĩa α

+ Nếu giá trị Sig. nhỏ hơn mức ý nghĩa α, giả thuyết H0 bị bác bỏ, chấp nhận giả thuyết H1

+ Nếu giá trị Sig. lớn hơn mức ý nghĩa α, không đủ bằng chứng thống kê để bác bỏ giả thuyết H0

1.2. Kiểm định mối liên hệ giữa 2 biến

1.2.1. Kiểm định Chi bình phương

- Dùng để kiểm định mối liên hệ giữa hai biến định tính (2 biến định danh hoặc giữa biến định danh – biến thứ tự) trong tổng thể

- Cho biết có tồn tại mối liên hệ giữa hai biến hay không

- Giả thuyết H0: hai biến độc lập với nhau

-Giả thuyết H1: hai biến có liên hệ với nhau

Đọc kết quả:

Sig. ≤ α: bác bỏ giả thuyết H0

Sig. > α: không bác bỏ giả thuyết H0

Cách thực hiện: Lập bảng chéo (Crosstabs) để tìm hiểu mối quan hệ giữa hai biến

Chọn nút Statistics/Chi – square

Lưu ý:

+ Kiểm định Chi bình phương chỉ có ý nghĩa khi số quan sát đủ lớn (tỷ lệ các ô chéo trong bảng có tần số <5 phải nhỏ hơn 20%)

+ Kiểm định này không cho biết độ mạnh của mối liên hệ giữa hai biến mà phải sử dụng các đại lượng Cramer V, hệ số liên hợp (Coefficient of contigency)…

1.2.2.Kiểm định giá trị trung bình tổng thể

Nếu muốn so sánh giá trị trung bình tổng thể với một giá trị cụ thể nào đó

 => Kiểm định giả thuyết về trung bình của tổng thể ONE – SAMPLE T – TEST. Nếu muốn so sánh hai giá trị trung bình của hai tổng thể riêng biệt => Kiểm định giả thuyết về sự bằng nhau giữa hai trung bình tổng thể, mẫu độc lập INDEPENDENT – SAMPLES T – TEST . Nếu muốn so sánh hai giá trị trung bình của hai tổng thể phụ thuộc lẫn nhau => Kiểm định giả thuyết về sự bằng nhau giữa hai trung bình tổng thể, mẫu phụ thuộc PAIRED – SAMPLES T – TEST

Nếu muốn so sánh giá trị trung bình giữa ba nhóm tổng thể riêng biệt trở lên => Kiểm định giả thuyết về sự bằng nhau giữa trung bình 3 tổng thể trở lên ONE – WAY ANOVA

1.2.2.1 -One – Sample T – test

So sánh giá trị trung bình của một tổng thể với một giá trị cụ thể nào đó, sử dụng kiểm định One – sample T – test

Điều kiện áp dụng:

Mẫu được chọn phải ngẫu nhiên (Random)

Mẫu phải có phân phối chuẩn hoặc xấp xỉ chuẩn

Giả thuyết:

H0: μ = m

H1: μ ≠ m

Cách thực hiện:

Trên thanh Menu, chọn Analyze/Compare Means/One – Sample T – test

Chọn biến đưa vào khung Test variable

Khai báo giá trị Test Value

Đọc kết quả:

Sig. ≤ α: bác bỏ giả thuyết H0

Sig. > α: không bác bỏ giả thuyết H0

1.2.2.2. Independent – samples T – test

So sánh hai trung bình của hai tổng thể dựa trên hai mẫu độc lập, sử dụng kiểm định Independent – samples T – test

Điều kiện áp dụng:

Kích thước 2 mẫu so sánh phải bằng hoặc tương đương nhau

Hai mẫu so sánh phải được chọn ngẫu nhiên, có phân phối chuẩn hoặc xấp xỉ phân phối chuẩn và có phương sai như nhau

Giả thuyết

H0: μ1 = μ2

H1: μ1 ≠ μ2

Cách thực hiện:

Trên thanh Menu, chọn Analyze/Compare Means/Independent – samples T – test

Chọn biến định lượng đưa vào khung Test Variable

Chọn biến định tính (chia số quan sát thành 2 nhóm mẫu độc lập) đưa vào khung Grouping Variable

Chọn Define Groups để khai báo hai nhóm cần so sánh với nhau

Dựa vào kết quả kiểm định sự bằng nhau của hai phương sai (Levene’s test) với giả thuyết

+H0: Phương sai của hai tổng thể là như nhau

+H1: Phương sai của hai tổng thể là khác nhau

+Nếu giá trị sig. ≤ α => bác bỏ giả thuyết H0, do đó sử dụng kết quả kiểm định t ở cột Equal variances not assumed

+Nếu giá trị sig. > α => không bác bỏ giả thuyết H0, do đó sử dụng kết quả kiểm định t ở cột Equal variances assumed

1.2.2.3. Paired – samples T – test

So sánh hai giá trị trung bình của hai tổng thể dựa trên hai mẫu phụ thuộc hay mẫu phối hợp từng cặp, sử dụng Paired – samples T – test

Điều kiện áp dụng:

Kích thước 2 mẫu bằng nhau

Chênh lệch giữa các giá trị của 2 mẫu phải có phân phối chuẩn hoặc kích thước mẫu đủ lớn để xem như có phân phối chuẩn

Giả thuyết

H0: μ1 = μ2

H1: μ1 ≠ μ2

Cách thực hiện:

Trên thanh Menu, chọn Analyze/Compare Means/Paired – samples T – test

Chọn 2 biến chứa các giá trị của 2 mẫu quan sát đưa vào khung Paired Variables để so sánh

Đọc kết quả:

Sig. ≤ α: bác bỏ giả thuyết H0

Sig. > α: không bác bỏ giả thuyết H0

1.2.2.4. One – way ANOVA

Nếu muốn so sánh giá trị trung bình của nhiều nhóm tổng thể độc lập, sử dụng phân tích phương sai ANOVA (ANalyse Of VAriancies)

Phân tích phương sai một yếu tố One – way ANOVA trong trường hợp sử dụng 1 biến yếu tố để phân loại các quan sát thành các nhóm khác nhau

Điều kiện áp dụng:

Các nhóm so sánh phải độc lập và được chọn một cách ngẫu nhiên

Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu đủ lớn để được xem như là phân phối chuẩn

Phương sai của các nhóm so sánh đồng nhất (đều nhau)

Giả thuyết

H0: μ1 = μ2 = μ3 = …

H1: μ1 ≠ μ2 ≠ μ3 ≠ …

Cách thực hiện:

Trên thanh Menu, chọn Analyze/Compare Means/One – way ANOVA

Chọn biến định lượng đưa vào khung Dependent List

Chọn biến phân loại xác định các nhóm cần so sánh đưa vào khung Factor

Chọn Options: đánh dấu vào Descriptive và Homogeneity – of – variance

 

Đọc kết quả:

Sig. ≤ α: bác bỏ giả thuyết H0 => tồn tại ít nhất một giá trị trung bình tổng thể khác với các trung bình còn lại

Sig. > α: không bác bỏ giả thuyết H0 => không có sự khác biệt giữa các trung bình của các tổng thể

Trong trường hợp bác bỏ giả thuyết H0, có nghĩa rằng tồn tại ít nhất một nhóm có giá trị trung bình khác với các nhóm còn lại, cần tiến hành phân tích sâu bằng thủ tục Post Hoc

+ Nhấp chọn nút Post Hoc để mở hộp thoại này

+ Trong hộp thoại này, có rất nhiều phương pháp kiểm định thống kê để so sánh các giá trị trung bình giữa các nhóm

**************************************************************************************************************

 

Các kiểm định Phi Tham số (Nonparametric Tests) 

thay thế tương đương được sử dụng trong những trường hợp dữ liệu không có phân phối chuẩn, hoặc cho các mẫu nhỏ


 

 

 

 

Thạc sĩ. Nguyễn Ngọc Quí

 

Tin cùng loại


SỞ Y TẾ THÀNH PHỐ CẦN THƠ
BỆNH VIỆN ĐA KHOA QUẬN Ô MÔN

Địa chỉ: Số 83, CMT8, P. Châu Văn Liêm, Q. Ô Môn, TP. Cần Thơ
Điện thoại: 02923.861.946 - Fax: 02923.860.305
Email: bvdk_omon@cantho.gov.vn

Design by Tính Sử