Phân tích thống kê mô tả-Kiểm định giả thuyết thống kê
đối với các thống kê cơ bản
I. PHÂN TÍCH DỮ LIỆU
1.PHÂN TÍCH THỐNG KÊ MÔ TẢ
- Các phương pháp cơ bản để tiến hành phân tích thống kê mô tả cho các biến:
+ Bảng tần số
+ Các đại lượng thống kê mô tả
+ Bảng kết hợp nhiều biến
+ Biểu đồ, đồ thị
1.1.Bảng tần số (cho cả biến định tính và định lượng)
Thực hiện trên SPSS:
Analyze => Descriptive Statistics => Frequencies
- Từ danh sách các biến, chọn biến cần phân tích và chuyển vào hộp
1.2.Các đại lượng thống kê mô tả (cho biến định lượng)
+ Các đại lượng đo lường mức độ tập trung: trung bình (mean), trung vị (median), số mode, tứ phân vị (quartiles)…
+ Các đại lượng đo lường mức độ phân tán: khoảng biến thiên (range), phương sai (variance), độ lệch chuẩn (standard deviation)…
+ Các đại lượng mô tả phân phối: hệ số Skewness và hệ số Kurtosis
Thực hiện:
Analyze => Descriptive Statistics => Descriptives
+Chọn biến định lượng cần phân tích vào khung Variable(s).
+Mở hộp thoại Options, chọn các đại lượng thống kê cần tính toán để mô tả cho phân phối của biến định lượng đó
-Lập bảng tần số kết hợp tính toán các đại lượng thống kê mô tả cho biến định lượng
Analyze => Descriptive Statistics => Frequencies
Chọn biến định lượng vào khung Variable(s)
Mở hộp thoại Statistics để lựa chọn các đại lượng thống kê mô tả cho biến định lượng đó
1.3. Bảng kết hợp nhiều biến
1.3.1. Bảng kết hợp giữa các biến định tính
Analyze => Descriptive Statistics => Crosstabs
Analyze => Tables => Custom Tables
Row(s) : ô chứa biến dòng khi truy xuất bảng dữ liệu
Column(s): ô chứa biến cột khi truy xuất bảng dữ liệu
13.2. Bảng kết hợp giữa biến định lượng và biến định tính
Analyze => Tables => Custom Tables
Chọn biến định lượng vào ô Rows
Chọn biến định tính vào ô Columns
Chọn hộp thoại Summary Statistics để tính toán các giá trị thống kê Row%, Col%
Chọn hộp thoại Catagories and Total để thể hiện giá trị Tổng
1.4. Biểu đồ, đồ thị:
1.4.1. Các loại đồ thì cơ bản:
- Biểu đồ thanh (Bar Chart): được sử dụng biểu diễn dữ liệu dưới dạng tần số hay tần suất %
- Biểu đồ hình tròn (Pie Chart): sử dụng biểu diễn dữ liệu định tính dạng tần số hay tần suất % khi có ít nhóm
- Biểu đồ đường gấp khúc (Line Chart) và diện tích (Area Chart): áp dụng tốt cho dữ liệu định lượng
II. KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
1.1.Quy trình:
Bước 1: Thành lập giả thuyết không H0
Ví dụ: H0: μ = μ0
Bước 2: Thành lập giả thuyết nghiên cứu H1
Ví dụ: H1: μ ≠ μ0 hoặc μ ≤ μ0 hoặc μ ≥ μ0
Bước 3: Xác định mức ý nghĩa α
Bước 4: Chọn các tham số thống kê thích hợp cho việc kiểm định, xác định miền bác bỏ, miền chấp nhận và giá trị tới hạn
Bước 5: Tính toán các giá trị của các tham số thống kê trong việc kiểm định dựa trên số liệu của mẫu ngẫu nhiên
Bước 6: Ra quyết định: Nếu các giá trị tính toán rơi vào miền bác bỏ giả thuyết H0 thì ra quyết định bác bỏ, ngược lại sẽ chấp nhận giả thuyết H0
Với SPSS, ta dùng giá trị Sig. để ra quyết định
+ Nếu giá trị Sig. nhỏ hơn mức ý nghĩa α, giả thuyết H0 bị bác bỏ, chấp nhận giả thuyết H1
+ Nếu giá trị Sig. lớn hơn mức ý nghĩa α, không đủ bằng chứng thống kê để bác bỏ giả thuyết H0
1.2. Kiểm định mối liên hệ giữa 2 biến
1.2.1. Kiểm định Chi bình phương
- Dùng để kiểm định mối liên hệ giữa hai biến định tính (2 biến định danh hoặc giữa biến định danh – biến thứ tự) trong tổng thể
- Cho biết có tồn tại mối liên hệ giữa hai biến hay không
- Giả thuyết H0: hai biến độc lập với nhau
-Giả thuyết H1: hai biến có liên hệ với nhau
Đọc kết quả:
Sig. ≤ α: bác bỏ giả thuyết H0
Sig. > α: không bác bỏ giả thuyết H0
Cách thực hiện: Lập bảng chéo (Crosstabs) để tìm hiểu mối quan hệ giữa hai biến
Chọn nút Statistics/Chi – square
Lưu ý:
+ Kiểm định Chi bình phương chỉ có ý nghĩa khi số quan sát đủ lớn (tỷ lệ các ô chéo trong bảng có tần số <5 phải nhỏ hơn 20%)
+ Kiểm định này không cho biết độ mạnh của mối liên hệ giữa hai biến mà phải sử dụng các đại lượng Cramer V, hệ số liên hợp (Coefficient of contigency)…
1.2.2.Kiểm định giá trị trung bình tổng thể
Nếu muốn so sánh giá trị trung bình tổng thể với một giá trị cụ thể nào đó
=> Kiểm định giả thuyết về trung bình của tổng thể ONE – SAMPLE T – TEST. Nếu muốn so sánh hai giá trị trung bình của hai tổng thể riêng biệt => Kiểm định giả thuyết về sự bằng nhau giữa hai trung bình tổng thể, mẫu độc lập INDEPENDENT – SAMPLES T – TEST . Nếu muốn so sánh hai giá trị trung bình của hai tổng thể phụ thuộc lẫn nhau => Kiểm định giả thuyết về sự bằng nhau giữa hai trung bình tổng thể, mẫu phụ thuộc PAIRED – SAMPLES T – TEST
Nếu muốn so sánh giá trị trung bình giữa ba nhóm tổng thể riêng biệt trở lên => Kiểm định giả thuyết về sự bằng nhau giữa trung bình 3 tổng thể trở lên ONE – WAY ANOVA
1.2.2.1 -One – Sample T – test
So sánh giá trị trung bình của một tổng thể với một giá trị cụ thể nào đó, sử dụng kiểm định One – sample T – test
Điều kiện áp dụng:
Mẫu được chọn phải ngẫu nhiên (Random)
Mẫu phải có phân phối chuẩn hoặc xấp xỉ chuẩn
Giả thuyết:
H0: μ = m
H1: μ ≠ m
Cách thực hiện:
Trên thanh Menu, chọn Analyze/Compare Means/One – Sample T – test
Chọn biến đưa vào khung Test variable
Khai báo giá trị Test Value
Đọc kết quả:
Sig. ≤ α: bác bỏ giả thuyết H0
Sig. > α: không bác bỏ giả thuyết H0
1.2.2.2. Independent – samples T – test
So sánh hai trung bình của hai tổng thể dựa trên hai mẫu độc lập, sử dụng kiểm định Independent – samples T – test
Điều kiện áp dụng:
Kích thước 2 mẫu so sánh phải bằng hoặc tương đương nhau
Hai mẫu so sánh phải được chọn ngẫu nhiên, có phân phối chuẩn hoặc xấp xỉ phân phối chuẩn và có phương sai như nhau
Giả thuyết
H0: μ1 = μ2
H1: μ1 ≠ μ2
Cách thực hiện:
Trên thanh Menu, chọn Analyze/Compare Means/Independent – samples T – test
Chọn biến định lượng đưa vào khung Test Variable
Chọn biến định tính (chia số quan sát thành 2 nhóm mẫu độc lập) đưa vào khung Grouping Variable
Chọn Define Groups để khai báo hai nhóm cần so sánh với nhau
Dựa vào kết quả kiểm định sự bằng nhau của hai phương sai (Levene’s test) với giả thuyết
+H0: Phương sai của hai tổng thể là như nhau
+H1: Phương sai của hai tổng thể là khác nhau
+Nếu giá trị sig. ≤ α => bác bỏ giả thuyết H0, do đó sử dụng kết quả kiểm định t ở cột Equal variances not assumed
+Nếu giá trị sig. > α => không bác bỏ giả thuyết H0, do đó sử dụng kết quả kiểm định t ở cột Equal variances assumed
1.2.2.3. Paired – samples T – test
So sánh hai giá trị trung bình của hai tổng thể dựa trên hai mẫu phụ thuộc hay mẫu phối hợp từng cặp, sử dụng Paired – samples T – test
Điều kiện áp dụng:
Kích thước 2 mẫu bằng nhau
Chênh lệch giữa các giá trị của 2 mẫu phải có phân phối chuẩn hoặc kích thước mẫu đủ lớn để xem như có phân phối chuẩn
Giả thuyết
H0: μ1 = μ2
H1: μ1 ≠ μ2
Cách thực hiện:
Trên thanh Menu, chọn Analyze/Compare Means/Paired – samples T – test
Chọn 2 biến chứa các giá trị của 2 mẫu quan sát đưa vào khung Paired Variables để so sánh
Đọc kết quả:
Sig. ≤ α: bác bỏ giả thuyết H0
Sig. > α: không bác bỏ giả thuyết H0
1.2.2.4. One – way ANOVA
Nếu muốn so sánh giá trị trung bình của nhiều nhóm tổng thể độc lập, sử dụng phân tích phương sai ANOVA (ANalyse Of VAriancies)
Phân tích phương sai một yếu tố One – way ANOVA trong trường hợp sử dụng 1 biến yếu tố để phân loại các quan sát thành các nhóm khác nhau
Điều kiện áp dụng:
Các nhóm so sánh phải độc lập và được chọn một cách ngẫu nhiên
Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu đủ lớn để được xem như là phân phối chuẩn
Phương sai của các nhóm so sánh đồng nhất (đều nhau)
Giả thuyết
H0: μ1 = μ2 = μ3 = …
H1: μ1 ≠ μ2 ≠ μ3 ≠ …
Cách thực hiện:
Trên thanh Menu, chọn Analyze/Compare Means/One – way ANOVA
Chọn biến định lượng đưa vào khung Dependent List
Chọn biến phân loại xác định các nhóm cần so sánh đưa vào khung Factor
Chọn Options: đánh dấu vào Descriptive và Homogeneity – of – variance
Đọc kết quả:
Sig. ≤ α: bác bỏ giả thuyết H0 => tồn tại ít nhất một giá trị trung bình tổng thể khác với các trung bình còn lại
Sig. > α: không bác bỏ giả thuyết H0 => không có sự khác biệt giữa các trung bình của các tổng thể
Trong trường hợp bác bỏ giả thuyết H0, có nghĩa rằng tồn tại ít nhất một nhóm có giá trị trung bình khác với các nhóm còn lại, cần tiến hành phân tích sâu bằng thủ tục Post Hoc
+ Nhấp chọn nút Post Hoc để mở hộp thoại này
+ Trong hộp thoại này, có rất nhiều phương pháp kiểm định thống kê để so sánh các giá trị trung bình giữa các nhóm
**************************************************************************************************************
Các kiểm định Phi Tham số (Nonparametric Tests)
thay thế tương đương được sử dụng trong những trường hợp dữ liệu không có phân phối chuẩn, hoặc cho các mẫu nhỏ
Thạc sĩ. Nguyễn Ngọc Quí
SỞ Y TẾ THÀNH PHỐ CẦN THƠ
BỆNH VIỆN ĐA KHOA QUẬN Ô MÔN
Địa chỉ: Số 83, CMT8, P. Châu Văn Liêm, Q. Ô Môn, TP. Cần Thơ
Điện thoại: 02923.861.946 - Fax: 02923.860.305
Email: bvdk_omon@cantho.gov.vn
Design by Tính Sử