Khi lấy mẫu từ một quần thể, các giá trị thu được từ mẫu có xu hướng tương đối giống nhau (đồng nhất) hoặc khác nhau (không đồng nhất). Việc so sánh nhiều mẫu được thiết kế để xác định xem có sự khác biệt đáng kể giữa các mẫu và trong mẫu hay không.
Khi tiến hành so sánh nhiều mẫu, dữ liệu có thể được hiển thị bằng nhiều dạng đồ họa khác nhau, ví dụ như biểu đồ phân tán, sơ đồ hộp biến động giá trị bình quân,…
So sánh nhiều mẫu thường được áp dụng cho các thí nghiệm có liên quan đến thành phần hoá học có trong mẫu.
Cách thực hiện so sánh nhiều mẫu bằng phần mềm Statgraphics
Ví dụ: Phân tích định lượng các chất kích thích sinh trưởng thực vật trong các mẫu sinh học.
Có thể so sánh nhiều mẫu bằng phần mềm Statgraphics, theo các bước như sau:
Bước 1: Nhập dữ liệu vào “DataBook”. Có 2 cách để nhập dữ liệu:
• Cách 1: Nhập trực tiếp vào “DataBook”
• Cách 2: Nhập dữ liệu vào một phần mềm khác như Excel, sau đó copy hay load vào phần mềm Statgraphics.
=> Sau khi nhập vào “DataBook” cho kết quả dữ liệu có trong Statgraphics:
Bước 2: Tính toán so sánh nhiều mẫu trong Statgraphics: Chọn Compare/Multiple Samples/Multiple Sample-Comparison.
• Input:
- Multiple Data Columns: nhiều cột dữ liệu (mỗi mẫu được đặt trong một cột riêng biệt).
- Data and Code Columns: một cột dữ liệu (mẫu được đặt chung trong một cột)
- Sample statistics: thống kê mẫu (trung vị của hai mẫu)
• Sample: chứa các quan sát trong mẫu.
• Select: lựa chọn tập hợp con, các điều kiện đi kèm nếu có.
Bước 3: Lựa chọn kết quả
• Table: Tùy theo điều kiện nghiên cứu mà lựa chọn. Ví dụ, với dữ liệu về thống kê chọn: Analysis Summary; Summary Statistics; …
• Graphs: Lựa chọn biểu đồ phù hợp để hỗ trợ quan sát. Ví dụ biểu đồ Box-and-Whisker Plot hiển thị các đặc điểm, dữ liệu hỗ trợ quan sát; Biểu đồ Scatlerplot cho thấy được độ phân tán dữ liệu;…
Bước 4: Đọc kết quả thống kê
a) Tóm tắt phân tích trong mẫu (Analysis Summary)
Cho thấy số lượng quan sát trong mỗi mẫu, các giá trị lớn nhất và nhỏ nhất được hiển thị.
b) Tóm tắt các chỉ tiêu thống kê (Summary Statistics)
Hiển thị thống kê tóm tắt cho các mẫu dữ liệu:
Ý nghĩa của kết quả thống kê:
• Count (n): dung lượng mẫu.
• Average (Xbq): số trung bình.
• Standard deviation (S): sai tiêu chuẩn mẫu.
• Coeff. of variation: hệ số biến động CV% = S/X*100
• Minimum: trị số quan sát bé nhất.
• Maximum: trị số quan sát lớn nhất.
• Range: trung vị của dãy quan sát
• Stnd. skewness: độ lệch
• Stnd. kurtosis: độ nhọn
c) So sánh giá trị giữa các mẫu (ANOVA table)
Bảng ANOVA phân tích phương sai của dữ liệu, bao gồm thành phần giữa các mẫu và thành phần trong mẫu.
Tỷ lệ F (trong trường hợp này bằng 20,06) là tỷ lệ giữa ước tính giữa các mẫu với ước tính trong mẫu. Vì giá trị P của thử nghiệm F nhỏ hơn 0,05 nên có sự khác biệt giữa giá trị trung bình của 4 mẫu ở mức độ tin cậy 95,0%.
• Xác định mức độ khác biệt giữa các mẫu (Multiple Range Tests)
Trong ví dụ hiện tại, có sự khác biệt ước tính giữa mỗi cặp mẫu, dấu hoa thị được đặt bên cạnh 4 cặp, biểu thị các cặp khác biệt có ý nghĩa thống kê ở mức độ tin cậy 95,0%.
d) Các biểu đồ đặc trưng
Một số loại biểu đồ dùng để biểu diễn đặc trưng
• Biểu đồ phân tán (Scatlerplot)
• Biểu đồ hộp biến động giá trị bình quân (Box-and-Whisker Plot)
• Biểu đồ phần dư (Residual Plot)
• Biểu đồ hiển thị độ lệch của các mức hệ số so với giá trị trung bình (Graphical ANOVA)
---------------------------------------------------------------------------------------------------