Biểu đồ kiểm soát (Statisical Process Control - SPC) là công cụ theo dõi tính ổn định của quy trình, dựa trên giả định các quan sát thu được trong mỗi khoảng thời gian là độc lập. Tuy nhiên, khi thực hiện việc lấy mẫu thường xuyên có thể xảy ra sự tự tương quan (các giá trị có xu hướng giống nhau). Việc xây dựng được biểu đồ kiểm soát dữ liệu tự tương quan phụ thuộc vào việc xây dựng mô hình chuỗi thời gian tham số, nắm bắt các dữ liệu động của quy trình, tách biệt dữ liệu đó với hệ thống để tránh ảnh hưởng tới các quy trình sắp tới. Sử dụng phần mềm Statgraphics centurion để xây dựng biểu đồ kiểm soát cho dữ liệu tự tương quan.
Ví dụ: Nghiên cứu môi trường nuôi cấy in vitro thích hợp cho giống cây A, người ta tiến hành đo nồng độ pH môi trường 2 giờ/lần thu được 197 kết quả:
Bảng 1. Bảng dữ liệu nồng độ pH môi trường nuôi cấy
Xây dựng biểu đồ kiểm soát cho dữ liệu theo các bước sau:
Bước 1: Vẽ biểu đồ dữ liệu
Chạy biểu đồ
Chọn: Plot – Time Sequence Plots – Run Charts – Individuals
Hình 1. (a) Hộp thoại nhập dữ liệu cho chạy biểu đồ; (b) Biểu đồ nồng độ pH môi trường; (c) Tóm tắt phân tích biểu đồ
Giá trị P = 1,38815 x 10-11 ≤ 0,025 nên có sự phân cụm, dữ liệu được nhóm lại tương tự gần nhau hơn ở mức độ tin cậy 95%.
Biểu đồ dữ liệu riêng lẻ
Chọn: SPC – Control Charts – Basic Variables Charts – Individuals
Hình 2. (a) Hộp thoại nhập dữ liệu riêng lẻ; (b) Biểu đồ X về nồng độ pH; (c) Biểu đồ MR(2) về nồng độ pH
Với dữ liệu Bảng 1, biểu đồ kiểm soát được xây dựng với giả định dữ liệu theo phân phối chuẩn, có giá trị trung bình bằng 7,06244 và độ lệch chuẩn bằng 0,244247. Trong số 197 điểm hiển thị trên biểu đồ, có 17 điểm vượt quá giới hạn kiểm soát ở Hình 2b và 5 điểm vượt quá giới hạn kiểm soát ở Hình 2c.
Bước 2: Xây dựng mô hình chuỗi thời gian tham số
Sử dụng mô hình ARIMA (AutoRegressive, Integrated, Moving Average) để dự đoán các giá trị sắp tới, dựa trên các dữ liệu hiện tại.
Phương pháp mô tả chuỗi thời gian
Để xác định loại mô hình ARIMA sử dụng cho tập hợp dữ liệu, chọn: Describe –Time Series – Descriptive Methods.
Hình 3. (a) Hộp thoại nhập dữ liệu cho các phương pháp chuỗi thời gian mô tả; (b) Sơ đồ hàm tự tương quan mẫu; (c) Đồ thị hàm tự tương quan từng phần mẫu
Dự báo tự động mô hình ARIMA phù hợp cho chuỗi thời gian
Chọn: Forecast – Automatic Forecasting.
Hình 4. (a) Hộp thoại tùy chọn phân tích dự báo tự động; (b) Hàm dự báo cho mô hình đã chọn; (c) Tóm tắt phân tích mô hình dự báo
Quy trình này đưa ra dự báo mô hình tốt nhất cho dữ liệu với p = 2 và q = 1. Trong đó, trung bình quá trình ước tính μˆ = 17,07; độ lệch chuẩn của nhiễu (các biến thể trong dữ liệu) ước tính σˆ a = 0,3142.
Bước 3: Xây dựng biểu đồ kiểm soát
Sau khi biết được mô hình phù hợp nhất với dữ liệu, tiến hành xây dựng mô hình kiểm soát bằng cách chọn: SPC – Control Charts – Special Purpose Control Charts – ARIMA Individuals Chart
Hình 5. (a) Hộp thoại tùy chọn phân tích cho biểu đồ riêng lẻ; (b) Biểu đồ kiểm soát dựa trên giới hạn dài hạn; (c) Tóm tắt phân tích cho biểu đồ riêng lẻ
Biểu đồ kiểm soát được xây dựng với giả định dữ liệu có phân phối chuẩn với giá trị trung bình bằng 7,06413 và độ lệch chuẩn bằng 0,401903. Tuy nhiên, biểu đồ không theo dõi những dữ liệu động xảy ra ở mỗi khoảng thời gian, mà chủ yếu phát hiện khi quy trình lệch khỏi giá trị trung bình. Để quan sát các dữ liệu động, chọn Analysis Options - Chart type - Residuals.
Hình 6. (a) Biểu đồ kiểm soát phần dư mô hình; (b) Biểu đồ kiểm soát MR(2) của phần dư mô hình
Biểu đồ hiển thị giá trị ước tính trong mô hình, bao gồm những điểm dữ liệu động ảnh hưởng đến quy trình tại mỗi khoảng thời gian. Trong đó, có 1 điểm vượt quá giới hạn (Hình 6a) và 5 điểm vượt quá giới hạn (Hình 6b).
Bên cạnh đó, có thể chọn Analysis Options - Data with one-step limits để vẽ gián tiếp đồ thị phần dư (Hình 7a), bao gồm các dữ liệu gốc và giới hạn kiểm soát, đồng thời đưa ra các cảnh báo tương tự về việc vượt quá giới hạn kiểm soát như Hình 6.
Hình 7. (a) Biểu đồ kiểm soát với giới hạn một bước; (b) Hàm tự tương quan phần dư
Kết quả các cột ở Hình 7b đều nằm trong (hoặc rất gần) giới hạn xác suất 95%, cho thấy không còn hiện tượng tự tương quan trong phần dư.
Vân Anh
----------------------------------------
Tài liệu tham khảo:
– https://www.statgraphics.com/how-to-guides
– https://pms.edu.vn/bieu-do-kiem-soat/
– https://vietnambiz.vn/moi-quan-he-tuong-quan-chuoi-tu-tuong-quan-serial-correlation-autocorrelation-trong-thong-ke-la-gi-hau-qua-20200103190445675.htm
– https://www.machinelearningplus.com/time-series/arima-model-time-series-forecasting-python/
---------------------------------------------------------------------------------------------------