Vui lòng điền đầy đủ các thông tin sau

DỊCH VỤ PHÂN TÍCH DỮ LIỆU

Mọi quy trình đều được thiết kế để tạo ra sản phẩm hoặc dịch vụ đáp ứng các tiêu chuẩn và yêu cầu của khách hàng. Việc tính toán khả năng của quy trình đáp ứng các tiêu chuẩn trong các hoạt động kinh doanh và sản xuất giúp doanh nghiệp đo lường được hiệu suất, xác định mức độ hiện tại của quy trình, và là nền tảng cho việc cải tiến quy trình nâng cao năng suất, chất lượng sản phẩm, dịch vụ. Có nhiều phần mềm thống kê có khả năng phân tích, tính toán như phầm mềm thống kê STATGRAPHICS Centurion.

 

Ví dụ: Một công ty A mới tiếp nhận quy trình chuyển giao sản xuất tấm wafer (tấm bán dẫn bằng silicon) từ nước ngoài với yêu cầu điện trở suất của tấm wafer đạt 225, phạm vi cho phép điện trở suất từ 100 - 500. Để tính toán khả năng của quy trình sản xuất tấm wafer của công ty, tiến hành đo liên tiếp điện trở suất của 100 tấm wafer, sử dụng phần mềm thống kê để phân tích dữ liệu thu được.

Bảng 1. Bảng dữ liệu nồng độ pH môi trường nuôi cấy

 

Bước 1: Vẽ đồ thị dữ liệu theo thứ tự thời gian, sử dụng Run Chart

Chọn: Plot – Time Sequence Plots – Run Charts – Individuals (dành cho dữ liệu riêng lẻ) hoặc Grouped Data (dành cho dữ liệu được lấy theo nhóm). Kết quả hiển thị:

 

 

Hình 1: Hộp thoại nhập dữ liệu cho quy trình chạy biểu đồ

 

Hình 2: Biểu đồ phép đo điện trở suất

Biểu đồ hiển thị các mẫu quan sát được vẽ theo thứ tự thời gian. Để xem xét tính ổn định của quy trình trong suốt thời gian lấy mẫu cũng như mức độ thay đổi, sự biến thiên, tiến hành chọn Smooth/Rotate – Robust Lowess để giúp trực quan hóa mối quan hệ giữa các biến được vẽ trên mỗi trục.

 

Hình 3: Biểu đồ với mức thấp

Kết quả chạy biểu đồ (Hình 3) cho thấy, mức độ thay đổi của quy trình rất ít trong khoảng thời gian thu thập dữ liệu và tăng nhẹ vào khoảng giữa thời kỳ.

 

Hình 4: Tóm tắt phân tích chạy biểu đồ

Kết hợp biểu đồ và bảng phân tích, số lần chạy trên hoặc dưới mức trung vị ít hơn dự kiến. Giá trị P ở cột ngoài cùng bên phải ≥ 0,05 nên không có sự thay đổi nghiêm trọng nào trong khoảng thời gian lấy mẫu.

Tuy nhiên, xem xét về phân bố chung, dữ liệu thiếu tính đối xứng, với một số điểm ở thấp hơn và một số điểm cao hơn so với trung vị. Những điểm này có thể có tác động đến khả năng tính toán của quy trình, ảnh hưởng trực tiếp đến giá trị Sigma (thước đo biểu thị năng lực) của quy trình, dẫn đến ước tính không chính xác về khả năng của quy trình.

Để tìm hiểu mối tương quan giữa các phép đo, chọn: Describe – Time Series – Descriptive Methods.

 

Hình 5: Hàm tự tương quan ước tính

Kết quả (Hình 5) cho thấy, không có sự tự tương quan nào giữa các phép đo (các cột đều nằm trong giới hạn đường nằm ngang màu đỏ).

Trường hợp, nếu có sự tương quan giữa các phép đo thì giải quyết theo một trong các cách sau: (1) Xây dựng mô hình chuỗi thời gian để thể hiện động lực của quy trình; (2) Tăng khoảng thời gian giữa các mẫu để loại bỏ mối tương quan.

 

Bước 2: Xử lý tính chất không chuẩn trong dữ liệu

Lựa chọn phân phối phù hợp

Chọn: Describe – Distribution Fitting – Fitting Uncensored Data

 

Hình 6: Kiểm tra đầu ra chuẩn từ quy trình phân phối 

Giá trị P-Value = 0.000373 < 0,05 dữ liệu không tuân theo phân phối. Để chọn một kiểu phân phối thay thế, chọn Tables Options - Comparison of Alternative Distributions. Kết quả sẽ đưa ra nhiều loại phân phối khác nhau và sắp xếp chúng theo tiêu chí mức độ phù hợp.

 

Hình 7: (a) So sánh đầu ra của các bản phân phối thay thế từ quy trình lắp đặt phân phối; (b) Biểu đồ của năm phân phối

Theo thống kê Kolmogorov-Smirnov D và thống kê Anderson-Darling A2, phân bố loglogistic là phù hợp nhất với dữ liệu (có đỉnh cao nhất).

Chuyển đổi dữ liệu

Các phép biến đổi phổ biến nhất được sử dụng trong thống kê là các phép biến đổi lũy thừa có dạng Yp , trong đó dữ liệu được nâng lên lũy thừa thứ p, bao gồm: Căn bậc hai, với p = 0,5; Số nghịch đảo, với p = -1; Logarithm, với p=0.

Chọn: Describe – Numeric Data – Power Transformations.

 

Hình 8: (a) Tóm tắt phân tích chuyển đổi dữ liệu; (b) Đồ thị độ lệch chuẩn hóa và độ nhọn; (c) Biểu đồ xác suất chuẩn cho chuyển đổi dữ liệu.

Sử dụng phương pháp Box - Cox, quy trình sẽ chọn một phép biến đổi tối ưu về dạng: Y'=(Y+λ2)λ1 và đưa ra phép biến đổi tối ưu cho dữ liệu là nâng công suất lên 0,237. Tuy nhiên, phép chuyển đổi chuẩn hóa dữ liệu chưa thật sự tốt, độ lệch và độ nhọn không nằm trong hai đường ngang (Hình 8b) và có một số giá trị được chuyển đổi nằm ngoài đường thẳng (Hình 8c).

 

Bước 3: Xác định và xử lý mọi bất thường trong dữ liệu

Nhận dạng dữ liệu ngoại lai

Chọn: Describe – Numeric Data – Outlier Identification.

 

Hình 9: Thử nghiệm dữ liệu ngoại lai

Kết quả tạo ra một biểu đồ hiển thị từng điểm cùng với giá trị trung bình mẫu và độ lệch chuẩn. Giá trị P -Value= 0,0147 < 0,05 nên giá trị là dữ liệu ngoại. Lựa chọn Exclude trên thanh công cụ để loại bỏ điểm dữ liệu nghi ngờ, kết quả giá trị trung bình và độ lệch chuẩn sẽ được tính toán lại.

 

Hình 10: Thử nghiệm sau khi loại bỏ giá trị dữ liệu ngoại lai

Sau khi loại bỏ điểm dữ liệu, giá trị P-Value = 0.286 > 0,05 cho thấy không còn giá trị ngoại lai nào.

 

Bước 4: Chạy lại quy trình

Tiến hành thực hiện lại các phân tích trước sau khi loại bỏ dữ liệu ngoại lai. Để xác định phân phối phù hợp nhất chọn: Describe – Distribution Fitting – Fitting Uncensored Data.

 

Hình 11 : Phân phối được điều chỉnh sau khi loại bỏ dữ liệu ngoại lai

Bằng cách nhập điện trở suất > 100 vào Select, phần mềm sẽ tự động phân tích 99 giá trị dữ liệu còn lại, kết quả cho thấy The Largest Extreme là phân phối tốt nhất.

Tương tư đối với quy trình chuyển đổi công suất, chọn: Describe – Numeric Data – Power Transformations.

 

Hình 12: (a) Biểu đồ độ lệch và độ nhọn sau khi loại bỏ ngoại lai; (b) Biểu đồ độ lệch và độ nhọn sau khi loại bỏ ngoại lai

Công suất tối ưu đã chuyển sang -0,53 cả độ lệch chuẩn và độ nhọn đều nằm trong phạm vi cho phép.

 

Bước 5: Tính toán khả năng của quy trình

Chọn: SPC – Capability Analysis – Variables – Individuals

 

Hình 13: Phân tích khả năng dựa trên phân phối chuẩn

Đây là kết quả của phân phối chuẩn mang lại, với số lỗi ước tính 29.360/1 triệu tấm wafe, với giá trị Sigma là 3,39. Bên cạnh đó, có thể chọn phân phối giả định hoặc chỉ định một phép chuyển đổi bằng cách lựa chọn Largest Extreme Value và nhập dữ liệu chuyển đổi vào Power.

 

Hình 14: Phân phối giá trị cực trị lớn nhất được điều chỉnh

Sau khi điều chỉnh, số lỗi ước tính trên 1 triệu tấm wafe hiện chỉ còn 6.902, ít hơn nhiều so với khi giả định phân phối chuẩn và giá trị Sigma là 4,01.

*****

Có thể thấy, phần mềm thống kê STATGRAPHICS Centurion không chỉ tính toán năng lực quy trình mà còn nhận diện được tính chất chưa chuẩn trong dữ liệu, từ đó đưa ra nhiều lựa chọn giải quyết hạn chế ảnh hưởng trực tiếp đến giá trị Sigma cũng như ước tính không chính xác về khả năng của quy trình.

Vân Anh

----------------------------------------

Tài liệu tham khảo:

1/ https://www.statgraphics.com

 

---------------------------------------------------------------------------------------------------

QUÝ ANH/CHỊ CẦN HỖ TRỢ XỬ LÝ, PHÂN TÍCH DỮ LIỆU VUI LÒNG GỬI THÔNG TIN QUA FORM DƯỚI ĐÂY

CHÚNG TÔI SẼ LIÊN HỆ PHẢN HỒI TRONG THỜI GIAN SỚM NHẤT

Back to top

Chưa có tài khoản Đăng ký ngay!

Đăng nhập