Chuỗi thời gian là dạng dữ liệu được ghi lại tại các thời điểm cách đều nhau, ví dụ như doanh số bán hàng hàng tháng, giá cổ phiếu đóng cửa hàng ngày, số lượt chuyến bay cất, hạ cánh hàng tuần và các mẫu tự động thu thập từ quy trình sản xuất,...
Khi dữ liệu có xu hướng biến động theo chu kỳ trong một khoảng thời gian cố định, chẳng hạn như doanh số bán kẹo tăng mạnh vào các dịp 1/6 và Trung thu; lượng giao thông đi lại tăng nhanh khi đến mùa du lịch, thì dữ liệu này được coi là có yếu tố theo mùa.
Vì vậy, việc nắm bắt và dự báo đúng xu hướng theo mùa trong chuỗi thời gian là yếu tố then chốt để tối ưu hóa hoạt động và ra quyết định kinh doanh thông minh. Phần mềm Statgraphics hỗ trợ thiết kế, phân tích và dự báo dữ liệu chuỗi thời gian theo mùa một cách hiệu quả.
Ví dụ: Xem xét lưu lượng giao thông qua cầu Trường Tiền hàng tháng, từ tháng 1/2012 đến tháng 12/2025. Trong khoảng thời gian này, có một đợt bão và một đợt dịch bệnh làm ảnh hưởng đáng kể đến giao thông ở đi lại trên cầu.
Bước 1: Phương pháp mô tả
Vẽ biểu đồ dữ liệu chuỗi thời gian, chọn: Describe – Time Series – Descriptive Methods

Hình 1: Hộp thoại nhập dữ liệu cho quy trình phương pháp mô tả
Dữ liệu được lấy mỗi tháng một lần, bắt đầu từ tháng 1 năm 2012. Đây là dữ liệu có tính thời vụ và mang tính chu kỳ với khoảng thời gian là 12 tháng (Hình 2).

Hình 2: Sơ đồ trình tự thời gian của lưu lượng giao thông hàng tháng
Trong giai đoạn khảo sát, xu hướng lưu lượng giao thông qua cầu Trường Tiền nhìn chung tăng dần theo thời gian. Tuy nhiên, xu hướng này đã hai lần bị gián đoạn rõ rệt vào mùa thu năm 2017 và mùa xuân năm 2023, do ảnh hưởng của bão Damrey và đại dịch COVID-19, khiến lượng giao thông sụt giảm đáng kể.
Đáng chú ý, dữ liệu cũng cho thấy một chu kỳ biến động đều đặn theo năm, với đỉnh điểm thường rơi vào các tháng mùa hè, thời điểm Huế đón lượng lớn khách du lịch tham quan.

Hình 3: Hàm tự tương quan mẫu
Tự tương quan tại độ trễ k là mức tương quan giữa các quan sát cách nhau k khoảng thời gian. Một giá trị dương lớn tại độ trễ 1 cho thấy các quan sát liền kề có xu hướng tương đồng. Mặc dù tương quan giảm dần khi khoảng cách tăng, nhưng lại tăng trở lại tại các độ trễ 12, 24, 36 và 48 tháng phản ánh tính lặp lại theo năm, cho thấy rõ tính thời vụ 12 tháng.

Hình 4: Biểu đồ tần số mẫu
Biểu đồ tần số (periodogram) giúp nhìn thấy được mức độ ảnh hưởng của các dao động ở những tần số khác nhau đến sự biến động chung của chuỗi dữ liệu theo thời gian. Biểu đồ được tạo ra nhờ phân tích Fourier, trong đó, dữ liệu được tách thành các sóng hình sin. Dữ liệu có yếu tố chu kỳ rõ rệt sẽ xuất hiện một đỉnh lớn trên biểu đồ. Bên cạnh đó, cũng có thể thấy những đỉnh nhỏ hơn tại các bội số của tần số đó (gọi là sóng điều hòa), cho thấy dao động theo mùa không hoàn toàn đều đặn.
Bước 2: Phân tích dữ liệu theo mùa
Khi phân tích dữ liệu chuỗi thời gian, xem xét dữ liệu gồm: (1) Xu hướng – T; (2) Chu kỳ - C; (3) Tính thời vụ - S; (4) Ngẫu nhiên hoặc không thường xuyên – R.
Có hai mô hình cơ bản để phân tích chuỗi thời gian thành các phần thành phần:
- Mô hình nhân giả định rằng dữ liệu tại thời điểm t có thể được biểu diễn dưới dạng tích của bốn thành phần: Yt=TtCtStRt
- Mô hình cộng giả định rằng các thành phần được cộng thêm: Yt=Tt + Ct + St + Rt
Tiến hành tách chuỗi thời gian quan sát chọn: Describe – Time Series – Seasonal Decomposition
- Biểu đồ thứ nhất hiển thị chu kỳ xu hướng

Hình 5: Sơ đồ thành phần chu kỳ xu hướng
Biểu đồ hiển thị dữ liệu gốc, trên đó đường trung bình động có độ dài tương ứng với chu kỳ mùa vụ. Hình 5 cho thấy tác động của hai đợt bão và dịch bệnh ảnh hưởng đến lưu lượng giao thông qua cầu Trường Tiền.
- Biểu đồ thứ hai hiển thị các chỉ số theo mùa

Hình 6: Biểu đồ các chỉ số theo mùa
Các chỉ số theo mùa ước tính thành phần mùa vụ St. Khi sử dụng mô hình nhân, các chỉ số được biểu thị trên cơ sở tỷ lệ phần trăm. Tác động mạnh mẽ theo mùa đối với dữ liệu giao thông, tăng từ mức thấp trong Tháng 1 lên mức cao nhất vào Tháng 8 và sau đó lại giảm xuống.
- Biểu đồ thứ ba hiển thị thành phần không đều

Hình 7: Sơ đồ thành phần không đều hoặc dư
Trong mô hình nhân, thành phần không đều được biểu diễn dưới dạng phần trăm, vào tháng 3 năm 2017, thành phần này giảm còn khoảng 86%, cho thấy lưu lượng giao thông thấp hơn khoảng 14% so với mức dự kiến. Khi quá trình phân tách đã được thực hiện, có thể lấy dữ liệu gốc và chia nó cho các chỉ số theo mùa ước tính để thu được dữ liệu được điều chỉnh theo mùa Yt′, với ![]()
⇒ Dữ liệu được điều chỉnh theo mùa được biểu thị

Hình 8: Dữ liệu điều chỉnh theo mùa
Dữ liệu được điều chỉnh theo mùa giữ lại các thành phần chu kỳ xu hướng và không đều. Tuy nhiên, tính thời vụ đã bị loại bỏ.
Bước 3: Dự báo
Để dự báo giá trị lưu lượng giao thông trong những tháng tiếp theo, có thể làm theo hai cách:
- Sử dụng mô hình dự báo theo mùa
Chọn Forecast – Automatic Model Selection và tiếp tục chọn phân tích để chỉ định các mô hình cần xem xét.

Hình 9: Hộp thoại nhập dữ liệu (a) và hộp thoại phân tích (b)
Có hai phương pháp chính để dự báo dữ liệu có tính mùa vụ: phương pháp Winters sử dụng mô hình nhân với ba bước làm mịn để ước lượng xu hướng và yếu tố mùa vụ. Trong khi đó, ARIMA mô tả dữ liệu như sự kết hợp tuyến tính của các ảnh hưởng (cú sốc) trong quá khứ. Quy trình dự báo tự động sẽ tự động lựa chọn và tối ưu các mô hình phù hợp, bao gồm việc thử các tổ hợp tham số (p,d,q) và (P,D,Q) trong mô hình ARIMA.
Bảng so sánh mô hình mức độ phù hợp của hai loại mô hình này:

Hình 10: So sánh các mô hình dự báo theo mùa
Model (L) là quy trình của Winter, ba tham số làm mịn hàm mũ, α, β và γ, đã được tối ưu hóa bằng cách giảm thiểu sai số dự báo bình phương trung bình. Các mô hình (M) đến (Q) đại diện cho 5 mô hình ARIMA tốt nhất. Để xếp hạng mức độ phù hợp của các mô hình, tiêu chí thông tin (AIC) dự báo một khoảng thời gian được tính:

Trong đó, RMSE là sai số bình phương trung bình gốc trong khoảng thời gian ước tính, c là số lượng tham số ước tính trong mô hình được trang bị và n là cỡ mẫu.
Theo AIC, mô hình (M) là tốt nhất. Các dự báo từ mô hình này được hiển thị trên biểu đồ trình tự thời gian:

Hình 11: Dự báo từ mô hình theo mùa tối ưu
Đường liền màu nâu thể hiện giá trị dự báo trung bình, trong khi đường màu đỏ biểu thị giới hạn dự báo 95%.
- Sử dụng mô hình dự báo không theo mùa
Chọn Analysis Options => Xuất hiện hộp thoại

Hình 12: Hộp thoại tùy chọn phân tích với lựa chọn các mô hình không theo mùa
Khi sử dụng quy trình dự báo tự động để áp dụng mô hình không theo mùa cho dữ liệu có yếu tố mùa vụ, hệ thống sẽ loại bỏ yếu tố mùa vụ khỏi dữ liệu. Áp dụng các phương pháp dự báo lên dữ liệu đã được điều chỉnh, kết hợp dự báo với chỉ số mùa vụ để tạo ra dự báo cho dữ liệu ban đầu. Kết quả hiển thị:

Hình 13: So sánh các mô hình dự báo không theo mùa
Phương pháp làm mịn số mũ đơn giản cho giá trị AIC thấp nhất và xử lý tốt tính thời vụ nhưng chúng không có thành phần xu hướng (Hình 14).

Hình 14: Dự báo từ phương pháp làm mịn số mũ đơn giản trên dữ liệu đã điều chỉnh theo mùa
Kết luận
Statgraphics cung cấp nhiều công cụ phân tích chuỗi thời gian hiệu quả. Quy trình Phương pháp mô tả hỗ trợ trực quan hóa dữ liệu và nhận diện tính mùa vụ thông qua hàm tự tương quan và biểu đồ chu kỳ. Quy trình Phân rã theo mùa cho phép tách chuỗi thời gian thành các thành phần: xu hướng, mùa vụ, giúp làm rõ các yếu tố tác động theo thời gian. Bên cạnh đó, quy trình Dự báo tự động sẽ tự động lựa chọn mô hình dự báo tối ưu dựa trên các tiêu chí thông tin, đảm bảo độ chính xác và phù hợp với dữ liệu thực tế. Công cụ này có thể áp dụng linh hoạt cho nhiều loại chuỗi thời gian khác nhau, hỗ trợ người dùng đưa ra dự báo chính xác và hiệu quả trong thực tiễn.
Vân Anh
----------------------------------------
Tài liệu tham khảo:
https://www.statgraphics.com/how-to-guides
---------------------------------------------------------------------------------------------------