DỰ BÁO NHU CẦU KHÁM CHỮA BỆNH
Huỳnh Bảo Tuân, 2024.
Ứng dụng
(C) Weick Institute of Management Consulting, 2024
2
4/3/2025
Kỹ thuật dự báo
(C) Weick Institute of Management Consulting, 2024
3
4/3/2025
Time-Series Forecast
(C) Weick Institute of Management Consulting, 2024
5
4/3/2025
(C) Weick Institute of Management Consulting, 2024
6
4/3/2025
4 thành phần của Time series:
(C) Weick Institute of Management Consulting, 2024
7
4/3/2025
(C) Weick Institute of Management Consulting, 2024
8
4/3/2025
CÁC BƯỚC THỰC HIỆN DỰ BÁO
Nguồn: Dr. Subhashish Samaddar. Forecasting .Department of Managerial Sciences, Georgia State University
(C) Weick Institute of Management Consulting, 2024
9
4/3/2025
(C) Weick Institute of Management Consulting, 2024
10
4/3/2025
Dự báo số ca Tay Chân Miệng nhập viện cho năm 2012, dựa trên số lượng nhập viện thực tế 2010, 2011
THUẬT TOÁN TÁCH THÀNH PHẦN MÙA VỤ VÀ XU HƯỚNG
(C) Weick Institute of Management Consulting, 2024
11
4/3/2025
Minitab
Stat 🡪 time series 🡪 time series plot
Có xu hướng
Có tính mùa vụ
Số ca nhập viện
(C) Weick Institute of Management Consulting, 2024
12
4/3/2025
NGUYÊN LÝ TÁC THÀNH PHẦN MÙA VỤ VÀ XU HƯỚNG
Mô hình dự báo ở đây sẽ là:
(C) Weick Institute of Management Consulting, 2024
13
4/3/2025
Xác định Seasonal Indices
Minitab
Statistics / Time series/ Decomposition
Số ca nhập viện
(C) Weick Institute of Management Consulting, 2024
14
4/3/2025
Xác định Seasonal Indices
(C) Weick Institute of Management Consulting, 2024
15
4/3/2025
Xác định Đường xu hướng (trend line)
Sau khi tính được chỉ số mùa vụ ta sẽ tính được số nhập viện
(Deseasonalize volume) không còn chịu tác động bởi yếu tố mùa vụ.
Số lượng nhập viện loại trừ yếu tố mùa vụ = Số lượng nhập viện / Chỉ số mùa vụ
Số lượng nhập viện
Số lượng nhập viện không có yếu tố mùa vụ
(C) Weick Institute of Management Consulting, 2024
16
4/3/2025
Minitab
Statistics / Time series/trend analysis
Số lượng nhập viện không có yếu tố mùa vụ
(C) Weick Institute of Management Consulting, 2024
17
4/3/2025
Chọn
T(t) = 77,55 + 1,161t + 0,045t2
Số lượng nhập viện không có yếu tố mùa vụ
Số lượng nhập viện không có yếu tố mùa vụ
(C) Weick Institute of Management Consulting, 2024
18
4/3/2025
Kết quả mô hình dự báo
Tháng SI Tháng SI
1 1.29810 7 0.68338
2 1.37184 8 0.82151
3 1.20145 9 0.91746
4 0.93982 10 1.01264
5 0.82433 11 1.03671
6 0.80359 12 1.08916
PHƯƠNG PHÁP�TRUNG BÌNH DI ĐỘNG (MOVING AVERAGE)
Chỉ tính trung bình của n dữ liệu quá khứ gần nhất.
Ưu điểm: Chỉ cần lưu trữ ít số liệu, dễ hiểu, dễ thực hiện
Nhược điểm: Không xử lý được trong trường hợp dữ liệu có tính mùa vụ hay chu kỳ
Xác định n ?
Thử nhiều số n khác nhau, tính toán dự báo cho từng trường hợp rồi so sánh độ lệch tuyệt đối trung bình cho mỗi phương án. Phương án n nào cho trị số độ lệch nhỏ nhất sẽ là phương án thích hợp nhất cho chuỗi số liệu tương ứng.
(C) Weick Institute of Management Consulting, 2024
19
4/3/2025
�TRUNG BÌNH DI ĐỘNG (Moving average)
20
Bảng sau cho thấy số người nhập viện ở Trung tâm Cấp cứu Sài Gòn hàng tuần. Người quản lý muốn ước lượng số ca nhập viện cho tuần tới.
+ Số ca nhập viện trung bình: 30,7
Tuần | Số ca nhập viện |
1 | 22 |
2 | 21 |
3 | 25 |
4 | 27 |
5 | 35 |
6 | 29 |
7 | 33 |
8 | 37 |
9 | 41 |
10 | 37 |
Tổng | 307 |
4/3/2025
(C) Weick Institute of Management Consulting, 2024
�TRUNG BÌNH DI ĐỘNG (Moving average)
(C) Weick Institute of Management Consulting, 2024
21
4/3/2025
Tuần | Số ca nhập viện | n = 2 | Độ lệch tuyệt đối |
1 | 22 | | |
2 | 21 | | |
3 | 25 (*) | 21.50 | 3.50 |
4 | 27 | 23.00 | 4.00 |
5 | 35 | 26.00 | 9.00 |
6 | 29 | 31.00 | 2.00 |
7 | 33 | 32.00 | 1.00 |
8 | 37 | 31.00 | 6.00 |
9 | 41 | 35.00 | 6.00 |
10 | 37 | 39.00 | 2.00 |
11 | ??? | 39.00 | MAD = 4.188 |
�TRUNG BÌNH DI ĐỘNG (Moving average)
(C) Weick Institute of Management Consulting, 2024
22
4/3/2025
Tuần | Số ca nhập viện | n = 3 | Độ lệch tuyệt đối |
1 | 22 | | |
2 | 21 | | |
3 | 25 | | |
4 | 27 (*) | 22.67 | 4.33 |
5 | 35 | 24.33 | 10.67 |
6 | 29 | 29.00 | 0.00 |
7 | 33 | 30.33 | 2.67 |
8 | 37 | 32.33 | 4.67 |
9 | 41 | 33.00 | 8.00 |
10 | 37 | 37.00 | 0.00 |
11 | ??? | 38.33 | MAD = 4.334 |
�TRUNG BÌNH DI ĐỘNG (Moving average)
(C) Weick Institute of Management Consulting, 2024
23
4/3/2025
�TRUNG BÌNH DI ĐỘNG CÓ TRỌNG SỐ (WEIGHTED MA)
VD: nếu trọng số được dùng là 0.5; 0.3; và 0.2 🡪 giá trị dự báo cho tuần kế tiếp sẽ là:
0.5 x (dữ liệu tuần vừa rồi) + 0.3 x (dữ liệu 2 tuần trước đó) + 0.2 x (dữ liệu 3 tuần trước)
(C) Weick Institute of Management Consulting, 2024
24
4/3/2025
�TRUNG BÌNH DI ĐỘNG CÓ TRỌNG SỐ (WEIGHTED MA)
(C) Weick Institute of Management Consulting, 2024
25
4/3/2025
Tuần | Số lượng thực | Trung bình di chuyển 3-tuần có trọng số | Sai số tuyệt đối |
1 | 22 | | |
2 | 21 | | |
3 | 25 | | |
4 | 27 | 0,5(25) + 0,3(21) + 0,2(22) = 23,2 | 3,8 |
5 | 35 | 0,5(27) + 0,3(25) + 0,2(21) = 25,2 | 9,8 |
6 | 29 | 0,5(35) + 0,3(27) + 0,2(25) = 30,6 | 1,6 |
7 | 33 | 0,5(29) + 0,3(35) + 0,2(37) = 30,4 | 2,6 |
8 | 37 | 0,5(33) + 0,3(29) + 0,2(35) = 32,2 | 4,8 |
9 | 41 | 0,5(37) + 0,3(33) + 0,2(29) = 34,2 | 6,8 |
10 | 37 | 0,5(41) + 0,3(37) + 0,2(33) = 38,2 | 1,2 |
11 | ? | 0,5(37) + 0,3(41) + 0,2(37) = 38,2 | |
| | (MAD = 4.37) Tổng | 30,6 |
Minitab: stat 🡪 time series 🡪 moving average
(C) Weick Institute of Management Consulting, 2024
26
4/3/2025
n=2; n=3; n=4; n= 5
(C) Weick Institute of Management Consulting, 2024
27
4/3/2025
�KỸ THUẬT LÀM TRƠN HÀM SỐ MŨ (EXPONENTAL SMOOTHING)
Ft + 1 = Ft + α (Yt - Ft)
với Ft = giá trị dự báo tại thời điểm t;
Yt = giá trị số thực của thời điểm t;
α = hằng số giữa 0 và 1.
(C) Weick Institute of Management Consulting, 2024
28
4/3/2025
KỸ THUẬT LÀM TRƠN HÀM SỐ MŨ (EXPONENTAL SMOOTHING)
(C) Weick Institute of Management Consulting, 2024
29
4/3/2025
Tuần | Số lượng thực | Số lượng dự báo | Sai số tuyệt đối |
1 | 22 | 25 | 3.00 |
2 | 21 | 25 + 0,5(22 ‑ 25) = 23,50 | 2.50 |
3 | 25 | 23,50 + 0,5(21 ‑ 23,50) = 22,25 | 2.75 |
4 | 27 | 22,25 + 0,5(25 - 22,25) = 23,63 | 3.37 |
5 | 35 | 23,63 + 0,5(27 ‑ 23,63) = 25,32 | 9.68 |
6 | 29 | 25,32 + 0,5(35 ‑ 25,32) = 30,16 | 1.16 |
7 | 33 | 30,16 +0,5(29 - 30,16) = 29,58 | 3.42 |
8 | 37 | 29,58 + 0,5(33 ‑ 29,58 ) = 31,29 | 5.71 |
9 | 41 | 34,29 + 0,5(37 ‑ 31 ,29) = 34,15 | 6.85 |
10 | 37 | 34,15 + 0,5(41 ‑ 34,15) = 37,58 | 0.58 |
11 | ?? | 37,58 + 0,5(37‑ 37,58) = 37,29 | |
| | (MAD = 3.90) Tổng | 39.02 |
Minitab: stat🡪time series 🡪 single exponential smoothing
(C) Weick Institute of Management Consulting, 2024
30
4/3/2025
So sánh với Moving Average
(C) Weick Institute of Management Consulting, 2024
31
4/3/2025
Holt’s Exponential smoothing
(C) Weick Institute of Management Consulting, 2024
32
4/3/2025
Holt’s Exponential smoothing
(C) Weick Institute of Management Consulting, 2024
33
4/3/2025
Minitab: stat🡪time series🡪 Double Exponential Smoothing
(C) Weick Institute of Management Consulting, 2024
34
4/3/2025
So sánh
(C) Weick Institute of Management Consulting, 2024
35
4/3/2025
Winter’s Exponential Smoothing
(C) Weick Institute of Management Consulting, 2024
36
4/3/2025
Winter’s Exponential Smoothing
(C) Weick Institute of Management Consulting, 2024
37
4/3/2025
Minitab: stat🡪time series🡪 Winters’ method
(C) Weick Institute of Management Consulting, 2024
38
4/3/2025
So sánh
(C) Weick Institute of Management Consulting, 2024
39
4/3/2025
Phân tích hồi quy�regression analysis
Huỳnh Bảo Tuân, 2023
Biểu đồ phân tán: trình bày mối quan hệ giữa X và Y
Nếu không có mối quan hệ nào giữa X và Y, các điểm sẽ phân tán ngẫu nhiên trên biểu đồ.
(C) Weick Institute of Management Consulting, 2024
41
4/3/2025
Biểu đồ phân tán cho thấy đầu ra (Y) thay đồi như thế nào trong mối quan hệ với đầu vào (X)
(đầu ra)
(đầu vào)
Lưu ý �một số tên gọi khác nhau của X và Y
X Y
Systems Input Output
Mathematics Independent Variable Dependent Variable
Statistics Predictor (Factor) Response
Quality Engineering Cause Effect (Quality)
Control Engineering Parameter Performance Index
Process Engineering Control Characteristic Process Characteristic
(C) Weick Institute of Management Consulting, 2024
42
4/3/2025
Các loại Hồi quy
(C) Weick Institute of Management Consulting, 2024
43
4/3/2025
Đơn phi tuyến tính (Một X)
X
Y
Tuyến tính đơn giản (Một X)
Đa biến (bằng hoặc nhiều hơn 2 X’s)
X
Y
Y
X
2
X
1
Bội phi tuyến tính
((bằng hoặc nhiều hơn 2X’s)
Y
X
1
X
2
Hồi quy Logistic (Cho Y’s rời rạc)
Sử dụng biến biểu thị
(Cho X’s rời rạc)
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
X
1
Y
X
2
X
2
X
2
1
0
% yes
X
a
b
c
Phân tích hồi quy: �Lượng hóa mối quan hệ giữa X và Y
(C) Weick Institute of Management Consulting, 2024
44
4/3/2025
Y = b0 + b1X
b0 = hệ số tự do (Giá trị Y khi X = 0 hoặc là điểm mà đường thẳng cắt trục Y)
b1 = hệ số góc (thay đổi của biến, hay thay đổi của Y đối với mỗi đơn vị tăng thêm của X)
Hồi quy tuyến tính - Đường thẳng, hay phương trình hồi quy, thể hiện qua phương trình:
(đầu ra)
(đầu vào)
Lợi ích của việc lượng hóa mối quan hệ
(C) Weick Institute of Management Consulting, 2024
45
4/3/2025
Khớp một đường thẳng đi qua dữ liệu:�Số dư (Residuals)
(C) Weick Institute of Management Consulting, 2024
46
4/3/2025
Phần dư2
Phần dư7
Y quan sát (Y thất sự))
Y dự đoán (nằm trên đường thẳng)
Phương trình Hồi quy được xác định như thế nào?
Phương pháp bình phương nhỏ nhất (The least-squares method):
đường thẳng
‘bình phương’ của tất cả
các phần dư
(C) Weick Institute of Management Consulting, 2024
47
4/3/2025
Phương pháp bình phương nhỏ nhất
1. Đo khoảng cách thẳng đứng từ các điểm đển đường thẳng
2. Lấy bình phương các con số này
3. Tổng tất cả các bình phương khoảng cách
4. Tìm đường thằng nào có tổng này nhỏ nhất
Ghi chú về Thuật ngữ
Những thuật ngữ này có thể sử dụng thay thế cho nhau:
* Thuật ngữ được dùng trong Minitab
(C) Weick Institute of Management Consulting, 2024
48
4/3/2025
RSquared (RSq or R2): Phần trăm dao động được giải thích
(C) Weick Institute of Management Consulting, 2024
49
4/3/2025
Hệ số tương quan (r): �Độ mạnh của mối quan hệ
(C) Weick Institute of Management Consulting, 2024
50
4/3/2025
Lưu ý: hệ số tương quan tính được là trên mẫu 🡪 muốn suy diễn hệ số tương quan có ý nghĩa thống kê phải kiểm định hệ số tương quan
Kiểm định hệ số tương quan
MiniTab,
Stat → Basic Statistics → Correlation
hypothesis test
H0 : ρ = 0 vs H1 : ρ ≠ 0
(C) Weick Institute of Management Consulting, 2024
51
4/3/2025
Relationship
P Value < 0.05 🡪 bác bỏ Ho 🡪 có tương quan
Hệ số tương quan (r): �Độ mạnh của mối quan hệ (tt)
(C) Weick Institute of Management Consulting, 2024
52
4/3/2025
X
Tương quan thuận mạnh�r = 0.95
R2 = 90%
Tương quan thuận tương đối�r = 0.70
R2 = 49%
Không tương quan�r = 0.006
R2 = 0.0036%
Mô thức khác: �Không có tương quan tuyến tính �r = –0.29
R2 = 8%
Tương quan nghịch
tương đối�r = –0.73
R2 = 53%
Tương quan nghịch mạnh
r = –0.90
R2 = 81%
Y
X
Y
X
Y
X
Y
X
Y
X
Y
Cảnh báo! Tương quan không có nghĩa là ‘Quan hệ nhân quả’
(C) Weick Institute of Management Consulting, 2024
53
4/3/2025
Những kiểm định về Hồi quy: kiểm định Phần dư (Residuals)
thay đổi qua thời gian
Y-được dự báo (predicted Y)
tăng
hình chuông) với giá trị trung
bình bằng 0
(C) Weick Institute of Management Consulting, 2024
54
4/3/2025
15
10
5
0
0
5
10
15
residual
residual
Kiểm định về Phần dư
(C) Weick Institute of Management Consulting, 2024
55
4/3/2025
0
50
100
3
2
1
0
1
2
3
Time Order
0
50
100
3
2
1
0
1
2
3
Time Order
Biểu đồ phần dư
Tốt
Xấu
Ý nghĩa/ Hành động
Giả định
Không liên quan đến X
Ổn định
1. Phần dư so với mỗi X
2. Biểu đồ theo thời gian của phần dư�
Mối quan hệ giữa X và Y không phải là một đường thẳng, mà là đường cong. Thử các phép biến đổi với X, Y hoặc cả hai. Hoặc sử dụng X2 trong Hồi quy đa biến
Bất kỳ kiểu mẫu lặp lại nào qua thời gian có nghĩa là một nhân tố nào khác, liên quan đến thời gian, ảnh hưởng đến Y. Cố gắng tìm ra và đưa nó vào Hồi quy đa biến.
Phần dư
Phần dư
3
4
5
6
7
8
9
10
11
12
3
2
1
0
1
2
3
X
Phần dư
10
20
30
3
2
1
0
1
2
3
X
Phần dư
Kiểm tra giả thuyết về Phần dư (tt)
(C) Weick Institute of Management Consulting, 2024
56
4/3/2025
3. Phần dư so với Y-dự báo (Fits)�
4. Biểu đồ xác suất chuẩn của phần dư�
Biểu đồ phần dư
Tốt
Xấu
Ý nghĩa/ Hành động
Giả thuyết
Bất biến
Phân phối
chuẩn
Hình cánh quạt này có nghĩa là dao động tăng dần khi Y tăng thêm. (Phần dư không bất biến.) Thử lấy căn Y, Log Y, hoặc phép biến đổi nghịch đảo lên Y
Phần dư không chuẩn. Thử phép biến đổi lên X, Y hoặc cả hai
30
40
50
3
2
1
0
1
2
3
Pred. Y
Phần dư
0
50
100
3
2
1
0
1
2
3
Pred. Y
Phần dư
3
2
1
0
1
2
3
3
2
1
0
1
2
3
Residual
Nscore
1
0
1
2
3
4
3
2
1
0
1
2
3
Residual
Nscore
Kiểm định hệ số gốc: Sử dụng P-Value để kiểm định ‘Giả thuyết H0’ rằng Hệ số góc hồi quy bằng 0
(C) Weick Institute of Management Consulting, 2024
57
4/3/2025
Những quan sát bất thường (outliers)
(C) Weick Institute of Management Consulting, 2024
58
4/3/2025
Những quan sát bất thường (tt)
(C) Weick Institute of Management Consulting, 2024
59
4/3/2025
Các giả định trong phân tích hồi quy
(C) Weick Institute of Management Consulting, 2024
60
4/3/2025
Tổng kết: Diễn dịch đầu ra cho Hồi quy một biến X
(C) Weick Institute of Management Consulting, 2024
61
4/3/2025
- ∞ đến ∞
Ý nghĩa
Pvalue cho hệ số góc (slope)
r
Rsquare�(Rsq)�
S
(Phần dư) Residual
Standardized�Residual
Quan sát có ảnh hưởng
Xác suất hệ số góc là đáng kể (khác 0)
Hệ số tương quan
Phần trăm của dao động được
giải thích= r2
Độ lệch chuẩn của phần dư (Dao động không được giải thích)
= Y quan sát – Y dự báo
Phần dư
Độ lệch chuẩn
Một quan sát mà giá trị X có ảnh hưởng lớn đến giá trị các hệ số (của đường hồi quy)
Nếu nhỏ hơn 0.05, hệ số góc là đáng kể (khác 0) và X có quan hệ với Y
Cho thấy độ mạnh của mối quan hệ tuyến tính. Các con số gần số 0 ngụ ý không có mối quan hệ tuyến tính
Phần trăm dao động trong các giá trị Y được giải thích bởi mối quan hệ với X)
Cho thấy giá trị quan sát điển hình khác như thế nào với giá trị dự báo, trong các đơn vị dữ liệu gốc
Nếu giá trị tuyệt đối của phần dư chuẩn hóa > 3, thì nó là một quan sát bất thường. Hãy tìm hiểu thêm về nó.
Phần dư được giả thiết là ngẫu nhiên và tuân theo phân phối chuẩn với số trung bình bằng 0 (cho thấy nguyên nhân dao động thông thường).
Xem quan sát có tầm ảnh hưởng này trên biểu đồ để quyết định liệu có giữ hay loại bỏ nó khỏi phân tích hồi quy.
0 đến 1
–1 đến +1
0 đến 100%
Khoảng –3 đến +3
0 đến ∞
Tên
Định nghĩa
Phạm vi
=
- ∞ đến ∞
Hồi quy tuyến tính đa biến
Bạn có thể hoàn thiện dự báo này?
(C) Weick Institute of Management Consulting, 2024
63
4/3/2025
Biểu đồ ma trận phân tán: cho thấy mối quan hệ giữa nhiều X’s và Y’s
(C) Weick Institute of Management Consulting, 2024
64
4/3/2025
Đừng căng mắt tìm các chi tiết về các điểm đơn lẻ trên biểu đồ ma trận! �Mục tiêu là để có được cái nhìn ban đầu nhanh chóng về các kiểu mẫu cho thấy các biến có liên hệ với nhau như thế nào.
Ma trận quan hệ: Lượng hóa độ mạnh �mối quan hệ giữa X’s and Y’s
(C) Weick Institute of Management Consulting, 2024
65
4/3/2025
Correlations (Pearson)
X1 X2 X3 Y1
X2 0.259
X3 0.293 0.979
Y1 0.245 0.928 0.934
Y2 0.139 0.631 0.635 0.746
Ma trận quan hệ: Lượng hóa độ mạnh �mối quan hệ giữa X’s and Y’s (tt)
r = –1 Mối tương quan nghịch tuyệt đối
r = 0 Không có tương quan tuyến tính
r = +1 Mối tương quan thuận tuyệt đối
Stat > Basic Statistics > Correlation
(C) Weick Institute of Management Consulting, 2024
66
4/3/2025
Liên kết �Biểu đồ ma trận và Biểu đồ quan hệ
(C) Weick Institute of Management Consulting, 2024
67
4/3/2025
Gần 0;
Không tương quan
Correlations
X1 X2 X3 Y1
X2 0.259
X3 0.293 0.979
Y1 0.245 0.928 0.934
Y2 0.139 0.631 0.635 0.746
Tương quan mạng, có quan hệ tuyến tính mạnh
Tương quan tương đối mạnh
Hồi quy đa biến: Lượng hóa mối quan hệ�giữa nhiều X’s và một Y
Y = b0 + b1 X
Y = b0 + b1 X1 + b2 X2 + b3 X3 + … + bk Xk
�
(C) Weick Institute of Management Consulting, 2024
68
4/3/2025
Ví dụ minh họa �Sử dụng phương trình hồi quy đa biến
Dự báo lượng bệnh sốt xuất huyết nhập viện từ cộng đồng
Y = 6.20 + 5.86(X1) + 0.000151(X2) + 1.39(X3) + 0.86(X4)
(C) Weick Institute of Management Consulting, 2024
69
4/3/2025
Số ca sốt xuất huyết nhập viện
Số ca cấp cứu sốt xuất huyết trong tuần
Thanh toán bảo hiểm y tế
Tuổi
Số ngày nằm viện
BN Y X1 X2 X3 X4
Cảnh báo! �Đừng so sánh các hệ số với nhau
(C) Weick Institute of Management Consulting, 2024
70
4/3/2025
Hình ảnh hóa �Phương trình hồi quy đa biến
(C) Weick Institute of Management Consulting, 2024
71
4/3/2025
Cho một X
Cho hai X’s
Cho > = X’s
Không thể hình ảnh hóa được. Nhưng tất cả các khái niệm vừa rồi mở rộng đa chiều, bao gồm cả phương pháp bình phương nhỏ nhất được dùng để khớp phương trình cho dữ liệu
Y = 3 – 3X
Y = 3 – 3X1 + 2 X2
Y = 3 – 3X1 + 2 X2 5 X3
5
0
5
10
0
1
2
3
0
1
2
3
Y
X1
X2
Lợi ích của Hồi quy Đa biến
Y = b0 + b1X1 + b2X2 + . . . + bkXk
(C) Weick Institute of Management Consulting, 2024
72
4/3/2025
Cảnh báo đối với Hồi quy đa biến
(C) Weick Institute of Management Consulting, 2024
73
4/3/2025
Cảnh báo đối với Hồi quy đa biến (tt)
(C) Weick Institute of Management Consulting, 2024
74
4/3/2025
Đa cộng tuyến (Multicollinearity): Vấn đề gây ra bởi các X’s tương quan với nhau
(C) Weick Institute of Management Consulting, 2024
75
4/3/2025
Các X’s có tương quan: Ví dụ
(C) Weick Institute of Management Consulting, 2024
76
4/3/2025
X1 (Tuổi)
X2 (Số năm làm việc)
Y (Thu nhập)
Hệ số tương quan
X1 X2
X2 0.979
Y 0.928 0.934
Hệ số lạm phát phương sai - Variance Inflation Factor (VIF): Kiểm tra Đa cộng tuyến
mối quan hệ giữa các biến
dự báo
biến của Xi với tất cả các biến
dự báo khác trong mô hình
Stat > Regression > Regression > Options�(Select Display “ Variance inflation factors”)
(C) Weick Institute of Management Consulting, 2024
77
4/3/2025
Hướng dẫn
Đa cộng tuyến
Không có vấn đề gì
Vấn đề:
Hành động:
VIF
Rsq và Rsqđiều chỉnh (Rsqadj) �trong Hồi quy đa biến
(C) Weick Institute of Management Consulting, 2024
78
4/3/2025
Rsq và Rsqđiều chỉnh (Rsqadj) �trong Hồi quy đa biến (tt)
(C) Weick Institute of Management Consulting, 2024
79
4/3/2025
Chiến lược đối phó với hiện tượng �Đa cộng tuyến (Multicollinearity)
và/ hoặc
(C) Weick Institute of Management Consulting, 2024
80
4/3/2025
Chiến lược đối phó với hiện tượng �Đa cộng tuyến (Multicollinearity) (tt)
(C) Weick Institute of Management Consulting, 2024
81
4/3/2025
Giả định cho �Hồi quy tuyến tính đa biến
(C) Weick Institute of Management Consulting, 2024
82
4/3/2025
Kiểm định Phần dư
(C) Weick Institute of Management Consulting, 2024
83
4/3/2025
0
50
100
3
2
1
0
1
2
3
Time Order
0
50
100
3
2
1
0
1
2
3
Time Order
Biểu đồ phần dư
Tốt
Xấu
Ý nghĩa/ Hành động
Giả định
Không liên quan đến X
Ổn định
1. Phần dư so với mỗi X
2. Biểu đồ theo thời gian của phần dư�
Mối quan hệ giữa X và Y không phải là một đường thẳng, mà là đường cong. Thử các phép biến đổi với X, Y hoặc cả hai. Hoặc sử dụng X2 trong Hồi quy đa biến
Bất kỳ kiểu mẫu lặp lại nào qua thời gian có nghĩa là một nhân tố nào khác, liên quan đến thời gian, ảnh hưởng đến Y. Cố gắng tìm ra và đưa nó vào Hồi quy đa biến.
Phần dư
Phần dư
3
4
5
6
7
8
9
10
11
12
3
2
1
0
1
2
3
X
Phần dư
10
20
30
3
2
1
0
1
2
3
X
Phần dư
Kiểm định Phần dư (tt)
(C) Weick Institute of Management Consulting, 2024
84
4/3/2025
3. Phần dư so với Y-dự báo (Fits)�
4. Biểu đồ xác suất chuẩn của phần dư�
Biểu đồ phần dư
Tốt
Xấu
Ý nghĩa/ Hành động
Giả thuyết
Bất biến
Phân phối
chuẩn
Hình cánh quạt này có nghĩa là dao động tăng dần khi Y tăng thêm. (Phần dư không bất biến.) Thử lấy căn Y, Log Y, hoặc phép biến đổi nghịch đảo lên Y
Phần dư không chuẩn. Thử phép biến đổi lên X, Y hoặc cả hai
30
40
50
3
2
1
0
1
2
3
Pred. Y
Phần dư
0
50
100
3
2
1
0
1
2
3
Pred. Y
Phần dư
3
2
1
0
1
2
3
3
2
1
0
1
2
3
Residual
Nscore
1
0
1
2
3
4
3
2
1
0
1
2
3
Residual
Nscore
Đánh giá R2
(C) Weick Institute of Management Consulting, 2024
85
4/3/2025
LOẠI THANG ĐO | GIÁ TRỊ R-SQ ĐIỂN HÌNH | NHẬN XÉT |
Nhận thức/ Hành vi (Ý kiến, quan điểm, …) Ví dụ: Khảo sát sự hài lòng của khách hàng, khảo sát thái độ của nhân viên, …. | .20 đến .60 | Quá trình đo lường nhận thức của con người (bao gồm sử dụng các công cụ đo lường) thường có nhiều nguyên nhân dao động phổ biến (không giải thích được), vì thế R-sq sẽ thấp hơn |
Vật lý (kích thước, sức mạnh,…) Ví dụ: Cân nặng hộp thức ăn, độ dày của gỗ dán | .70 đến .90 | Quá trình đo lường các đặc tính vật lýnhận thức của con người (bao gồm sử dụng các công cụ đo lường) thường có ít các nguyên nhân dao động phổ biến (không giải thích được), vì thế R-sq sẽ cao hơn |
Qui tắc kinh nghiệm đối với �cỡ mẫu cần thiết cho Hồi quy đa biến
4 X’s 40–120 điểm dữ liệu
(C) Weick Institute of Management Consulting, 2024
86
4/3/2025
Tóm tắt �Hồi quy tuyến tính đa biến
(C) Weick Institute of Management Consulting, 2024
87
4/3/2025
residual
standard deviation
Ý nghĩa
Pvalue cho hệ số góc
r
Rsquare�(Rsq)�
S
Phần dư
Phần dư chuẩn hóa
Quan sát có ảnh hưởng
Xác suất hệ số góc là đáng kể (Khác 0)
Hệ số tương quan
Phần trăm dao động được giải thích = r2
Độ lệch chuẩn của phần dư (Dao động không được giải thích)
= Y-quan sát –Y-dự báo
Một quan sát mà giá trị X của nó có ảnh hưởng lớn lên giá trị của các hệ số (trên đường hồi quy)
Nếu < 0.05, hệ số góc là đáng kể (khác 0) và X liên quan đến Y
Chỉ ra độ mạnh của mối quan hệ tuyến tính. Các con số gần bằng 0 ngụ ý không có mối quan hệ
Phần trăm của dao động trong giá trị Y được giải thích bởi mối quan hệ với X
Chỉ ra giá trị quan sát điển hình khác bao nhiêu so với giá trị dự báo, theo đơn vị của dữ liệu gốc.
Nếu giá trị tuyệt đối của phần dư chuẩn hóa�> 3, thì nó là quan sát bất thường. Tìm hiểu nó.
Phần dư được giả định là ngẫu nhiên và chuẩn hóa với số trung bình bằng 0 (đại diện cho nguyên nhân dao động phổ biến).
Xem chúng trên biểu đồ, quyết định liệu sẽ giữ hay loại bỏ chúng khỏi phân tích hồi quy.
0 đến1
1 đến +1
0 đến 100%
Khoảng 3 đến +3
Tên gọi
Định nghĩa
Phạm vi
=
Hệ số góc bi, của xi
Giá trị hệ số của Xi trong phương trình hồi quy
Đơn vị thay đổi trong Y đối với một đơn vị tăng thêm của X khi tất cả các X’s khác giữa nguyên
R-square điều chỉnh (R-sqADJ)�
Rsquare điều chỉnh cho số lượng terms trong mô hình
0 đến khoảng 100%
Sử dụng giá trị này để so sánh các mô hình với các số lượng terms khác nhau
VIF
Hệ số lạm phát phương sai phản ánh tương quan giữa một X với các X’s khác
1 đến ∞
Nếu VIF > 5 đến 10, thì có vấn đề với đa cộng tuyến. Các hệ số và P-value có thể sai lầm. Loại bỏ một X có tương quan.
- ∞ đến ∞
Phần dư
Độ lệch chuẩn
- ∞ đến ∞
- ∞ đến ∞
- ∞ đến ∞
Quy trình cho hồi quy đa biến
(C) Weick Institute of Management Consulting, 2024
88
4/3/2025
Inadequate
1. Làm quen với dữ liệu
Khớp không đủ
2. Đưa ra mô hình
3. Khớp mô hình vào dữ liệu
5. Báo cáo kết quả và sử dụng phương trình
4.
Kiểm tra
mô hình và
giả thuyết
Khớp tốt
Kỹ hơn về bước 2: Hình thành mô hình
(C) Weick Institute of Management Consulting, 2024
89
4/3/2025
Cảnh báo! Đừng loại bỏ biến dự báo trước khi thực hiện hồi quy
hoặc
(C) Weick Institute of Management Consulting, 2024
90
4/3/2025
Tổng kết về Hồi quy
(C) Weick Institute of Management Consulting, 2024
91
4/3/2025
(C) Weick Institute of Management Consulting, 2024
92
4/3/2025