1 of 92

DỰ BÁO NHU CẦU KHÁM CHỮA BỆNH

Huỳnh Bảo Tuân, 2024.

2 of 92

Ứng dụng

  • Dự báo lượng bệnh nhận đến khám bệnh, cấp cứu, nhập viện tại một chuyên khoa nào đó.
  • Căn cứ trên dự báo đó tính toán nhu cầu vật tư, thuốc, hóa chất …
  • Phạm vi dự báo ngắn hạn: ngày, tuần, tháng
  • Thể chế hóa hoạt động dự báo trong bệnh viện để không lệ thuộc cảm tính của con người: quy trình, quy định, công thức, phương pháp, thuật toán.
  • Sự khác nhau Demand forecast, Demand Planning, và Demand Sensing
    • Demand forecast: thể hiện bản chất tự nhiên của bệnh tật, môi trường, xã hội
    • Demand planning: hoạch định chốt nhu cầu để lập kế hoạch mua vật tư, thuốc, chuẩn bị nguồn lực…
    • Demand sensing: cảm biến và phát tín hiệu cảnh báo khi nhu cầu có sự tác động lạ, khác thường.

(C) Weick Institute of Management Consulting, 2024

2

4/3/2025

3 of 92

Kỹ thuật dự báo

  • Chuỗi thời gian (Time series)
  • Hồi quy (Regression)
  • Phân tích cụm liên kết (Clustering)
  • Phân tích sự kết hợp (Association)

(C) Weick Institute of Management Consulting, 2024

3

4/3/2025

4 of 92

Time-Series Forecast

  • Dữ liệu được thu thập theo thời gian
  • Giả định: những mô thức tác động trong quá khứ sẽ lập lại ở tương lai.

  • Phân tích xu hướng, phân tích mùa vụ
  • Phương pháp làm trơn hàm số mũ – Exponential Smoothing.
  • Phương pháp trung bình di động – Moving Average

5 of 92

(C) Weick Institute of Management Consulting, 2024

5

4/3/2025

6 of 92

(C) Weick Institute of Management Consulting, 2024

6

4/3/2025

4 thành phần của Time series:

  • Thành phần xu hướng dài hạn (long – term trend component): số liệu tăng hoặc giảm theo một chiều nhất định.

  • Thành phần mùa (seasonal component): Sự thay đổi phụ thuộc vào thời gian của năm. Mỗi năm đều có sự thay đổi giống như vậy.

  • Thành phần chu kì (cyclical component): Có sự tăng và giảm lặp đi lặp lại trên khung thời gian dài. Mỗi năm không hiển thị cùng một một sự thay đổi.

  • Thành phần bất thường (Irregular component): sự thay đổi không theo một mô hình cụ thể nào. Thời gian xảy ra ngắn và không lặp lại.

7 of 92

(C) Weick Institute of Management Consulting, 2024

7

4/3/2025

8 of 92

(C) Weick Institute of Management Consulting, 2024

8

4/3/2025

CÁC BƯỚC THỰC HIỆN DỰ BÁO

Nguồn: Dr. Subhashish Samaddar. Forecasting .Department of Managerial Sciences, Georgia State University

9 of 92

(C) Weick Institute of Management Consulting, 2024

9

4/3/2025

10 of 92

(C) Weick Institute of Management Consulting, 2024

10

4/3/2025

Dự báo số ca Tay Chân Miệng nhập viện cho năm 2012, dựa trên số lượng nhập viện thực tế 2010, 2011

THUẬT TOÁN TÁCH THÀNH PHẦN MÙA VỤ VÀ XU HƯỚNG

11 of 92

(C) Weick Institute of Management Consulting, 2024

11

4/3/2025

Minitab

Stat 🡪 time series 🡪 time series plot

Có xu hướng

Có tính mùa vụ

Số ca nhập viện

12 of 92

(C) Weick Institute of Management Consulting, 2024

12

4/3/2025

NGUYÊN LÝ TÁC THÀNH PHẦN MÙA VỤ VÀ XU HƯỚNG

Mô hình dự báo ở đây sẽ là:

  • X(t)=T(t) x SI hoặc X(t)=T(t) + SI

  • X(t): Số lượng ở thời điểm t.
  • T(t): Giá trị của thành phần xu hướng tại thời điểm t.
  • SI (Seasonal Indices): Hệ số hiệu chỉnh của thành phần mùa.

13 of 92

(C) Weick Institute of Management Consulting, 2024

13

4/3/2025

Xác định Seasonal Indices

Minitab

Statistics / Time series/ Decomposition

Số ca nhập viện

14 of 92

(C) Weick Institute of Management Consulting, 2024

14

4/3/2025

Xác định Seasonal Indices

15 of 92

(C) Weick Institute of Management Consulting, 2024

15

4/3/2025

Xác định Đường xu hướng (trend line)

Sau khi tính được chỉ số mùa vụ ta sẽ tính được số nhập viện

(Deseasonalize volume) không còn chịu tác động bởi yếu tố mùa vụ.

Số lượng nhập viện loại trừ yếu tố mùa vụ = Số lượng nhập viện / Chỉ số mùa vụ

Số lượng nhập viện

Số lượng nhập viện không có yếu tố mùa vụ

16 of 92

(C) Weick Institute of Management Consulting, 2024

16

4/3/2025

Minitab

Statistics / Time series/trend analysis

Số lượng nhập viện không có yếu tố mùa vụ

17 of 92

(C) Weick Institute of Management Consulting, 2024

17

4/3/2025

Chọn

T(t) = 77,55 + 1,161t + 0,045t2

Số lượng nhập viện không có yếu tố mùa vụ

Số lượng nhập viện không có yếu tố mùa vụ

18 of 92

(C) Weick Institute of Management Consulting, 2024

18

4/3/2025

Kết quả mô hình dự báo

  • X(t)=T(t) x SI
  • Với : T(t) = 77,55 + 1,161t + 0,045t2
  • Bước 1: tính T(t) dựa trên t tháng dự báo , tháng 1/2012 t=25
  • Bước 2: T(25) x SI tháng 1 (1.29810) = kết quả dự báo
  • Chỉ số SI như sau:

Tháng SI Tháng SI

1 1.29810 7 0.68338

2 1.37184 8 0.82151

3 1.20145 9 0.91746

4 0.93982 10 1.01264

5 0.82433 11 1.03671

6 0.80359 12 1.08916

19 of 92

PHƯƠNG PHÁP�TRUNG BÌNH DI ĐỘNG (MOVING AVERAGE)

Chỉ tính trung bình của n dữ liệu quá khứ gần nhất.

Ưu điểm: Chỉ cần lưu trữ ít số liệu, dễ hiểu, dễ thực hiện

Nhược điểm: Không xử lý được trong trường hợp dữ liệu có tính mùa vụ hay chu kỳ

Xác định n ?

Thử nhiều số n khác nhau, tính toán dự báo cho từng trường hợp rồi so sánh độ lệch tuyệt đối trung bình cho mỗi phương án. Phương án n nào cho trị số độ lệch nhỏ nhất sẽ là phương án thích hợp nhất cho chuỗi số liệu tương ứng.

(C) Weick Institute of Management Consulting, 2024

19

4/3/2025

20 of 92

�TRUNG BÌNH DI ĐỘNG (Moving average)

20

Bảng sau cho thấy số người nhập viện ở Trung tâm Cấp cứu Sài Gòn hàng tuần. Người quản lý muốn ước lượng số ca nhập viện cho tuần tới.

+ Số ca nhập viện trung bình: 30,7

Tuần

Số ca nhập viện

1

22

2

21

3

25

4

27

5

35

6

29

7

33

8

37

9

41

10

37

Tổng

307

4/3/2025

(C) Weick Institute of Management Consulting, 2024

21 of 92

�TRUNG BÌNH DI ĐỘNG (Moving average)

(C) Weick Institute of Management Consulting, 2024

21

4/3/2025

  • Ví dụ: xét trung bình dịch chuyển với n = 2 tuần.

  • (*) giá trị dự báo tuần 3:
  • (22+21)/2=21.50

  • MAD2 = 4,188

Tuần

Số ca nhập viện

n = 2

Độ lệch tuyệt đối

1

22

2

21

3

25 (*)

21.50

3.50

4

27

23.00

4.00

5

35

26.00

9.00

6

29

31.00

2.00

7

33

32.00

1.00

8

37

31.00

6.00

9

41

35.00

6.00

10

37

39.00

2.00

11

???

39.00

MAD = 4.188

22 of 92

�TRUNG BÌNH DI ĐỘNG (Moving average)

(C) Weick Institute of Management Consulting, 2024

22

4/3/2025

  • Ví dụ: xét trung bình dịch chuyển với n = 3 tuần.

  • (*) giá trị dự báo tuần 4:
  • (22+21+25)/3=22.67

  • MAD3 = 4,334

Tuần

Số ca nhập viện

n = 3

Độ lệch tuyệt đối

1

22

2

21

3

25

4

27 (*)

22.67

4.33

5

35

24.33

10.67

6

29

29.00

0.00

7

33

30.33

2.67

8

37

32.33

4.67

9

41

33.00

8.00

10

37

37.00

0.00

11

???

38.33

MAD = 4.334

23 of 92

�TRUNG BÌNH DI ĐỘNG (Moving average)

(C) Weick Institute of Management Consulting, 2024

23

4/3/2025

24 of 92

�TRUNG BÌNH DI ĐỘNG CÓ TRỌNG SỐ (WEIGHTED MA)

  • Trọng số khác nhau được gán cho các thời điểm khác nhau,
  • Thường trọng số lớn nhất được gán cho dữ liệu gần nhất và trọng số sẽ giảm dần cho các dữ liệu xa hơn
  • Tổng các trọng số phải bằng 1.

VD: nếu trọng số được dùng là 0.5; 0.3; và 0.2 🡪 giá trị dự báo cho tuần kế tiếp sẽ là:

0.5 x (dữ liệu tuần vừa rồi) + 0.3 x (dữ liệu 2 tuần trước đó) + 0.2 x (dữ liệu 3 tuần trước)

(C) Weick Institute of Management Consulting, 2024

24

4/3/2025

25 of 92

TRUNG BÌNH DI ĐỘNG CÓ TRỌNG SỐ (WEIGHTED MA)

(C) Weick Institute of Management Consulting, 2024

25

4/3/2025

Tuần

Số lượng thực

Trung bình di chuyển 3-tuần có trọng số

Sai số tuyệt đối

1

22

2

21

3

25

4

27

0,5(25) + 0,3(21) + 0,2(22) = 23,2

3,8

5

35

0,5(27) + 0,3(25) + 0,2(21) = 25,2

9,8

6

29

0,5(35) + 0,3(27) + 0,2(25) = 30,6

1,6

7

33

0,5(29) + 0,3(35) + 0,2(37) = 30,4

2,6

8

37

0,5(33) + 0,3(29) + 0,2(35) = 32,2

4,8

9

41

0,5(37) + 0,3(33) + 0,2(29) = 34,2

6,8

10

37

0,5(41) + 0,3(37) + 0,2(33) = 38,2

1,2

11

?

0,5(37) + 0,3(41) + 0,2(37) = 38,2

(MAD = 4.37) Tổng

30,6

26 of 92

Minitab: stat 🡪 time series 🡪 moving average

(C) Weick Institute of Management Consulting, 2024

26

4/3/2025

27 of 92

n=2; n=3; n=4; n= 5

(C) Weick Institute of Management Consulting, 2024

27

4/3/2025

28 of 92

�KỸ THUẬT LÀM TRƠN HÀM SỐ MŨ (EXPONENTAL SMOOTHING)

  • Kỹ thuật này tương tự như kỹ thuật trung bình di chuyển có trọng số nhưng yêu cầu dữ liệu ít hơn.
  • Phương pháp này sử dụng công thức sau:

Ft + 1 = Ft + α (Yt - Ft)

với Ft = giá trị dự báo tại thời điểm t;

Yt = giá trị số thực của thời điểm t;

α = hằng số giữa 0 và 1.

  • Một giá trị dự báo ban đầu phải được đưa ra trước tiên sau đó các trị số dự báo sẽ lần lượt được tính.
  • Cần giá trị ban đầu (F1): lấy thí dụ với việc dự báo số ca nhập viện ở trên, giả sử lượng nhập viện cho tuần thứ nhất là 25 và α được chọn là 0,5.

(C) Weick Institute of Management Consulting, 2024

28

4/3/2025

29 of 92

KỸ THUẬT LÀM TRƠN HÀM SỐ MŨ (EXPONENTAL SMOOTHING)

(C) Weick Institute of Management Consulting, 2024

29

4/3/2025

Tuần

Số lượng thực

Số lượng dự báo

Sai số tuyệt đối

1

22

25

3.00

2

21

25 + 0,5(22 ‑ 25) = 23,50

2.50

3

25

23,50 + 0,5(21 ‑ 23,50) = 22,25

2.75

4

27

22,25 + 0,5(25 - 22,25) = 23,63

3.37

5

35

23,63 + 0,5(27 ‑ 23,63) = 25,32

9.68

6

29

25,32 + 0,5(35 ‑ 25,32) = 30,16

1.16

7

33

30,16 +0,5(29 - 30,16) = 29,58

3.42

8

37

29,58 + 0,5(33 ‑ 29,58 ) = 31,29

5.71

9

41

34,29 + 0,5(37 ‑ 31 ,29) = 34,15

6.85

10

37

34,15 + 0,5(41 ‑ 34,15) = 37,58

0.58

11

??

37,58 + 0,5(37‑ 37,58) = 37,29

(MAD = 3.90) Tổng

39.02

30 of 92

Minitab: stat🡪time series 🡪 single exponential smoothing

(C) Weick Institute of Management Consulting, 2024

30

4/3/2025

31 of 92

So sánh với Moving Average

(C) Weick Institute of Management Consulting, 2024

31

4/3/2025

32 of 92

Holt’s Exponential smoothing

  • Ba phương trình và hai hằng số làm trơn được sử dụng trong mô hình..
    • Ước tính mức hiện tại hoặc chuỗi được làm trơn theo cấp số nhân.

    • Thành phần xu hướng.

    • Dự báo m giai đoạn trong tương lai.

(C) Weick Institute of Management Consulting, 2024

32

4/3/2025

33 of 92

Holt’s Exponential smoothing

    • Ft+1 = Giá trị làm trơn tại thời điểm t+1
      • α = hằng số làm trơn.
      • yt = Giá trị quan sát thực tại thời điểm t.
      • Ft = Giá trị dự báo tại thời điểm t
    • Tt+1 = Thành phần xu hướng
      • β = hệ số làm trơn cho thành phần xu hướng
      • m = số thời đoạn dự báo ơ tương lai.
    • H t+ m = Giá trị dự báo Holt’s tại thời điểm t + m

(C) Weick Institute of Management Consulting, 2024

33

4/3/2025

34 of 92

Minitab: stat🡪time series🡪 Double Exponential Smoothing

(C) Weick Institute of Management Consulting, 2024

34

4/3/2025

35 of 92

So sánh

(C) Weick Institute of Management Consulting, 2024

35

4/3/2025

36 of 92

Winter’s Exponential Smoothing

  • 4 Phương trình:
    • Phương trình làm trơn hàm số mũ

    • Phương trình đường xu hướng:

    • Phương trình mùa vụ:

(C) Weick Institute of Management Consulting, 2024

36

4/3/2025

37 of 92

Winter’s Exponential Smoothing

    • Phương trình dự báo cho n thời đoạn trong tương lai:

      • Ft = Smoothed value for period t.
        • α = smoothing constant for the data.
        • yt = new observation or actual value in period t.
        • Ft-1 = Average experience of series smoothed to period t-1.
      • Tt = trend estimate.
        • β = smoothing constant for trend estimate.
      • St =Seasonal component estimate.
        • γ = smoothing constant for seasonality estimate.
        • m = Number of periods in the forecast lead period.
        • s = length of seasonality (number of periods in the season)
      • = forecast for m periods into the future.

(C) Weick Institute of Management Consulting, 2024

37

4/3/2025

38 of 92

Minitab: stat🡪time series🡪 Winters’ method

(C) Weick Institute of Management Consulting, 2024

38

4/3/2025

39 of 92

So sánh

(C) Weick Institute of Management Consulting, 2024

39

4/3/2025

40 of 92

Phân tích hồi quy�regression analysis

Huỳnh Bảo Tuân, 2023

41 of 92

Biểu đồ phân tán: trình bày mối quan hệ giữa X và Y

Nếu không có mối quan hệ nào giữa X và Y, các điểm sẽ phân tán ngẫu nhiên trên biểu đồ.

(C) Weick Institute of Management Consulting, 2024

41

4/3/2025

Biểu đồ phân tán cho thấy đầu ra (Y) thay đồi như thế nào trong mối quan hệ với đầu vào (X)

(đầu ra)

(đầu vào)

42 of 92

Lưu ý �một số tên gọi khác nhau của X và Y

X Y

Systems Input Output

Mathematics Independent Variable Dependent Variable

Statistics Predictor (Factor) Response

Quality Engineering Cause Effect (Quality)

Control Engineering Parameter Performance Index

Process Engineering Control Characteristic Process Characteristic

(C) Weick Institute of Management Consulting, 2024

42

4/3/2025

43 of 92

Các loại Hồi quy

(C) Weick Institute of Management Consulting, 2024

43

4/3/2025

Đơn phi tuyến tính (Một X)

X

Y

Tuyến tính đơn giản (Một X)

Đa biến (bằng hoặc nhiều hơn 2 X’s)

X

Y

Y

X

2

X

1

Bội phi tuyến tính

((bằng hoặc nhiều hơn 2X’s)

Y

X

1

X

2

Hồi quy Logistic (Cho Y’s rời rạc)

Sử dụng biến biểu thị

(Cho X’s rời rạc)

x

x

x

x

x

x

x

x

x

x

x

x

x

x

x

X

1

Y

X

2

X

2

X

2

1

0

% yes

X

a

b

c

44 of 92

Phân tích hồi quy: �Lượng hóa mối quan hệ giữa X và Y

  • Phân tích hồi quy là phát tạo một đường thẳng/cong (có thể biểu diễn được ở dạng đại số – phương trình) lượng hóa mối quan hệ giữa X và Y

(C) Weick Institute of Management Consulting, 2024

44

4/3/2025

Y = b0 + b1X

b0 = hệ số tự do (Giá trị Y khi X = 0 hoặc là điểm mà đường thẳng cắt trục Y)

b1 = hệ số góc (thay đổi của biến, hay thay đổi của Y đối với mỗi đơn vị tăng thêm của X)

Hồi quy tuyến tính - Đường thẳng, hay phương trình hồi quy, thể hiện qua phương trình:

(đầu ra)

(đầu vào)

45 of 92

Lợi ích của việc lượng hóa mối quan hệ

  • Dự đoán:
    • Phương trình có thể được sử dụng để dự đoán đầu ra Y’s trong tương lai bằng cách thay giá trị X vào phương trình
  • Kiểm soát:
    • Nếu X có thể kiểm soát được, -> có thể điều khiển được các điều kiện của quá trình để tránh những kết quả không mong muốn và tạo ra kết quả mong muốn

(C) Weick Institute of Management Consulting, 2024

45

4/3/2025

46 of 92

Khớp một đường thẳng đi qua dữ liệu:�Số dư (Residuals)

  • Phần dư = Y quan sát – Y dự đoán

(C) Weick Institute of Management Consulting, 2024

46

4/3/2025

Phần dư2

Phần dư7

Y quan sát (Y thất sự))

Y dự đoán (nằm trên đường thẳng)

47 of 92

Phương trình Hồi quy được xác định như thế nào?

Phương pháp bình phương nhỏ nhất (The least-squares method):

  • Phương trình hồi quy được xác định bằng một quy trình nhằm tối thiểu hóa tổng bình phương khoảng cách của tất cả các điểm đến

đường thẳng

    • Nhắc lại: tối thiểu hóa

‘bình phương’ của tất cả

các phần dư

(C) Weick Institute of Management Consulting, 2024

47

4/3/2025

Phương pháp bình phương nhỏ nhất

1. Đo khoảng cách thẳng đứng từ các điểm đển đường thẳng

2. Lấy bình phương các con số này

3. Tổng tất cả các bình phương khoảng cách

4. Tìm đường thằng nào có tổng này nhỏ nhất

48 of 92

Ghi chú về Thuật ngữ

Những thuật ngữ này có thể sử dụng thay thế cho nhau:

  • Phương trình hồi quy
  • Đường thẳng hồi quy
  • Phương trình dự báo
  • Đường thẳng dự báo
  • Fitted line or fits*
  • Mô hình hồi quy

* Thuật ngữ được dùng trong Minitab

(C) Weick Institute of Management Consulting, 2024

48

4/3/2025

49 of 92

R­Squared (R­Sq or R2): Phần trăm dao động được giải thích

  • R­Squared (R­sq or R2):
    • Đo lường phần trăm dao động trong các giá trị Y được giải thích bởi mối quan hệ tuyến tính với X
    • Phạm vi từ 0 đến 1 (= 0% đến 100%)

(C) Weick Institute of Management Consulting, 2024

49

4/3/2025

50 of 92

Hệ số tương quan (r): �Độ mạnh của mối quan hệ

  • Hệ số tương quan, r:
    • Phạm vi –1 đến 1:
      • r = –1 = Tương quan ngược hoàn hảo
      • r = 0 = Không có mối quan hệ tương quan
      • r = +1 = Tương quan thuận hoàn hảo
    • Đo lường ‘độ mạnh’ của mối quan hệ
    • Được biết đến với tên Hệ số tương quan Pearson

(C) Weick Institute of Management Consulting, 2024

50

4/3/2025

Lưu ý: hệ số tương quan tính được là trên mẫu 🡪 muốn suy diễn hệ số tương quan có ý nghĩa thống kê phải kiểm định hệ số tương quan

51 of 92

Kiểm định hệ số tương quan

MiniTab,

Stat → Basic Statistics → Correlation

hypothesis test

H0 : ρ = 0 vs H1 : ρ ≠ 0

(C) Weick Institute of Management Consulting, 2024

51

4/3/2025

Relationship

P Value < 0.05 🡪 bác bỏ Ho 🡪 có tương quan

52 of 92

Hệ số tương quan (r): �Độ mạnh của mối quan hệ (tt)

(C) Weick Institute of Management Consulting, 2024

52

4/3/2025

X

Tương quan thuận mạnh�r = 0.95

R2 = 90%

Tương quan thuận tương đối�r = 0.70

R2 = 49%

Không tương quan�r = 0.006

R2 = 0.0036%

Mô thức khác: �Không có tương quan tuyến tính �r = –0.29

R2 = 8%

Tương quan nghịch

tương đối�r = –0.73

R2 = 53%

Tương quan nghịch mạnh

r = –0.90

R2 = 81%

Y

X

Y

X

Y

X

Y

X

Y

X

Y

53 of 92

Cảnh báo! Tương quan không có nghĩa là ‘Quan hệ nhân quả’

(C) Weick Institute of Management Consulting, 2024

53

4/3/2025

  • Khi hai biến cho thấy có mối quan hệ với nhau trên biểu đồ phân tán, chúng được gọi là tương quan, nhưng điều này không có nghĩa là chúng có mối quan hệ nhân quả:
      • Tương quan có nghĩa là hai thứ thay đổi cùng nhau
      • Nhân quả có nghĩa là biến này gây ra những thay đổi cho biến kia

54 of 92

Những kiểm định về Hồi quy: kiểm định Phần dư (Residuals)

  • Những giả định hồi quy được dựa trên đặc tính của phần dư (không phải dữ liệu gốc)
  • Phần dư được giả định là:
    • Không liên quan với X’s
    • Ổn định và độc lập: không

thay đổi qua thời gian

    • Bất biến: không tăng khi

Y-được dự báo (predicted Y)

tăng

    • Phân phối chuẩn (phân phối

hình chuông) với giá trị trung

bình bằng 0

(C) Weick Institute of Management Consulting, 2024

54

4/3/2025

15

10

5

0

0

5

10

15

residual

residual

55 of 92

Kiểm định về Phần dư

  • Biểu đồ phần dư (Residuals plots) phải được kiểm tra để đảm bảo các giả thiết có giá trị; nếu không, phương trình hồi quy có thể không đúng hoặc sai lầm

(C) Weick Institute of Management Consulting, 2024

55

4/3/2025

0

50

100

­3

­2

­1

0

1

2

3

Time Order

0

50

100

­3

­2

­1

0

1

2

3

Time Order

Biểu đồ phần dư

Tốt

Xấu

Ý nghĩa/ Hành động

Giả định

Không liên quan đến X

Ổn định

1. Phần dư so với mỗi X

2. Biểu đồ theo thời gian của phần dư�

Mối quan hệ giữa X và Y không phải là một đường thẳng, mà là đường cong. Thử các phép biến đổi với X, Y hoặc cả hai. Hoặc sử dụng X2 trong Hồi quy đa biến

Bất kỳ kiểu mẫu lặp lại nào qua thời gian có nghĩa là một nhân tố nào khác, liên quan đến thời gian, ảnh hưởng đến Y. Cố gắng tìm ra và đưa nó vào Hồi quy đa biến.

Phần dư

Phần dư

3

4

5

6

7

8

9

10

11

12

­3

­2

­1

0

1

2

3

X

Phần dư

10

20

30

­3

­2

­1

0

1

2

3

X

Phần dư

56 of 92

Kiểm tra giả thuyết về Phần dư (tt)

(C) Weick Institute of Management Consulting, 2024

56

4/3/2025

3. Phần dư so với Y-dự báo (Fits)

4. Biểu đồ xác suất chuẩn của phần dư�

Biểu đồ phần dư

Tốt

Xấu

Ý nghĩa/ Hành động

Giả thuyết

Bất biến

Phân phối

chuẩn

Hình cánh quạt này có nghĩa là dao động tăng dần khi Y tăng thêm. (Phần dư không bất biến.) Thử lấy căn Y, Log Y, hoặc phép biến đổi nghịch đảo lên Y

Phần dư không chuẩn. Thử phép biến đổi lên X, Y hoặc cả hai

30

40

50

­3

­2

­1

0

1

2

3

Pred. Y

Phần dư

0

50

100

­3

­2

­1

0

1

2

3

Pred. Y

Phần dư

­3

­2

­1

0

1

2

3

­3

­2

­1

0

1

2

3

Residual

Nscore

­1

0

1

2

3

4

­3

­2

­1

0

1

2

3

Residual

Nscore

57 of 92

Kiểm định hệ số gốc: Sử dụng P-Value để kiểm định ‘Giả thuyết H0’ rằng Hệ số góc hồi quy bằng 0

  • Diễn giải giá trị P (P-values) cho hệ số góc (slope) trong phân tích hồi quy:
    • Nếu Pi ≥ 0.05:
      • Không loại bỏ H0:
      • Không có đủ bằng chứng để phát biểu rằng có một hệ số góc có ý nghĩa thống kê
      • Nếu có hệ số góc thật sự, thì hoặc là dao động quá lớn hoặc mẫu quá nhỏ để hệ số góc có thể được phát hiện
    • Nếu Pi < 0.05:
      • Loại bỏ H0, kết luậnHa
      • Khác 0 về mặt thống kê (có hệ số góc hay một mối quan hệ đáng kể)
      • Hành động: Đánh giá tầm quan trọng của mối quan hệ — Có đảm bảo hành động nào xa hơn không?

(C) Weick Institute of Management Consulting, 2024

57

4/3/2025

58 of 92

Những quan sát bất thường (outliers)

  • Quan sát được coi là bất thường nếu nó nằm xa đường hồi quy hoặc có ảnh hưởng lớn đến đường kết quả
  • Nếu có bất cứ quan sát bất thường nào được nhìn thấy:
    • Kiểm tra xem có sai sót nào không
    • Tìm hiểu xem liệu có điều gì bất thường đang xảy ra
    • Chạy lại phân tích hồi quy loại bỏ những quan sát bất thường để xác định xem các hệ số (b0 và b1) thay đổi nhiều như thế nào:
      • Nếu các hệ số thay đổi đáng kể, bạn phải quyết định liệu các quan sát bất thường này có được để xác định phương trình hồi quy hay không

(C) Weick Institute of Management Consulting, 2024

58

4/3/2025

59 of 92

Những quan sát bất thường (tt)

    • Chạy lại phân tích hồi quy loại bỏ những quan sát bất thường để xác định xem các hệ số (b0 và b1) thay đổi nhiều như thế nào (tt):
      • Đường hồi quy nên thể hiện rõ ràng mối quan hệ giữa X và Y:
        • Loại bỏ một vài quan sát có thể làm giảm khoảng (range) của dữ liệu X
        • Không loại bỏ những điểm thật sự nằm ngoài (true outliers) có thể gây ảnh hưởng bất thường lên phương trình hồi quy

(C) Weick Institute of Management Consulting, 2024

59

4/3/2025

60 of 92

Các giả định trong phân tích hồi quy

    • Tất cả các giả định là liên quan đến phần dư
    • Không có giả định nào cho X hay Y
    • X và Y không cần thiết phải là:
      • Phân phối hình chuông (Phân phối chuẩn)
      • Ổn định (qua thời gian)
      • Ngẫu nhiên

(C) Weick Institute of Management Consulting, 2024

60

4/3/2025

61 of 92

Tổng kết: Diễn dịch đầu ra cho Hồi quy một biến X

(C) Weick Institute of Management Consulting, 2024

61

4/3/2025

- ∞ đến

Ý nghĩa

P­value cho hệ số góc (slope)

r

R­square�(R­sq)�

S

(Phần dư) Residual

Standardized�Residual

Quan sát có ảnh hưởng

Xác suất hệ số góc là đáng kể (khác 0)

Hệ số tương quan

Phần trăm của dao động được

giải thích= r2

Độ lệch chuẩn của phần dư (Dao động không được giải thích)

= Y quan sát – Y dự báo

Phần dư

Độ lệch chuẩn

Một quan sát mà giá trị X có ảnh hưởng lớn đến giá trị các hệ số (của đường hồi quy)

Nếu nhỏ hơn 0.05, hệ số góc là đáng kể (khác 0) và X có quan hệ với Y

Cho thấy độ mạnh của mối quan hệ tuyến tính. Các con số gần số 0 ngụ ý không có mối quan hệ tuyến tính

Phần trăm dao động trong các giá trị Y được giải thích bởi mối quan hệ với X)

Cho thấy giá trị quan sát điển hình khác như thế nào với giá trị dự báo, trong các đơn vị dữ liệu gốc

Nếu giá trị tuyệt đối của phần dư chuẩn hóa > 3, thì nó là một quan sát bất thường. Hãy tìm hiểu thêm về nó.

Phần dư được giả thiết là ngẫu nhiên và tuân theo phân phối chuẩn với số trung bình bằng 0 (cho thấy nguyên nhân dao động thông thường).

Xem quan sát có tầm ảnh hưởng này trên biểu đồ để quyết định liệu có giữ hay loại bỏ nó khỏi phân tích hồi quy.

0 đến 1

–1 đến +1

0 đến 100%

Khoảng –3 đến +3

0 đến

Tên

Định nghĩa

Phạm vi

=

- ∞ đến

62 of 92

Hồi quy tuyến tính đa biến

63 of 92

Bạn có thể hoàn thiện dự báo này?

  • Làm thế nào để dự báo thời gian xuất viện của bệnh nhân
  • Làm thế nào dự báo được doanh thu của bệnh viện

      • Bạn cần những dữ liệu nào?
      • Bạn sẽ trình bày và phân tích các dữ liệu đó như thế nào?
      • Bạn có thể sử dụng các biểu đồ và phân tích như thế nào để tìm được “một vài X’s quan trọng” giải thích được dao động trong ngày?

(C) Weick Institute of Management Consulting, 2024

63

4/3/2025

64 of 92

Biểu đồ ma trận phân tán: cho thấy mối quan hệ giữa nhiều X’s và Y’s

  • Định nghĩa: Một biểu đồ ma trận gồm các biểu đồ phân tán cho tất cả các cặp dữ liệu được tổ chức trong một ma trận

(C) Weick Institute of Management Consulting, 2024

64

4/3/2025

Đừng căng mắt tìm các chi tiết về các điểm đơn lẻ trên biểu đồ ma trận! �Mục tiêu là để có được cái nhìn ban đầu nhanh chóng về các kiểu mẫu cho thấy các biến có liên hệ với nhau như thế nào.

65 of 92

Ma trận quan hệ: Lượng hóa độ mạnh �mối quan hệ giữa X’s and Y’s

  • Định nghĩa: Một ma trận tương quan bao gồm các hệ số tương quan (r) cho tất cả các cặp biến có trong ma trận
  • Đầu ra khi dùng Minitab:

(C) Weick Institute of Management Consulting, 2024

65

4/3/2025

Correlations (Pearson)

X1 X2 X3 Y1

X2 ­0.259

X3 ­0.293 0.979

Y1 ­0.245 0.928 0.934

Y2 ­0.139 0.631 0.635 0.746

66 of 92

Ma trận quan hệ: Lượng hóa độ mạnh �mối quan hệ giữa X’s and Y’s (tt)

  • Nhắc lại về hệ số tương quan:

r = –1 Mối tương quan nghịch tuyệt đối

r = 0 Không có tương quan tuyến tính

r = +1 Mối tương quan thuận tuyệt đối

  • Minitab menu để thực hiện ma trận tương quan:

Stat > Basic Statistics > Correlation

(C) Weick Institute of Management Consulting, 2024

66

4/3/2025

67 of 92

Liên kết �Biểu đồ ma trận và Biểu đồ quan hệ

(C) Weick Institute of Management Consulting, 2024

67

4/3/2025

Gần 0;

Không tương quan

Correlations

X1 X2 X3 Y1

X2 ­0.259

X3 ­0.293 0.979

Y1 ­0.245 0.928 0.934

Y2 ­0.139 0.631 0.635 0.746

Tương quan mạng, có quan hệ tuyến tính mạnh

Tương quan tương đối mạnh

68 of 92

Hồi quy đa biến: Lượng hóa mối quan hệ�giữa nhiều X’s và một Y

  • Phương trình hồi quy với một biến X:

Y = b0 + b1 X

  • (Đa biến) Phương trình hồi quy cho nhiều biến X’s:

Y = b0 + b1 X1 + b2 X2 + b3 X3 + … + bk Xk

(C) Weick Institute of Management Consulting, 2024

68

4/3/2025

69 of 92

Ví dụ minh họa �Sử dụng phương trình hồi quy đa biến

Dự báo lượng bệnh sốt xuất huyết nhập viện từ cộng đồng

  • Phân tích hồi quy đa biến cho ra phương trình như sau:

Y = ­ 6.20 + 5.86(X1) + 0.000151(X2) + 1.39(X3) + 0.86(X4)

(C) Weick Institute of Management Consulting, 2024

69

4/3/2025

Số ca sốt xuất huyết nhập viện

Số ca cấp cứu sốt xuất huyết trong tuần

Thanh toán bảo hiểm y tế

Tuổi

Số ngày nằm viện

BN Y X1 X2 X3 X4

70 of 92

Cảnh báo! �Đừng so sánh các hệ số với nhau

  • Độ lớn của các hệ số:
    • Giá trị của các hệ số (độ lớn) không hàm ý rằng X nào sẽ có tác động lớn nhất lên Y
    • Tất các các X’s có thang đo khác nhau

(C) Weick Institute of Management Consulting, 2024

70

4/3/2025

71 of 92

Hình ảnh hóa �Phương trình hồi quy đa biến

(C) Weick Institute of Management Consulting, 2024

71

4/3/2025

Cho một X

Cho hai X’s

Cho > = X’s

Không thể hình ảnh hóa được. Nhưng tất cả các khái niệm vừa rồi mở rộng đa chiều, bao gồm cả phương pháp bình phương nhỏ nhất được dùng để khớp phương trình cho dữ liệu

Y = 3 – 3X

Y = 3 – 3X1 + 2 X2

Y = 3 – 3X1 + 2 X2 ­ 5 X3

­5

0

5

10

0

1

2

3

0

1

2

3

Y

X1

X2

72 of 92

Lợi ích của Hồi quy Đa biến

  1. Thiết lập bản chất của mối quan hệ:
    • Thiết lập bản chất của mối quan hệ (phương trình) giữa các đầu vào quan trọng (X’s) và đầu ra (Y):

Y = b0 + b1X1 + b2X2 + . . . + bkXk

  • Phát triển các giải pháp:
    • Phát triển các giải pháp nhằm cải tiến và kiểm soát quá trình (dựa vào những kiến thức từ phương trình):
      • Hy vọng các X’s quan trọng là nhân tố điều khiển: chúng làm Y thay đổi (hơn là chỉ đơn thuần có tương quan với nhau)
      • Hy vọng bạn có thể kiểm soát hay quản lý được các nhân tố điều khiển chính này (X’s)
      • Nếu bạn không thể kiểm soát được X’s hay chúng không gây ra thay đổi của Y, bạn vẫn có thể dự báo kết quả với các X’s quan trọng (cho mục đích hoạch định) trong lúc bạn tìm kiếm các nhân tố điều khiển mà bạn có thể kiểm soát

(C) Weick Institute of Management Consulting, 2024

72

4/3/2025

73 of 92

Cảnh báo đối với Hồi quy đa biến

  • Cũng giống như đối với Hồi quy tuyến tính đơn giản:
    • Ngoại suy ngoài phạm vi dữ liệu X’s là rủi ro
    • Nếu ngoại suy, đảm bảo bạn có những dữ liệu khác, kiến thức về quá trình hoặc lý thuyết nào đó hướng dẫn bạn
    • Tương quan không có nghĩa là nhân quả (hy vọng rằng bằng cách kiểm soát các X’s quan trọng, sẽ ảnh hưởng được Y)
    • Không có tương quan không có nghĩa là không có quan hệ nhân quả:
      • Kiểm tra phạm vi của X’s: Có phải phạm vi quá hẹp không?
      • Biểu đồ phân tán phân tầng bởi các dữ liệu rời rạc khác
      • Bây giờ bạn có thể thấy mối quan hệ nào không?

(C) Weick Institute of Management Consulting, 2024

73

4/3/2025

74 of 92

Cảnh báo đối với Hồi quy đa biến (tt)

  • Cũng giống như đối với Hồi quy tuyến tính đơn giản (tt):
    • Dữ liệu cho X và Y phải hợp với nhau theo từng cặp: đơn vị với đơn vị, hay trường hợp với trường hợp; nếu không, kết luận và dự báo có thể không đúng.
      • “Hợp theo cặp” có nghĩa là bạn có thể liên kết mỗi thang đo của X với Y với cùng đơn vị lấy mẫu (ngày, ứng dụng, hành động, giao dịch,…)
  • Riêng cho hồi quy đa biến:
    • Các X’s nên không liên quan (tương quan) với nhau —nếu không, các hệ số (b) của các X’s có tương quan với nhau rất đáng nghi ngờ (về tính đúng đắn và chính xác)

(C) Weick Institute of Management Consulting, 2024

74

4/3/2025

75 of 92

Đa cộng tuyến (Multicollinearity): Vấn đề gây ra bởi các X’s tương quan với nhau

  • Nếu hai X’s (giả sử chúng là: X1 và X2) có tương quan nhiều với nhau, thì:
    • Hệ số của chúng (b1 hoặc b2) có thể rất lớn, rất nhỏ, hay có dấu hiệu sai lầm
    • P­values có thể sai lệch:
      • P-value lớn không đáng kể có thể trở thành đáng kể nếu một X ‘có tương quan’ được loại bỏ khỏi mô hình
    • Kết luận rất có thể là sai lầm
  • “Các X’s có tương quan với nhau” được gọi là đa cộng tuyến (multicollinearity)

(C) Weick Institute of Management Consulting, 2024

75

4/3/2025

76 of 92

Các X’s có tương quan: Ví dụ

  • Tuổi và số năm làm việc có tương quan cao với nhau
  • Đâu là nhân tố điều khiển chính cho thu nhập?
    • Chỉ có tuổi tác?
    • Chỉ có số năm làm việc?
    • Cả tuổi tác và số năm làm việc?
  • Không thể biết được
  • Điều này giống như có được thông tin chỉ từ một X (không phải hai X) trong phân tích hồi quy.

(C) Weick Institute of Management Consulting, 2024

76

4/3/2025

X1 (Tuổi)

X2 (Số năm làm việc)

Y (Thu nhập)

Hệ số tương quan

X1 X2

X2 0.979

Y 0.928 0.934

77 of 92

Hệ số lạm phát phương sai - Variance Inflation Factor (VIF): Kiểm tra Đa cộng tuyến

  • Hệ số lạm phát phương sai (VIF):
    • Đo lường Đa cộng tuyến –

mối quan hệ giữa các biến

dự báo

    • VIF đối với Xi:
      • VIFi = (1 – Ri2 ) –1
      • Trong đó Ri là tương quan đa

biến của Xi với tất cả các biến

dự báo khác trong mô hình

  • Minitab menu:

Stat > Regression > Regression > Options�(Select Display “ Variance inflation factors”)

(C) Weick Institute of Management Consulting, 2024

77

4/3/2025

Hướng dẫn

Đa cộng tuyến

Không có vấn đề gì

Vấn đề:

  • Hệ số hồi quy được dự báo tệ:
    • Quá lớn hoặc quá nhỏ
    • Sai hướng

Hành động:

  • Loại bỏ một trong những biến có tương quan với nhau trong mô hình (phương trình) và thực hiện lại hồi quy

VIF

78 of 92

R­sq và Rsqđiều chỉnh (R­sqadj) �trong Hồi quy đa biến

  • R­sq:
    • Phần trăm dao động của Y được giải thích bởi các biến dự báo (X’s)
    • Bằng với bình phương của tương quan giữa Y-quan sát và Y-nằm trên đường hồi quy (Y-dự báo)
    • Luôn luôn tăng khi có thêm một X vào mô hình
    • Luôn luôn giảm khi loại một X khỏi mô hình�

(C) Weick Institute of Management Consulting, 2024

78

4/3/2025

79 of 92

R­sq và Rsqđiều chỉnh (R­sqadj) �trong Hồi quy đa biến (tt)

  • R­sqadj:
    • Được điều chỉnh theo số lượng các X’s trong mô hình
    • Tương tự như R­sq nếu n tương đối lớn
    • Nhỏ hơn R­sq nếu n tương đối nhỏ
    • Có thể tăng hoặc giảm khi thêm hoặc bớt các biến X’s vào mô hình
    • Được dùng hợp lý hơn cho phân tích đa biến

(C) Weick Institute of Management Consulting, 2024

79

4/3/2025

80 of 92

Chiến lược đối phó với hiện tượng �Đa cộng tuyến (Multicollinearity)

  • Ngắn hạn:
    • Chọn một biến X có tương quan để loại bỏ khỏi mô hình:
      • Biến được chọn nên là biến có ít ý nghĩa nhất trong mô hình

và/ hoặc

      • Biến mà bạn không thể kiểm soát
    • Ghi chú điều này
    • Chạy lại phương trình hồi quy

(C) Weick Institute of Management Consulting, 2024

80

4/3/2025

81 of 92

Chiến lược đối phó với hiện tượng �Đa cộng tuyến (Multicollinearity) (tt)

  • Dài hạn:
    • Xem xét chạy lại thiết kế thử nghiệm nhằm:
      • Tìm hiểu mối quan hệ giữa các biến và tách các tác động của chúng lên Y
      • Tìm hiểu các biến với phạm vi không đủ
      • Tìm hiểu các biến mà bạn thiếu dữ liệu
      • Định nghĩa tốt hơn mối quan hệ giữa một vài biến X’s quan trọng (chẳng hạn như chúng tương tác với nhau như thế nào)

(C) Weick Institute of Management Consulting, 2024

81

4/3/2025

82 of 92

Giả định cho �Hồi quy tuyến tính đa biến

  • Mới đối với Hồi quy đa biến:
    • Các biến X’s không liên quan (tương quan) với nhau
  • Giống như đối với Hồi quy tuyến tính đơn giản :
    • Các giả định hồi quy chính dựa trên đặc điểm của phần dư (Y-quan sát – Y-dự báo), giả định rằng:
      • Không liên quan đến X’s
      • Ổn định và độc lập; không thay đổi theo thời gian
      • Bất biến; không tăng khi Y-dự báo tăng
      • Chuẩn (phân phối hình chuông) với số trung bình bằng 0

(C) Weick Institute of Management Consulting, 2024

82

4/3/2025

83 of 92

Kiểm định Phần dư

  • Biểu đồ phần dư (Residuals plots) phải được kiểm tra để đảm bảo các giả thiết có giá trị; nếu không, phương trình hồi quy có thể không đúng hoặc sai lầm

(C) Weick Institute of Management Consulting, 2024

83

4/3/2025

0

50

100

­3

­2

­1

0

1

2

3

Time Order

0

50

100

­3

­2

­1

0

1

2

3

Time Order

Biểu đồ phần dư

Tốt

Xấu

Ý nghĩa/ Hành động

Giả định

Không liên quan đến X

Ổn định

1. Phần dư so với mỗi X

2. Biểu đồ theo thời gian của phần dư�

Mối quan hệ giữa X và Y không phải là một đường thẳng, mà là đường cong. Thử các phép biến đổi với X, Y hoặc cả hai. Hoặc sử dụng X2 trong Hồi quy đa biến

Bất kỳ kiểu mẫu lặp lại nào qua thời gian có nghĩa là một nhân tố nào khác, liên quan đến thời gian, ảnh hưởng đến Y. Cố gắng tìm ra và đưa nó vào Hồi quy đa biến.

Phần dư

Phần dư

3

4

5

6

7

8

9

10

11

12

­3

­2

­1

0

1

2

3

X

Phần dư

10

20

30

­3

­2

­1

0

1

2

3

X

Phần dư

84 of 92

Kiểm định Phần dư (tt)

(C) Weick Institute of Management Consulting, 2024

84

4/3/2025

3. Phần dư so với Y-dự báo (Fits)

4. Biểu đồ xác suất chuẩn của phần dư�

Biểu đồ phần dư

Tốt

Xấu

Ý nghĩa/ Hành động

Giả thuyết

Bất biến

Phân phối

chuẩn

Hình cánh quạt này có nghĩa là dao động tăng dần khi Y tăng thêm. (Phần dư không bất biến.) Thử lấy căn Y, Log Y, hoặc phép biến đổi nghịch đảo lên Y

Phần dư không chuẩn. Thử phép biến đổi lên X, Y hoặc cả hai

30

40

50

­3

­2

­1

0

1

2

3

Pred. Y

Phần dư

0

50

100

­3

­2

­1

0

1

2

3

Pred. Y

Phần dư

­3

­2

­1

0

1

2

3

­3

­2

­1

0

1

2

3

Residual

Nscore

­1

0

1

2

3

4

­3

­2

­1

0

1

2

3

Residual

Nscore

85 of 92

Đánh giá R2

  • Đây là hướng dẫn giúp bạn đánh giá phần dao động còn lại (không giải thích được) là chỉ bởi vì các nguyên nhân thông thường hoặc liệu bạn nên tiếp tục tìm kiếm các yếu tố khác để giải thích cho Y:

    • Bạn đánh giá mô hình cuối cùng cho dữ liệu độ dày bức tường như thế nào?
    • Liệu bạn có nên tiếp tục tìm kiếm thêm các biến X’s nhằm giải thích dao động được nhiều hơn?

(C) Weick Institute of Management Consulting, 2024

85

4/3/2025

LOẠI THANG ĐO

GIÁ TRỊ R-SQ ĐIỂN HÌNH

NHẬN XÉT

Nhận thức/ Hành vi

(Ý kiến, quan điểm, …)

Ví dụ: Khảo sát sự hài lòng của khách hàng, khảo sát thái độ của nhân viên, ….

.20 đến .60

Quá trình đo lường nhận thức của con người (bao gồm sử dụng các công cụ đo lường) thường có nhiều nguyên nhân dao động phổ biến (không giải thích được), vì thế R-sq sẽ thấp hơn

Vật lý (kích thước, sức mạnh,…)

Ví dụ: Cân nặng hộp thức ăn, độ dày của gỗ dán

.70 đến .90

Quá trình đo lường các đặc tính vật lýnhận thức của con người (bao gồm sử dụng các công cụ đo lường) thường có ít các nguyên nhân dao động phổ biến (không giải thích được), vì thế R-sq sẽ cao hơn

86 of 92

Qui tắc kinh nghiệm đối với �cỡ mẫu cần thiết cho Hồi quy đa biến

  • Kích thước mẫu thực tế cần thiết cho một phân tích hồi quy thay đổi phụ thuộc vào lượng dao động trong dữ liệu và độ lớn của các hệ số góc bạn muốn khám phá
  • Điều này được thực hiện tốt nhất với nguyên tắc kinh nghiệm
  • Nhưng bạn cũng có thể thấy hướng dẫn này có ích:
    • Có ít nhất 10–30 giá trị cho mỗi biến X bạn muốn đưa vào mô hình
      • Ví dụ:

4 X’s 40–120 điểm dữ liệu

(C) Weick Institute of Management Consulting, 2024

86

4/3/2025

87 of 92

Tóm tắt �Hồi quy tuyến tính đa biến

(C) Weick Institute of Management Consulting, 2024

87

4/3/2025

residual

standard deviation

Ý nghĩa

P­value cho hệ số góc

r

R­square�(R­sq)�

S

Phần dư

Phần dư chuẩn hóa

Quan sát có ảnh hưởng

Xác suất hệ số góc là đáng kể (Khác 0)

Hệ số tương quan

Phần trăm dao động được giải thích = r2

Độ lệch chuẩn của phần dư (Dao động không được giải thích)

= Y-quan sát –Y-dự báo

Một quan sát mà giá trị X của nó có ảnh hưởng lớn lên giá trị của các hệ số (trên đường hồi quy)

Nếu < 0.05, hệ số góc là đáng kể (khác 0) và X liên quan đến Y

Chỉ ra độ mạnh của mối quan hệ tuyến tính. Các con số gần bằng 0 ngụ ý không có mối quan hệ

Phần trăm của dao động trong giá trị Y được giải thích bởi mối quan hệ với X

Chỉ ra giá trị quan sát điển hình khác bao nhiêu so với giá trị dự báo, theo đơn vị của dữ liệu gốc.

Nếu giá trị tuyệt đối của phần dư chuẩn hóa�> 3, thì nó là quan sát bất thường. Tìm hiểu nó.

Phần dư được giả định là ngẫu nhiên và chuẩn hóa với số trung bình bằng 0 (đại diện cho nguyên nhân dao động phổ biến).

Xem chúng trên biểu đồ, quyết định liệu sẽ giữ hay loại bỏ chúng khỏi phân tích hồi quy.

0 đến1

­1 đến +1

0 đến 100%

Khoảng ­3 đến +3

Tên gọi

Định nghĩa

Phạm vi

=

Hệ số góc bi, của xi

Giá trị hệ số của Xi trong phương trình hồi quy

Đơn vị thay đổi trong Y đối với một đơn vị tăng thêm của X khi tất cả các X’s khác giữa nguyên

R-square điều chỉnh (R-sqADJ)�

R­square điều chỉnh cho số lượng terms trong mô hình

0 đến khoảng 100%

Sử dụng giá trị này để so sánh các mô hình với các số lượng terms khác nhau

VIF

Hệ số lạm phát phương sai phản ánh tương quan giữa một X với các X’s khác

1 đến

Nếu VIF > 5 đến 10, thì có vấn đề với đa cộng tuyến. Các hệ số và P-value có thể sai lầm. Loại bỏ một X có tương quan.

- ∞ đến

Phần dư

Độ lệch chuẩn

- ∞ đến

- ∞ đến

- ∞ đến

88 of 92

Quy trình cho hồi quy đa biến

(C) Weick Institute of Management Consulting, 2024

88

4/3/2025

  • Quan sát biếu đồ
  • Quan sát thống kê mô tả
  • Tuyến tính hay phi tuyến?
  • Một X hay nhiều X’s?
  • Có cần biến đổi?
  • X rời rạc? Y rời rạc
  • Thực hiện hồi quy
  • Quan sát VIFS
  • Quan sát biểu đồ phần dư
  • Quan sátR-SqADJ, S
  • Quan sát P-value cho tất các các hệ số (b)
  • Thực hiện dự báo đối với các X’s quan trọng

Inadequate

1. Làm quen với dữ liệu

Khớp không đủ

2. Đưa ra mô hình

3. Khớp mô hình vào dữ liệu

5. Báo cáo kết quả và sử dụng phương trình

4.

Kiểm tra

mô hình và

giả thuyết

Khớp tốt

89 of 92

Kỹ hơn về bước 2: Hình thành mô hình

  • Sử dụng kiến thức của bạn
    • Phỏng đoán về dạng quan hệ giữa X và Y
    • Theo bạn thì dạn quan hệ này là gì?
  • Nhìn vào biểu đồ tương quan của Y với mỗi X:
    • Nó là đường thẳng hay đường cong?
    • Tuyến tính hóa chúng?
    • Tìm thêm các biến rời rạc khác nhằm chỉ ra nhiều quan hệ phức tạp khác
    • Khoảng (range) của X đủ rộng để thấy được mối liên hệ ?
    • Kiểm tra các điểm khác thường
  • Xem xét biểu đồ thời gian cho từng biến:
    • Các thông tin bạn có thêm được về các nhân tố liên quan tới thời gian là gì?
  • Xem xét ma trận tương quan của Y và X:
    • |r| > 0.4 thể hiện có sự tương quan tuyến tính nào đó

(C) Weick Institute of Management Consulting, 2024

89

4/3/2025

90 of 92

Cảnh báo! Đừng loại bỏ biến dự báo trước khi thực hiện hồi quy

  • Đừng loại bỏ biến ra khỏi phương trình trước khi thực hiện hồi qui, cho dù :
    • Đồ thị tương quan chỉ ra tương quan giữa Xk và Y là nhỏ

hoặc

    • Sự tương quan, r, giữa Xk và Y là thấp
  • Mối liên hệ phức tạp giữa Xk và những X’s khác với Y có thể làm cho Xk trên thực tế trở yếu tố quan trọng đối với Y
  • Giá trị trong hồi qui đa biến:
    • Một số X’s được phần tích cùng với nhau, tại cùng thời điểm, hơn là phân tích riêng lẻ
    • Mối quan hệ phức tạp có thể được nhận dạng và định lượng

(C) Weick Institute of Management Consulting, 2024

90

4/3/2025

91 of 92

Tổng kết về Hồi quy

  • Phần này đã bao gồm những điểm sau đây:
    • Phân tích hồi quy lượng hóa mối quan hệ giữa thang đo đầu ra (Y) với một hoặc nhiều thang đo đầu vào hay quá trình (X’s) bằng cách khớp một đường thẳng, đường cong hoặc mặt phẳng vào dữ liệu
    • Phân tích hồi quy phát tạo một phương trình đường thẳng, đường cong hoặc mặt phẳng:
      • Giải thích biến động trong các giá trị của Y
      • Cho phép dự báo tác động kiểm soát của biến quá trình (X)
      • Cho phép dự báo sự thực hiện của quá trình trong tương lai đối với một giá trị cụ thể của X
      • Giúp nhận dạng một vài biến quan trọng tác động đến Y

(C) Weick Institute of Management Consulting, 2024

91

4/3/2025

92 of 92

(C) Weick Institute of Management Consulting, 2024

92

4/3/2025