Phân tích hồi quy đa biến trong SPSS là một bước then chốt khi xử lý dữ liệu. Vậy để thực hiện đúng phương pháp này, bạn cần làm gì? Mặc dù không quá phức tạp, nhưng nếu không nắm vững các bước, việc nhầm lẫn vẫn rất dễ xảy ra. Vì vậy, hôm nay VietGuru sẽ hướng dẫn bạn chi tiết cách chạy hồi quy đa biến và cách đọc kết quả sau khi đã chạy. Hãy cùng theo dõi!
1. Hồi quy đa biến là gì?
Hồi quy đa biến (Multiple Linear Regression) là phương pháp thống kê dùng để mô hình hóa mối quan hệ tuyến tính giữa một biến phụ thuộc (kết quả cần dự đoán) và nhiều biến độc lập (yếu tố ảnh hưởng).
Phương pháp này giúp đánh giá đồng thời tác động của nhiều yếu tố đến một kết quả cụ thể, từ đó đưa ra dự báo, giải thích các hiện tượng thực tế và hỗ trợ quyết định trong nhiều lĩnh vực như kinh tế, y học, kỹ thuật và khoa học xã hội.
Khác với hồi quy tuyến tính đơn, vốn chỉ xem xét một biến độc lập, hồi quy đa biến mở rộng mô hình để bao gồm nhiều biến giải thích, giúp tăng độ chính xác và phản ánh đúng tính phức tạp của dữ liệu.
Đây cũng là nền tảng cho nhiều kỹ thuật nâng cao trong phân tích thống kê và học máy, chẳng hạn như hồi quy logistic, mô hình hỗn hợp, mạng nơ-ron hay các thuật toán chọn biến.
Mô hình hồi quy đa biến tổng quát được biểu diễn như sau:
Y = β₀ + β₁X₁ + β₂X₂ + ⋯ + βₚXₚ + ε
Trong đó:
- Y: Biến phụ thuộc, giá trị cần dự đoán hoặc giải thích.
- X₁, X₂, …, Xₚ: Các biến độc lập ảnh hưởng đến Y.
- β₀: Hằng số (intercept).
- β₁, β₂,…, βₚ: Hệ số hồi quy, cho biết mức thay đổi trung bình của Y khi Xᵢ tăng một đơn vị, giữ các biến khác không đổi.
- ε: Sai số ngẫu nhiên, đại diện cho những yếu tố chưa được mô hình hóa trong dữ liệu.

Hồi quy đa biến là gì?
Có thể bạn quan tâm: Viết thuê nghiên cứu khoa học
2. Ý nghĩa và vai trò của hồi quy đa biến
Hồi quy đa biến là công cụ quan trọng giúp khám phá dữ liệu, kiểm định giả thuyết, xây dựng mô hình dự đoán và hỗ trợ ra quyết định thông minh. Khi sử dụng hồi quy đa biến, nhà phân tích có thể:
- Định lượng ảnh hưởng của từng yếu tố đến một hiện tượng cụ thể.
- Khám phá mối quan hệ giữa các yếu tố đầu vào và kết quả đầu ra.
- Dự báo tương lai dựa trên các yếu tố đã biết.
- Tối ưu hóa hệ thống hoặc quy trình hoạt động.
Các ví dụ ứng dụng thực tế:
- Kinh tế: Dự đoán giá nhà dựa trên diện tích, số phòng, vị trí và năm xây dựng.
- Y học: Đánh giá nguy cơ mắc bệnh tim dựa trên tuổi, mức cholesterol, chỉ số BMI và thói quen hút thuốc.
- Tiếp thị: Ước tính doanh số dựa trên ngân sách quảng cáo, thời gian khuyến mãi, giá bán và phản hồi khách hàng.

Ý nghĩa và vai trò của hồi quy đa biến
Có thể bạn quan tâm: Chi square là gì
3. Ước lượng và diễn giải hệ số hồi quy đa biến
Khi thực hiện phân tích hồi quy tuyến tính đa biến, điều quan trọng là phải xác định mức độ ảnh hưởng của từng yếu tố lên biến kết quả Y. Để đánh giá chính xác, bạn cần chú ý đến các trị số quan trọng sau:
3.1. Hệ số tương quan Pearson (R)
Yếu tố nào có R càng lớn thì mức độ ảnh hưởng của nó lên biến kết quả càng mạnh.
3.2. Bình phương R (R²) và ý nghĩa của nó
Yếu tố nào có R² càng lớn thì mối quan hệ giữa yếu tố đó và biến Y càng chặt chẽ.
3.3. Hệ số hồi quy Beta – tầm quan trọng và cách đọc
Yếu tố nào có Beta cao thì ảnh hưởng lên biến Y càng lớn. Tuy nhiên, khi các yếu tố có đơn vị khác nhau (ví dụ: tuổi, mmol/L, mmHg…), không thể trực tiếp so sánh mức độ ảnh hưởng giữa chúng.
Để so sánh được, các yếu tố cần được chuyển về cùng đơn vị là độ lệch chuẩn. Khi đó, bạn sẽ sử dụng hệ số hồi quy chuẩn hóa (Standardized Beta), được tính theo công thức:

Hệ số hồi quy Beta
Trong đó:
- Sx: là độ lệch chuẩn của biến X
- Sy: là độ lệch chuẩn của biến Y
Hệ số hồi quy chuẩn hóa cho phép so sánh mức độ ảnh hưởng tương đối của các yếu tố lên kết quả một cách trực quan và chính xác hơn.
3.4. Trị số p (Sig.) và cách kết luận giả thuyết
Trong phân tích hồi quy đa biến, trị số p (Sig.) là chỉ số quan trọng để đánh giá ý nghĩa thống kê của từng yếu tố độc lập đối với biến phụ thuộc Y.
- Trị số p (Sig.) nhỏ hơn 0,05: cho thấy yếu tố đó có ảnh hưởng có ý nghĩa thống kê, tức là bạn có đủ cơ sở để bác bỏ giả thuyết H₀, rằng yếu tố này không ảnh hưởng đến Y.
- Trị số p (Sig.) lớn hơn 0,05: yếu tố đó không có ý nghĩa thống kê, tức bạn không đủ bằng chứng để bác bỏ H₀, và ảnh hưởng của yếu tố này lên Y có thể do ngẫu nhiên.
Cách kết luận giả thuyết: Xác định mức ý nghĩa α (thường là 0,05).
So sánh trị số p với α:
- p < α → bác bỏ H₀ → yếu tố có ảnh hưởng đáng kể.
- p ≥ α → không bác bỏ H₀ → yếu tố không có ảnh hưởng đáng kể.
Trị số p giúp nhà phân tích lọc ra các yếu tố quan trọng, từ đó xây dựng mô hình hồi quy chính xác và đáng tin cậy.
Có thể bạn quan tâm: Phương pháp phỏng vấn
4. Các giả định của mô hình hồi quy đa biến
Để mô hình hồi quy có giá trị thống kê và đưa ra kết luận đáng tin cậy, cần đảm bảo các giả định cơ bản sau:
- Tính tuyến tính: Mối quan hệ giữa biến phụ thuộc Y và các biến độc lập Xᵢ phải là tuyến tính.
- Không có đa cộng tuyến cao: Các biến độc lập không được quá tương quan với nhau, tránh gây sai số ước lượng.
- Độc lập giữa các quan sát: Mỗi quan sát phải độc lập, không phụ thuộc lẫn nhau.
- Phân phối chuẩn của sai số: Sai số ε cần có phân phối chuẩn với trung bình bằng 0.
- Phương sai đồng nhất (Homoscedasticity): Phương sai của sai số phải ổn định, không thay đổi theo giá trị của các biến độc lập.
Việc vi phạm các giả định này có thể dẫn đến ước lượng sai lệch, kết luận không chính xác hoặc mô hình không ổn định.

Các giả định của mô hình hồi quy đa biến
Để kiểm tra và xử lý các vấn đề này, các nhà phân tích thường sử dụng các kỹ thuật chẩn đoán mô hình như:
- Đồ thị phần dư (Residual plots)
- Kiểm định Breusch-Pagan
- Durbin-Watson test
- Phân tích VIF (Variance Inflation Factor)
Những công cụ này giúp phát hiện đa cộng tuyến, phương sai không đồng nhất và các vấn đề tiềm ẩn khác, đảm bảo mô hình hồi quy hoạt động chính xác và đáng tin cậy.
Có thể bạn quan tâm: Thang đo trong spss là gì
5. Cách phân tích hồi quy đa biến trong SPSS từ A–Z
Việc thực hiện hồi quy đa biến trong SPSS gồm 3 bước cơ bản:
Bước 1: Vào Analyze > Regression > Linear…
Bước 2:
- Chọn biến phụ thuộc (Dependent).
- Chọn các biến độc lập (Independents) và chuyển vào ô bằng cách nhấn mũi tên.
Bước 3:
- Chọn Statistics > Collinearity diagnostics để tính hệ số VIF (Variance Inflation Factor – Hệ số phóng đại phương sai), dùng để đánh giá hiện tượng đa cộng tuyến.
- Nhấn OK để chạy mô hình và nhận bảng kết quả.

Cách phân tích hồi quy đa biến trong SPSS từ A–Z
Sau khi thực hiện xong, SPSS sẽ hiển thị bảng kết quả gồm ba bảng chính. Bạn cần đối chiếu các bảng này, phân tích các trị số quan trọng và đưa ra nhận xét cũng như kết luận phù hợp dựa trên dữ liệu.
Dưới đây là các bước và lưu ý quan trọng để đọc và hiểu bảng kết quả từ phân tích hồi quy đa biến trong SPSS:
5.1. Đọc và hiểu bảng Model Summary
Trong thực tế, các điểm dữ liệu luôn có xu hướng phân tán và thường tạo thành một hình dạng gần giống đường thẳng, nhưng không có đường thẳng nào đi qua tất cả các điểm hoàn hảo. Vì vậy, cần đo lường mức độ sai lệch giữa các điểm dữ liệu và mức độ phù hợp của mô hình hồi quy tuyến tính với dữ liệu.
Một trong những thước đo phổ biến nhất là hệ số xác định R² (R Square). R² dao động từ 0 đến 1.
- Khi R² càng gần 1, các biến độc lập càng giải thích nhiều biến thiên của biến phụ thuộc.
- Khi R² càng gần 0, các biến độc lập giải thích rất ít biến thiên của biến phụ thuộc.
Trong ví dụ ở trên, bảng Model Summary cung cấp cả R² và R² hiệu chỉnh (Adjusted R²) để đánh giá mức độ phù hợp của mô hình.
Ví dụ, Adjusted R² = 0.695 có nghĩa là các biến độc lập trong mô hình giải thích 69,5% sự biến thiên của biến phụ thuộc, còn 31,5% còn lại là do các yếu tố ngoài mô hình hoặc sai số ngẫu nhiên.
Có thể bạn quan tâm: Hồi quy logistic là gì
5.2. Đọc và hiểu bảng ANOVA
Bảng ANOVA trong kết quả phân tích hồi quy giúp chúng ta đánh giá độ phù hợp của mô hình thông qua kiểm định giả thuyết.
Dưới đây là các bước kiểm định độ phù hợp của mô hình hồi quy:
Đặt giả thuyết:
- H₀: R² = 0 (các biến độc lập không giải thích được biến phụ thuộc).
- H₁: R² ≠ 0 (các biến độc lập giải thích được biến phụ thuộc).
Sử dụng phép kiểm định F để đánh giá giả thuyết.
Cách kết luận dựa vào giá trị Sig. (p-value):
- Sig < 0,05: Bác bỏ H₀ → R² ≠ 0 có ý nghĩa thống kê → mô hình hồi quy phù hợp.
- Sig ≥ 0,05: Không bác bỏ H₀ → R² = 0 → mô hình hồi quy không phù hợp.
Trong SPSS, các số liệu kiểm định F được hiển thị trong bảng ANOVA.

Đọc và hiểu bảng ANOVA
Ví dụ minh họa: Trong bảng ANOVA của ví dụ trên, giá trị Sig. = 0,000 < 0,05, do đó mô hình hồi quy là phù hợp và có ý nghĩa thống kê.
5.3. Đọc và hiểu bảng Coefficients
Để xác định xem mỗi biến độc lập có đóng góp ý nghĩa trong mô hình hay không, chúng ta sử dụng kiểm định t (Student’s t-test) với giả thuyết:
- H₀: Hệ số hồi quy của biến độc lập Xᵢ = 0 (biến Xᵢ không ảnh hưởng đến biến phụ thuộc).
- H₁: Hệ số hồi quy của biến độc lập Xᵢ ≠ 0 (biến Xᵢ ảnh hưởng đến biến phụ thuộc).
Nếu mô hình có n biến độc lập, chúng ta sẽ kiểm tra n giả thuyết H₀ tương ứng.
Cách kết luận dựa trên giá trị Sig.:
- Sig < 0,05: Bác bỏ H₀ → hệ số hồi quy của Xᵢ khác 0 và có ý nghĩa thống kê → Xᵢ tác động đáng kể lên biến phụ thuộc.
- Sig ≥ 0,05: Không bác bỏ H₀ → hệ số hồi quy của Xᵢ bằng 0 → Xᵢ không tác động đáng kể lên biến phụ thuộc.
Đánh giá mức độ tác động:
- Dựa vào trị tuyệt đối của hệ số Beta.
- Beta tuyệt đối càng lớn, mức ảnh hưởng của biến độc lập lên biến phụ thuộc càng mạnh.
6. Đa cộng tuyến trong hồi quy đa biến và cách xử lý
Đa cộng tuyến xảy ra khi các biến độc lập trong mô hình có mối tương quan cao với nhau, dẫn đến:
- Giảm độ ổn định của các hệ số ước lượng.
- Sai số chuẩn (standard error) tăng, làm các hệ số mất ý nghĩa thống kê.
- Mô hình trở nên nhạy cảm và dễ bị sai lệch khi dữ liệu thay đổi.
Phát hiện đa cộng tuyến:
- Sử dụng chỉ số VIF (Variance Inflation Factor), tính theo công thức:

Đa cộng tuyến trong hồi quy đa biến và cách xử lý
- VIF > 5 (hoặc 10) là dấu hiệu cảnh báo đa cộng tuyến.
Cách khắc phục đa cộng tuyến:
- Loại bỏ hoặc gộp các biến có tương quan cao.
- Sử dụng hồi quy có điều chuẩn như Ridge, Lasso hoặc Elastic Net.
- Áp dụng phân tích thành phần chính (PCA) để chuyển đổi dữ liệu đầu vào thành các thành phần không tương quan.
Những biện pháp này giúp mô hình hồi quy trở nên ổn định, đáng tin cậy và chính xác hơn.
7. Đánh giá chất lượng mô hình hồi quy đa biến
Sau khi xây dựng mô hình hồi quy, việc đánh giá độ phù hợp và khả năng dự báo là bước quan trọng. Một số chỉ số và công cụ phổ biến bao gồm:
- R-squared (R²): Tỷ lệ phương sai của biến phụ thuộc Y được mô hình giải thích. Giá trị gần 1 cho thấy mô hình phù hợp tốt với dữ liệu.
- Adjusted R-squared: Phiên bản hiệu chỉnh của R², giúp tránh tăng giả tạo khi thêm các biến độc lập không cần thiết.
- Kiểm định F: Xác định xem toàn bộ mô hình có ý nghĩa thống kê hay không.
- Kiểm định t: Đánh giá xem từng hệ số βᵢ có khác 0 một cách đáng kể hay không.
- MAE, RMSE: Các chỉ số phổ biến trong học máy và phân tích dự báo, đo mức độ sai số dự đoán.
- Đồ thị phần dư, biểu đồ Q-Q, scatter plot giữa biến đầu ra và đầu vào: Giúp kiểm tra trực quan chất lượng mô hình và phát hiện các vấn đề tiềm ẩn.
Việc kết hợp các chỉ số thống kê và quan sát trực quan giúp nhà phân tích đưa ra nhận xét chính xác, đảm bảo mô hình vừa phù hợp vừa đáng tin cậy.

Đánh giá chất lượng mô hình hồi quy đa biến
8. Lời kết
Nếu bạn đang gặp khó khăn trong việc phân tích dữ liệu hay muốn hoàn thiện nghiên cứu khoa học, VietGuru cung cấp dịch vụ viết thuê nghiên cứu khoa học chuyên nghiệp, giúp bạn xây dựng các báo cáo, luận văn và bài nghiên cứu chuẩn xác, logic và tiết kiệm thời gian.
Hy vọng sau bài viết này, bạn đã nắm rõ mô hình hồi quy đa biến – từ khái niệm, ý nghĩa đến cách phân tích trong SPSS. Việc hiểu rõ và áp dụng đúng phương pháp sẽ giúp bạn đánh giá mối quan hệ giữa các yếu tố, dự báo kết quả và ra quyết định chính xác trong nghiên cứu hoặc phân tích dữ liệu thực tế.

















