Chạy hồi quy SPSS là gì? Cách thực hiện và đọc kết quả phân tích hồi quy tuyến tính

icon  29 Tháng mười, 2025 Mai Phương Uyên Đánh giá:  
0
(0)
Chạy hồi quy SPSS là gì? Cách thực hiện và đọc kết quả phân tích hồi quy tuyến tính
0
(0)

Mô hình hồi quy tuyến tính là phương pháp phổ biến giúp nghiên cứu và phân tích mối quan hệ giữa một biến phụ thuộc và các biến độc lập. Nhờ có phần mềm SPSS, việc xây dựng và chạy mô hình này trở nên nhanh chóng và đơn giản hơn bao giờ hết. Trong bài viết này, hãy cùng Vietguru khám phá cách chạy hồi quy SPSS một cách chi tiết và dễ hiểu nhé!

1. Tổng quan về hồi quy tuyến tính trong SPSS

Hồi quy tuyến tính trong SPSS là một phương pháp phân tích dữ liệu được sử dụng để dự đoán giá trị của biến phụ thuộc (outcome) dựa trên một hoặc nhiều biến độc lập (predictors). Thông qua mô hình này, người nghiên cứu có thể xác định mức độ và chiều hướng ảnh hưởng của các biến độc lập lên biến phụ thuộc, từ đó đưa ra nhận định hoặc dự đoán chính xác hơn.

Mô hình hồi quy tuyến tính được thể hiện dưới dạng công thức:

Y = β₀ + β₁X₁ + β₂X₂ + … + βₚXₚ + ε

Trong đó:

  • Y: Biến phụ thuộc (outcome)
  • X₁, X₂, …, Xₚ: Các biến độc lập (predictors)
  • β₀, β₁, β₂, …, βₚ: Hệ số hồi quy thể hiện mức độ tác động của từng biến độc lập
  • ε: Sai số ngẫu nhiên (residuals)

Mục tiêu của mô hình hồi quy tuyến tính là tìm ra các hệ số ước lượng (β) sao cho sai số ngẫu nhiên ε nhỏ nhất. Để đạt được điều này, SPSS sử dụng phương pháp bình phương tối thiểu (Least Squares Method) – giúp mô hình đạt được độ chính xác và độ tin cậy cao trong phân tích dữ liệu.

Tổng quan về hồi quy tuyến tính trong SPSS

Tổng quan về hồi quy tuyến tính trong SPSS

Có thể bạn quan tâm: Thuê viết đề tài nghiên cứu khoa học

2. Phương trình hồi quy tuyến tính

Sau khi hiểu khái niệm cơ bản về hồi quy tuyến tính, bước tiếp theo trong quá trình chạy hồi quy SPSS là nắm rõ cấu trúc của phương trình hồi quy tuyến tính. Đây chính là nền tảng giúp bạn xác định mối quan hệ giữa các biến, diễn giải kết quả phân tích và đưa ra dự đoán chính xác trong nghiên cứu.

Có 2 dạng phương trình hồi quy tuyến tính:

2.1. Phương trình hồi quy tuyến tính đơn

Y = β₀ + β₁X + ε

Trong đó:

  • Y: Biến phụ thuộc.
  • X: Biến độc lập.
  • β₀: Hằng số hồi quy.
  • β: Hệ số hồi quy.
  • ε: Sai số.

Trường hợp sử dụng:

Mô hình hồi quy tuyến tính đơn thường được áp dụng khi bạn muốn phân tích mối quan hệ giữa hai biến một biến độc lập và một biến phụ thuộc. Phương pháp này phù hợp cho những tình huống có mối quan hệ tuyến tính rõ ràng, chẳng hạn như:

  • Mối liên hệ giữa lượng mưa và sản lượng cây ăn quả.
  • Mối quan hệ giữa độ tuổi và chiều cao của trẻ em.
  • Ảnh hưởng của nhiệt độ đến mức tăng của mực nước biển.

2.2. Phương trình hồi quy tuyến tính bội

Y = β₀ + β₁X₁ + β₂X₂ + … + βₙXₙ + ε

Trong đó:

  • Y: Biến phụ thuộc.
  • X₁, X₂, …, Xₙ: Biến độc lập.
  • β₀: Hằng số hồi quy.
  • β₁, β₂, …, βₙ: Hệ số hồi quy.
  • ε: Sai số.

Trường hợp sử dụng:

Mô hình hồi quy tuyến tính bội được áp dụng khi bạn muốn phân tích mối quan hệ giữa một biến phụ thuộc và nhiều biến độc lập. Phương pháp này giúp đánh giá mức độ ảnh hưởng của từng yếu tố trong những mối quan hệ phức tạp hơn, chẳng hạn như:

  • Mối quan hệ giữa lượng mưa, nhiệt độ và tần suất sử dụng phân bón đối với năng suất cây ăn quả.
  • Ảnh hưởng của chế độ ăn uống và cường độ tập luyện đến sức khỏe bệnh nhân tim mạch.
  • Tác động của lạm phát và chính sách điều chỉnh tiền lương đến mức thu nhập của nhân viên lâu năm.
Phương trình hồi quy tuyến tính bội

Phương trình hồi quy tuyến tính bội

Có thể bạn quan tâm: Research paper

3. Giả định cơ bản trong hồi quy đa biến

Trước khi chạy hồi quy SPSS, bạn cần hiểu rõ các giả định cơ bản trong hồi quy đa biến. Đây là những điều kiện quan trọng giúp đảm bảo kết quả phân tích chính xác và đáng tin cậy. Nếu các giả định này bị vi phạm, mô hình hồi quy có thể cho ra kết quả sai lệch, ảnh hưởng đến khả năng dự đoán và diễn giải dữ liệu.

3.1. Mối quan hệ tuyến tính giữa các biến

Giữa các biến độc lập và biến phụ thuộc cần tồn tại mối quan hệ tuyến tính. Để kiểm tra điều này, bạn có thể vẽ biểu đồ phân tán (scatter plot) giữa các giá trị X và Y nhằm quan sát xem chúng có xu hướng nằm trên một đường thẳng hay không. 

Trong trường hợp mối quan hệ không hoàn toàn tuyến tính, người phân tích có thể biến đổi dữ liệu bằng các hàm phi tuyến (như logarit, căn bậc hai, v.v.) để thiết lập mối quan hệ tuyến tính về mặt toán học giữa hai biến.

3.2. Phần dư độc lập (Independence of Residuals)

Trong phân tích hồi quy, phần dư (residuals) được sử dụng để đánh giá độ chính xác của mô hình dự đoán. Phần dư chính là khoảng chênh lệch giữa giá trị quan sát thực tế và giá trị dự đoán từ mô hình. 

Một mô hình hồi quy tốt là khi các phần dư được phân bố ngẫu nhiên, không hình thành bất kỳ mẫu hình hay xu hướng rõ ràng nào — điều này cho thấy mô hình phù hợp và không bị sai lệch.

3.3. Phần dư tuân theo phân phối chuẩn (Normality)

Để kiểm tra xem phần dư có tuân theo phân phối chuẩn hay không, người phân tích thường sử dụng biểu đồ Q-Q (Quantile-Quantile Plot). Nếu các điểm dữ liệu nằm dọc theo đường chéo trung tâm của biểu đồ, điều đó cho thấy phần dư phân phối gần chuẩn. Ngược lại, nếu có sự lệch đáng kể, bạn có thể loại bỏ các giá trị ngoại lai hoặc biến đổi dữ liệu bằng các hàm phi tuyến tính để cải thiện tính chuẩn của phần dư.

Phần dư tuân theo phân phối chuẩn (Normality)

Phần dư tuân theo phân phối chuẩn (Normality)

Có thể bạn quan tâm: 5 áp lực cạnh tranh

3.4. Phương sai không đổi (Homoscedasticity)

Giả định phương sai không đổi (Homoscedasticity) cho rằng phần dư phải có phương sai ổn định — tức là mức độ dao động của phần dư quanh giá trị trung bình phải tương đương nhau ở mọi giá trị của X. 

Nếu giả định này bị vi phạm, mô hình hồi quy có thể cho ra kết quả không chính xác hoặc sai lệch. Trong trường hợp đó, bạn nên xem xét biến đổi biến phụ thuộc (chẳng hạn như dùng logarit hoặc căn bậc hai) để khắc phục vấn đề.

4. Hướng dẫn cách chạy hồi quy SPSS

Để chạy hồi quy SPSS, bạn có thể thực hiện theo các bước đơn giản sau đây:

Bước 1: Chuẩn bị dữ liệu

Trước khi tiến hành chạy hồi quy SPSS, bạn cần đảm bảo bộ dữ liệu đã được nhập đúng định dạng và không chứa giá trị rỗng (missing values). Đồng thời, hãy xác định rõ biến phụ thuộc và các biến độc lập dựa trên hiểu biết về dữ liệu và mối quan hệ giữa chúng.

Bước 2: Mở dữ liệu trong SPSS

Khởi động phần mềm SPSS, sau đó mở file dữ liệu (worksheet) mà bạn đã chuẩn bị để bắt đầu quá trình phân tích.

Bước 3: Chọn công cụ chạy hồi quy tuyến tính

Trên thanh menu, chọn Analyze Regression Linear….

Đây là bước truy cập vào công cụ hồi quy tuyến tính trong SPSS để thiết lập mô hình.

Bước 4: Thiết lập biến phụ thuộc và biến độc lập

Trong cửa sổ Linear Regression, bạn cần:

  • Chọn biến phụ thuộc (Dependent).
  • Chọn biến độc lập (Independent) – có thể chọn nhiều biến bằng cách giữ Ctrl khi bấm chọn.

Ví dụ: Tri Thức Cộng Đồng minh họa bằng mô hình hồi quy tuyến tính đơn với:

  • Biến phụ thuộc: Điểm số (Score)
  • Biến độc lập: Thời gian học (Study Time)

Bước 5: Cài đặt các tùy chọn (Options)

Tại cửa sổ Linear Regression, bạn có thể tùy chỉnh một số lựa chọn:

  • Method: Chọn Enter để đưa tất cả biến vào mô hình, hoặc Backward / Forward để loại bỏ các biến không cần thiết.
  • Statistics: Chọn các chỉ số thống kê muốn hiển thị trong kết quả.
  • Plots: Chọn loại biểu đồ bạn muốn SPSS xuất ra để kiểm tra giả định của mô hình.
Cài đặt các tùy chọn (Options)

Cài đặt các tùy chọn (Options)

Bước 6: Chạy mô hình và xem kết quả

Sau khi hoàn tất thiết lập, nhấn OK để SPSS thực hiện phân tích.

Kết quả hồi quy sẽ xuất hiện trong cửa sổ Output, bao gồm các hệ số hồi quy, giá trị R², kiểm định ý nghĩa thống kê và các biểu đồ minh họa.

Có thể bạn quan tâm: Tương quan là gì

5. Cách đọc kết quả chạy hồi quy SPSS

Kết quả chạy hồi quy SPSS bao gồm những thông tin sau:

5.1. Bảng ANOVA

Phần ANOVA cung cấp cái nhìn tổng quan về mức độ phù hợp của mô hình hồi quy, giúp bạn đánh giá xem mô hình có ý nghĩa thống kê hay không. Các chỉ số quan trọng trong bảng này bao gồm:

  • F (F-statistic): Dùng để kiểm định xem mô hình hồi quy tổng thể có phù hợp với dữ liệu hay không. Giá trị F càng lớn, khả năng mô hình phù hợp càng cao.
  • Sig. (p-value): Là giá trị xác suất đi kèm với F. Nếu Sig. < 0.05, mô hình được xem là có ý nghĩa thống kê, tức các biến độc lập có ảnh hưởng đáng kể đến biến phụ thuộc.
  • R Square (R²): Cho biết tỷ lệ phần trăm biến thiên của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình.
  • Adjusted R Square (R² hiệu chỉnh): Là giá trị R² đã được điều chỉnh theo số lượng biến độc lập, giúp mô hình phản ánh độ chính xác thực tế hơn, tránh trường hợp “ảo tưởng” do thêm quá nhiều biến.

5.2. Bảng Coefficients

Bảng Coefficients hiển thị các hệ số ước lượng (β) cho từng biến độc lập trong mô hình hồi quy, giúp bạn xác định mức độ và hướng tác động của từng biến lên biến phụ thuộc. Các thông tin quan trọng cần chú ý bao gồm:

  • Unstandardized Coefficients: Giá trị ước lượng của hệ số β cho mỗi biến độc lập. Đây là hệ số hồi quy thô, cho biết khi biến độc lập tăng 1 đơn vị thì biến phụ thuộc sẽ thay đổi trung bình bao nhiêu đơn vị (khi các biến khác giữ nguyên).
  • Standard Error: Biểu thị độ lệch chuẩn của hệ số ước lượng, giúp đánh giá độ chính xác của β.
  • t (t-statistic): Dùng để kiểm định xem biến độc lập có ảnh hưởng đáng kể đến biến phụ thuộc hay không.
  • Sig. (p-value): Giá trị xác suất đi kèm với t-statistic. Nếu Sig. < 0.05, có thể kết luận rằng biến độc lập có ý nghĩa thống kê trong mô hình.
  • 95% Confidence Interval: Thể hiện khoảng tin cậy 95% cho hệ số β, cho biết phạm vi mà giá trị thật của hệ số có khả năng nằm trong đó.
Bảng Coefficients

Bảng Coefficients

5.3. Bảng Residuals

Phần Residuals cung cấp thông tin về sai số ngẫu nhiên (ε) của mô hình hồi quy – tức là mức độ chênh lệch giữa giá trị thực tế và giá trị dự đoán. Đây là cơ sở quan trọng để đánh giá độ chính xác và độ phù hợp của mô hình.

Các chỉ số chính trong bảng bao gồm:

  • Predicted Value: Giá trị dự đoán của biến phụ thuộc (Y) do mô hình hồi quy tạo ra.
  • Std. Error of Predicted Y: Độ lệch chuẩn của giá trị dự đoán, cho biết mức độ tin cậy của kết quả dự đoán.
  • Residual: Sai số thực tế, được tính bằng hiệu giữa giá trị quan sát và giá trị dự đoán.
  • Std. Residual: Sai số chuẩn hóa, giúp so sánh sai số giữa các quan sát khác nhau trên cùng một thang đo.
  • Stud. Residual (Studentized Residual): Là phiên bản điều chỉnh của sai số chuẩn hóa, được sử dụng để phát hiện các giá trị ngoại lai (outliers) trong mô hình.

Có thể bạn quan tâm: Cơ sở lý luận là gì

6. Ý nghĩa của các chỉ số trong hồi quy SPSS

Sau khi chạy hồi quy SPSS, phần kết quả sẽ hiển thị hàng loạt bảng và chỉ số thống kê. Mỗi chỉ số đều mang một ý nghĩa riêng, giúp bạn đánh giá mức độ phù hợp, độ chính xác và ý nghĩa thống kê của mô hình hồi quy. 

6.1. F-statistic và p-value trong bảng ANOVA

F-statistic là chỉ số kiểm định dùng để đánh giá mức độ phù hợp chung của mô hình hồi quy, trong khi p-value thể hiện xác suất xảy ra sai lầm khi kết luận mô hình có ý nghĩa thống kê.

Giá trị F-statistic được tính dựa trên tỷ lệ giữa phần biến thiên do mô hình hồi quy giải thích và phần biến thiên ngẫu nhiên (sai số). Nếu F-statistic lớn và p-value nhỏ (thường < 0.05), điều đó cho thấy mô hình hồi quy có ý nghĩa thống kê, tức là các biến độc lập giải thích được đáng kể sự thay đổi của biến phụ thuộc.

Tuy nhiên, chỉ số F-statistic chỉ phản ánh ý nghĩa tổng thể của mô hình, chứ không cho biết mức độ ảnh hưởng cụ thể của từng biến độc lập. Vì vậy, để hiểu rõ hơn mối quan hệ giữa các biến, bạn cần xem xét thêm bảng Coefficients – nơi thể hiện hệ số ước lượng (β) của từng biến trong mô hình.

6.2. R Square và Adjusted R Square

R Square (R²) thể hiện tỷ lệ phần trăm biến thiên của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình hồi quy. Nói cách khác, R² càng cao, mô hình của bạn càng giải thích tốt mối quan hệ giữa các biến.

Tuy nhiên, cần lưu ý rằng R Square có thể tăng lên đơn giản khi bạn thêm nhiều biến độc lập, kể cả khi những biến đó không thực sự có ý nghĩa thống kê. Vì lý do này, Adjusted R Square (R² hiệu chỉnh) được sử dụng để điều chỉnh và phản ánh chính xác hơn mức độ phù hợp của mô hình.

Adjusted R Square loại bỏ ảnh hưởng của các biến độc lập không cần thiết, giúp giảm sai lệch và đánh giá khách quan hơn chất lượng mô hình hồi quy.

6.3. Hệ số ước lượng (Coefficients – Beta)

Hệ số ước lượng (Unstandardized Coefficients) cho biết mức độ tác động của từng biến độc lập lên biến phụ thuộc trong mô hình hồi quy. Hiểu đơn giản, giá trị này thể hiện biến phụ thuộc sẽ thay đổi bao nhiêu đơn vị khi biến độc lập tăng thêm 1 đơn vị, giữ các yếu tố khác không đổi.

Nếu hệ số ước lượng mang dấu dương, điều đó có nghĩa là khi biến độc lập tăng, biến phụ thuộc cũng tăng theo chiều cùng hướng. Ngược lại, nếu hệ số mang dấu âm, khi biến độc lập tăng, biến phụ thuộc sẽ giảm — thể hiện mối quan hệ nghịch biến giữa hai biến.

6.4. p-value của từng hệ số ước lượng

Giá trị p-value của hệ số ước lượng được dùng để kiểm định mức độ ý nghĩa thống kê của từng biến độc lập trong mô hình hồi quy. Nói cách khác, p-value cho biết liệu biến độc lập có thật sự ảnh hưởng đến biến phụ thuộc hay không.

Nếu p-value nhỏ hơn hoặc bằng mức ý nghĩa α (thường là 0,05), ta có thể kết luận rằng biến độc lập có tác động đáng kể đến biến phụ thuộc. Ngược lại, nếu p-value lớn hơn 0,05, điều đó cho thấy mối quan hệ giữa hai biến không có ý nghĩa thống kê, và biến độc lập có thể không đóng vai trò quan trọng trong mô hình.

p-value của từng hệ số ước lượng

p-value của từng hệ số ước lượng

6.5. Khoảng tin cậy (Confidence Interval)

Khoảng tin cậy (Confidence Interval) của hệ số ước lượng cho biết khoảng giá trị mà hệ số thật sự có thể nằm trong đó với một mức độ tin cậy nhất định. Thông thường, người ta sử dụng khoảng tin cậy 95% để ước lượng.

Nếu khoảng tin cậy không chứa giá trị 0, điều đó có nghĩa là biến độc lập có ảnh hưởng đáng kể đến biến phụ thuộc và hệ số ước lượng có ý nghĩa thống kê. Ngược lại, nếu khoảng này bao gồm 0, ta không thể khẳng định chắc chắn rằng biến độc lập có tác động rõ rệt.

6.6. Residuals – Kiểm tra phần dư và độ phù hợp mô hình

Phần Residuals cung cấp thông tin về các sai số ngẫu nhiên còn lại sau khi mô hình hồi quy đã được xây dựng. Nếu các phần dư phân bố đều và không có mối liên hệ với các biến độc lập, điều đó cho thấy mô hình hồi quy phù hợp và có độ chính xác cao. Ngược lại, nếu phần dư có xu hướng hoặc mô hình rõ rệt, bạn nên xem xét điều chỉnh lại mô hình hoặc biến dữ liệu.

7. Lời kết

Nếu bạn đang gặp khó khăn trong việc chạy mô hình hồi quy SPSS, xử lý dữ liệu hay viết báo cáo kết quả phân tích, VietGuru chính là địa chỉ đáng tin cậy dành cho bạn. Với đội ngũ chuyên gia giàu kinh nghiệm, VietGuru cam kết hỗ trợ bạn từ xử lý dữ liệu, chạy mô hình hồi quy, đến viết và diễn giải kết quả một cách chính xác, logic và chuẩn học thuật.

Hy vọng qua bài viết này, bạn đã biết cách chạy hồi quy SPSS và đọc kết quả phân tích hồi quy tuyến tính. Việc nắm vững các bước và ý nghĩa của từng chỉ số không chỉ giúp bạn phân tích dữ liệu hiệu quả hơn mà còn nâng cao chất lượng nghiên cứu của mình. 

Bài đăng này hữu ích như thế nào?

Bấm vào một ngôi sao để đánh giá nó!

Đánh giá trung bình 0 / 5. Số phiếu bầu: 0

Hãy là người đầu tiên đánh giá bài viết này.

Chia sẻ

Bài viết liên quan

Mai Phương Uyên

Xin chào bạn, tôi là Mai Phương Uyên – Trưởng Bộ phận Nội dung tại Vietguru. Với hơn 15 năm kinh nghiệm trong lĩnh vực nghiên cứu và biên soạn học thuật, tôi cùng đội ngũ chuyên gia Vietguru cam kết mang đến những bài viết chuẩn mực, chất lượng cao và đáp ứng chính xác mọi yêu cầu của bạn. Chúng tôi luôn sẵn sàng đồng hành cùng bạn từ bước lên ý tưởng, định hướng nội dung đến hoàn thiện và chỉnh sửa, giúp mỗi sản phẩm không chỉ đạt chuẩn mà còn thực sự nổi bật, thuyết phục.👉 Hãy liên hệ ngay với Vietguru để được tư vấn miễn phí và nhận hỗ trợ tận tâm trong suốt quá trình thực hiện bài viết. 📞 Hotline/Zalo: 0946.19.1900
_Tác giả bài viết_
Bạn cần một đơn vị uy tín để đồng hành trên con đường học thuật

Chúng tôi sẽ đồng hành cùng các bạn trên con đường kết nối với tri thức

Bạn cần một đơn vị uy tín để đồng hành trên con đường học thuật