OLS là gì? Tìm hiểu mô hình và phương pháp hồi quy tuyến tính OLS

icon  7 Tháng ba, 2026 Mai Phương Uyên Đánh giá:  
5
(1)
OLS là gì? Tìm hiểu mô hình và phương pháp hồi quy tuyến tính OLS
5
(1)

OLS xuất hiện rất thường xuyên trong các nghiên cứu định lượng, đặc biệt khi phân tích mối quan hệ giữa các biến số. Tuy vậy, không phải ai cũng thật sự hiểu phương pháp này là gì và vì sao chúng lại được dùng rộng rãi trong mô hình hồi quy tuyến tính. Bài viết này của VietGuru sẽ giúp bạn nắm rõ khái niệm OLS là gì, cách mô hình hoạt động và ý nghĩa của nó trong phân tích dữ liệu.

1. OLS là gì?

Vậy OLS là gì? OLS (Ordinary Least Squares) là một phương pháp ước lượng được sử dụng phổ biến trong hồi quy tuyến tính để tìm ra mối quan hệ giữa các biến số. Nói đơn giản, OLS giúp tìm ra đường thẳng (hoặc hàm tuyến tính) “phù hợp nhất” để mô tả mối quan hệ giữa các biến trong dữ liệu.

Ý tưởng của phương pháp này khá trực quan: khi ta vẽ một đường hồi quy qua các điểm dữ liệu, sẽ luôn tồn tại khoảng cách giữa giá trị thực tế và giá trị mà mô hình dự đoán. Những khoảng cách đó được gọi là sai số (residuals). OLS hoạt động bằng cách lựa chọn các hệ số sao cho tổng bình phương của các sai số này là nhỏ nhất. Nhờ vậy, đường hồi quy thu được sẽ phản ánh xu hướng của dữ liệu một cách hợp lý nhất.

Trong nghiên cứu  thực tế, OLS được sử dụng rộng rãi trong kinh tế học, tài chính, khoa học xã hội và nhiều lĩnh vực phân tích dữ liệu khác. Phương pháp này vừa có nền tảng toán học rõ ràng, vừa dễ triển khai trên các phần mềm thống kê như R, Stata hay SPSS. Hầu hết các mô hình hồi quy tuyến tính mà bạn thấy trong các bài nghiên cứu hay báo cáo thống kê đều được ước lượng dựa trên phương pháp này.

OLS là gì?

OLS là gì?

Xem thêm: Cách đặt câu hỏi nghiên cứu khoa học

2. Mô hình hồi quy tuyến tính OLS

Sau khi đã hiểu OLS là gì, tiếp theo hãy cùng khám phá mô hình hồi quy tuyến tính OLS nhé. Trong phân tích dữ liệu, khi muốn tìm hiểu một biến bị ảnh hưởng bởi những yếu tố nào, người ta thường xây dựng mô hình hồi quy tuyến tính. Với phương pháp OLS, mô hình này được biểu diễn dưới dạng một phương trình toán học, trong đó biến phụ thuộc Y được giải thích bởi một hoặc nhiều biến độc lập X.

Ở dạng đơn giản nhất, mô hình có thể viết như sau: Y = β₀ + β₁X + ε

Trong đó: 

  • Y là biến phụ thuộc (kết quả cần giải thích)
  • X là biến độc lập
  • β₀ là hệ số chặn
  • β₁ thể hiện mức độ tác động của X lên Y
  • ε là sai số.

Nếu nghiên cứu có nhiều yếu tố ảnh hưởng, mô hình sẽ mở rộng thành hồi quy bội, khi đó phương trình sẽ có thêm nhiều biến độc lập như X1, X2, X3…. Về bản chất, mô hình vẫn giữ cùng một ý tưởng: tìm cách mô tả mối quan hệ tuyến tính giữa các biến trong dữ liệu.

Điểm đặc trưng của OLS nằm ở cách ước lượng các hệ số. Trong tập dữ liệu thực tế, các điểm quan sát thường phân tán chứ không nằm gọn trên một đường thẳng. Vì vậy, OLS sẽ chọn ra đường hồi quy phù hợp nhất bằng cách làm cho tổng bình phương khoảng cách giữa các điểm dữ liệu và đường hồi quy là nhỏ nhất. Nói dễ hiểu, đây chính là đường thẳng mô tả xu hướng chung của dữ liệu một cách “hợp lý” nhất.

Mô hình hồi quy tuyến tính OLS

Mô hình hồi quy tuyến tính OLS

Chính nhờ cách tiếp cận khá trực quan này mà mô hình hồi quy tuyến tính OLS trở thành nền tảng của rất nhiều nghiên cứu trong kinh tế lượng, khoa học xã hội và phân tích dữ liệu hiện nay.

Xem thêm: Conceptual framework

3. Các giả định mô hình hồi quy tuyến tính OLS

Sau khi đã hiểu OLS là gì và mô hình hồi quy tuyến tính OLS, tiếp theo hãy cùng VietGuru khám phá các giả định của mô hình này nhé. 

Mặc dù OLS là phương pháp khá phổ biến và dễ áp dụng, nhưng để kết quả hồi quy thực sự đáng tin cậy thì mô hình cần thỏa mãn một số giả định cơ bản. Nếu các giả định này bị vi phạm nghiêm trọng, hệ số hồi quy vẫn có thể tính được, nhưng việc diễn giải kết quả hoặc kiểm định thống kê có thể trở nên thiếu chính xác

3.1. Giả định về mối quan hệ tuyến tính

Trước hết, mô hình OLS giả định rằng mối quan hệ giữa biến phụ thuộc và các biến độc lập là tuyến tính. Điều này không có nghĩa là mọi dữ liệu đều nằm trên một đường thẳng hoàn hảo, mà là xu hướng chung giữa các biến có thể được mô tả bằng một dạng tuyến tính.

Chẳng hạn, khi nghiên cứu tác động của số giờ học đến điểm số, mô hình hồi quy tuyến tính giả định rằng khi số giờ học tăng lên thì điểm số cũng thay đổi theo một xu hướng tương đối ổn định. Nếu mối quan hệ thực tế có dạng cong hoặc phi tuyến mạnh, mô hình tuyến tính đơn giản có thể không phản ánh đúng bản chất dữ liệu.

3.2. Giả định về sai số ngẫu nhiên

Trong mô hình hồi quy, luôn tồn tại một phần sai số (error term) – đại diện cho những yếu tố mà mô hình chưa thể giải thích. OLS giả định rằng các sai số này mang tính ngẫu nhiên, có giá trị trung bình bằng 0 và không có mối liên hệ hệ thống với các biến độc lập trong mô hình.

Nói dễ hiểu hơn, sai số chỉ đơn giản là những biến động tự nhiên của dữ liệu, chứ không phải do mô hình bị thiếu một yếu tố quan trọng nào đó. Nếu sai số có xu hướng lệch về một phía hoặc liên quan chặt chẽ với các biến giải thích, kết quả hồi quy có thể bị sai lệch.

Giả định về sai số ngẫu nhiên

Giả định về sai số ngẫu nhiên

3.3. Giả định không có đa cộng tuyến

Một giả định quan trọng khác là các biến độc lập không được tương quan quá mạnh với nhau. Hiện tượng các biến giải thích có mối quan hệ chặt chẽ với nhau được gọi là đa cộng tuyến.

Khi đa cộng tuyến xảy ra, mô hình vẫn có thể chạy được nhưng các hệ số hồi quy thường trở nên không ổn định: chỉ cần thay đổi dữ liệu một chút, kết quả ước lượng cũng có thể thay đổi khá nhiều. Điều này khiến việc đánh giá mức độ ảnh hưởng của từng biến trở nên khó khăn và đôi khi gây hiểu nhầm trong phân tích.

3.4. Giả định phương sai sai số không đổi

OLS cũng giả định rằng phương sai của sai số là không đổi ở mọi mức của biến độc lập. Nói cách khác, mức độ phân tán của sai số quanh đường hồi quy cần tương đối đồng đều.

Trong thực tế, nếu sai số có xu hướng nhỏ ở một số vùng dữ liệu nhưng lại rất lớn ở vùng khác, hiện tượng này được gọi là phương sai sai số thay đổi (heteroskedasticity). Khi đó, các ước lượng OLS vẫn tồn tại nhưng các kiểm định thống kê – chẳng hạn như kiểm định ý nghĩa của hệ số – có thể không còn chính xác như mong đợi.

Xem thêm: Lý thuyết nền trong nghiên cứu khoa học

4. Ước lượng OLS và cách đánh giá mô hình

Sau khi thiết lập phương trình hồi quy, bước tiếp theo là ước lượng các hệ số bằng phương pháp OLS. Mục tiêu của OLS là tìm ra bộ hệ số sao cho tổng bình phương sai số giữa giá trị dự đoán và giá trị thực tế là nhỏ nhất. Khi đã có kết quả hồi quy, nhà nghiên cứu thường dựa vào một số chỉ số thống kê để xem mô hình có đáng tin cậy hay không. Dưới đây là những cách đánh giá mô hình phổ biến:

Hệ số xác định R² (R-squared)

  • R² cho biết mô hình giải thích được bao nhiêu phần biến động của biến phụ thuộc.
  • Giá trị R² nằm trong khoảng từ 0 – 1.
  • R² càng cao thì khả năng giải thích của mô hình càng tốt.

Ví dụ: nếu R² = 0,65 thì có nghĩa là khoảng 65% sự thay đổi của biến Y được giải thích bởi các biến X trong mô hình.

Kiểm định F (đánh giá tổng thể mô hình)

  • Kiểm định F dùng để xem toàn bộ mô hình hồi quy có ý nghĩa thống kê hay không.
  • Nó kiểm tra giả thuyết rằng tất cả các hệ số hồi quy đều bằng 0 (tức là các biến độc lập không có tác động).
  • Nếu p-value của kiểm định F nhỏ (thường < 0,05), có thể kết luận mô hình có ý nghĩa thống kê.

Kiểm định t cho từng hệ số hồi quy

  • Kiểm định t được dùng để xem từng biến độc lập có thực sự ảnh hưởng đến biến phụ thuộc hay không.
  • Mỗi hệ số hồi quy sẽ có một giá trị t-statistic và p-value đi kèm.
  • Nếu p-value nhỏ (thường < 0,05), biến đó được xem là có ý nghĩa thống kê trong mô hình.

Phân tích phần dư (Residuals)

Phần dư là sai lệch giữa giá trị thực tế và giá trị dự đoán từ mô hình.

Việc xem xét phần dư giúp phát hiện các vấn đề như:

  • Phương sai sai số thay đổi
  • Sai dạng mô hình
  • Dữ liệu có điểm ngoại lệ.

Nếu phần dư phân bố ngẫu nhiên quanh đường hồi quy, đó thường là dấu hiệu cho thấy mô hình đang hoạt động khá ổn.

Ước lượng OLS và cách đánh giá mô hình

Ước lượng OLS và cách đánh giá mô hình

Xem thêm: Outlier là gì

5. Hướng dẫn chạy hồi quy tuyến tính OLS trong Stata

5.1. Chạy hồi quy OLS bằng menu trong Stata

  • Trước hết, vào StatisticsLinear models and relatedLinear regression để mở cửa sổ thiết lập mô hình.
  • Sau đó, đưa biến phụ thuộc vào ô Dependent Variable (ví dụ ở đây là CASH), rồi thêm các biến độc lập vào ô Independent Variables.
  • Tiếp theo, chuyển sang tab Reporting và tick vào mục Standardized beta coefficients nếu bạn muốn hiển thị hệ số hồi quy chuẩn hóa trong kết quả.
  • Thiết lập xong, chỉ cần nhấn OK, phần mềm sẽ chạy mô hình và trả về bảng kết quả để bạn theo dõi.

5.2. Chạy hồi quy OLS bằng lệnh trong Stata

  • Trong Stata, để chạy hồi quy OLS bạn chỉ cần dùng lệnh regress (thường được viết tắt là reg).
  • Tiếp tục với bộ dữ liệu mosl.dta, khi nhập lệnh này, phần mềm sẽ trả về bảng kết quả hồi quy tương tự như ở cách làm trước. 

Điểm khác biệt là cách dùng lệnh thường nhanh và gọn hơn.

Chạy hồi quy OLS bằng lệnh trong Stata

Chạy hồi quy OLS bằng lệnh trong Stata

6. Cách đọc và giải thích kết quả hồi quy OLS

6.1. Các chỉ số quan trọng trong bảng kết quả hồi quy

  • Prob > F = 0.0000: Đây là mức ý nghĩa của kiểm định F với giả thuyết H0 rằng tất cả các biến độc lập trong mô hình đều bằng 0 (tức là không có biến nào thực sự ảnh hưởng đến biến phụ thuộc). Với giá trị p rất nhỏ như vậy, ta có thể bác bỏ H0, nghĩa là mô hình hồi quy nhìn chung có ý nghĩa thống kê.
  • R-squared = 0.1100: Đây là hệ số xác định R² – một chỉ số quen thuộc trong kinh tế lượng. Nó cho biết mô hình giải thích được bao nhiêu phần biến động của biến phụ thuộc.
  • Adj R-squared = 0.1018: Đây là R bình phương hiệu chỉnh, thường được dùng khi mô hình có nhiều biến độc lập. Trong trường hợp này, các biến trong mô hình đang giải thích được khoảng 10,18% sự thay đổi của biến CASH. Khi đánh giá độ phù hợp của mô hình, người ta thường chú ý nhiều hơn đến chỉ số này. Thông thường, giá trị càng cao thì mô hình càng có khả năng giải thích dữ liệu tốt hơn (dù trong thực tế không phải lúc nào cũng đạt mức trên 50%).
  • Coef.: Đây là hệ số hồi quy của từng biến độc lập trong mô hình (còn gọi là hệ số Beta). Nó cho biết khi biến độc lập thay đổi một đơn vị thì biến phụ thuộc sẽ thay đổi bao nhiêu, nếu các yếu tố khác giữ nguyên.
  • Std. Err.: sai số chuẩn của hệ số hồi quy, phản ánh mức độ biến động của ước lượng. Sai số chuẩn càng nhỏ thì ước lượng thường càng ổn định.
  • P > |t|: Đây chính là p-value dùng để kiểm tra ý nghĩa thống kê của từng biến độc lập. Thông thường, người ta so sánh p-value với mức ý nghĩa 5% (0,05). Nếu p-value nhỏ hơn mức này, có thể xem biến đó có mối liên hệ có ý nghĩa thống kê với biến phụ thuộc. Trong một số nghiên cứu, mức 10% hoặc 1% cũng được sử dụng để đánh giá.

6.2. Diễn giải phương trình hồi quy tuyến tính

Phương trình hồi quy thu được từ mô hình có dạng:

CASH = 0.1754 – 0.0155 × SIZE + 0.0090 × PB – 0.0345 × LEV + 2.23e-06 × CF + 0.0004 × TANG

Nhìn vào bảng kết quả, có thể thấy SIZE, PB và CF đều có ý nghĩa thống kê ở mức 1%, vì p-value của các biến này gần như bằng 0. Điều đó cho thấy những biến này thực sự có liên hệ với lượng tiền mặt của doanh nghiệp trong mô hình.

Ngược lại, TANG có p-value khá lớn (0.850 > 0.05), nên biến này không đạt ý nghĩa thống kê. Nói cách khác, với bộ dữ liệu hiện tại, chưa có đủ cơ sở để khẳng định tỷ trọng tài sản cố định hữu hình có ảnh hưởng rõ ràng đến lượng tiền mặt của doanh nghiệp.

Nếu diễn giải cụ thể hơn:

  • Khi quy mô doanh nghiệp (SIZE) thay đổi 1 đơn vị, lượng tiền mặt CASH sẽ thay đổi khoảng 0.0155 đơn vị, trong điều kiện các yếu tố khác giữ nguyên.
  • Với PB (tỷ lệ giá thị trường trên giá trị sổ sách), khi chỉ số này tăng thêm 1 đơn vị thì CASH có xu hướng tăng khoảng 0.0090 đơn vị.
  • Tương tự, CF cũng cho thấy mối quan hệ cùng chiều với lượng tiền mặt, dù hệ số của nó khá nhỏ.
  • Riêng TANG không có ý nghĩa thống kê nên khó kết luận rõ ràng về tác động của biến này trong mô hình.
Diễn giải phương trình hồi quy tuyến tính

Diễn giải phương trình hồi quy tuyến tính

Sau khi ước lượng xong mô hình hồi quy, người nghiên cứu sẽ tiếp tục kiểm tra các khuyết tật của mô hình, chẳng hạn như đa cộng tuyến (VIF), phương sai sai số thay đổi, tự tương quan hay hệ số tương quan giữa các biến. Những bước kiểm định này giúp đảm bảo rằng kết quả hồi quy đáng tin cậy để sử dụng cho việc phân tích hoặc đưa ra kết luận.

7. Lời kết

Nếu bạn đang gặp khó khăn khi xây dựng mô hình hồi quy, phân tích dữ liệu hay viết báo cáo nghiên cứu, việc tìm đến một đơn vị hỗ trợ chuyên môn có thể giúp tiết kiệm rất nhiều thời gian. VietGuru hiện cung cấp dịch vụ viết thuê nghiên cứu khoa học với đội ngũ có kinh nghiệm sẽ giúp bạn định hướng mô hình, xử lý dữ liệu và trình bày kết quả sao cho rõ ràng, đúng chuẩn học thuật.

Hy vọng qua bài viết này, bạn đã hiểu rõ OLS là gì, cách mô hình hồi quy tuyến tính OLS hoạt động cũng như ý nghĩa của các hệ số và cách đánh giá mô hình. Nắm vững phương pháp này không chỉ giúp bạn đọc hiểu các nghiên cứu định lượng dễ dàng hơn mà còn là nền tảng quan trọng khi thực hiện các bài phân tích dữ liệu trong kinh tế, tài chính hay khoa học xã hội.

Có thể bạn quan tâm: Viết thuê nghiên cứu khoa học

Bài đăng này hữu ích như thế nào?

Bấm vào một ngôi sao để đánh giá nó!

Đánh giá trung bình 5 / 5. Số phiếu bầu: 1

Hãy là người đầu tiên đánh giá bài viết này.

Chia sẻ

Bài viết liên quan

Mai Phương Uyên

Xin chào bạn, tôi là Mai Phương Uyên – Trưởng Bộ phận Nội dung tại Vietguru. Với hơn 15 năm kinh nghiệm trong lĩnh vực nghiên cứu và biên soạn học thuật, tôi cùng đội ngũ chuyên gia Vietguru cam kết mang đến những bài viết chuẩn mực, chất lượng cao và đáp ứng chính xác mọi yêu cầu của bạn. Chúng tôi luôn sẵn sàng đồng hành cùng bạn từ bước lên ý tưởng, định hướng nội dung đến hoàn thiện và chỉnh sửa, giúp mỗi sản phẩm không chỉ đạt chuẩn mà còn thực sự nổi bật, thuyết phục.👉 Hãy liên hệ ngay với Vietguru để được tư vấn miễn phí và nhận hỗ trợ tận tâm trong suốt quá trình thực hiện bài viết. 📞 Hotline/Zalo: 0946.19.1900
_Tác giả bài viết_
Bạn cần một đơn vị uy tín để đồng hành trên con đường học thuật

Chúng tôi sẽ đồng hành cùng các bạn trên con đường kết nối với tri thức

Bạn cần một đơn vị uy tín để đồng hành trên con đường học thuật