Kiểm định tự tương quan trong Stata đầy đủ và dễ hiểu

icon  3 Tháng hai, 2026 Mai Phương Uyên Đánh giá:  
0
(0)
Kiểm định tự tương quan trong Stata đầy đủ và dễ hiểu
0
(0)

Tự tương quan là một hiện tượng phổ biến trong mô hình hồi quy tuyến tính, đặc biệt là khi phân tích dữ liệu chuỗi thời gian hoặc dữ liệu bảng. Vậy làm thế nào để kiểm định tự tương quan Stata? Hiện tượng này do đâu, ảnh hưởng ra sao và có những cách nào để xử lý hiệu quả? Hãy cùng VietGuru giải đáp toàn bộ thắc mắc trên trong bài viết dưới đây nhé!

1. Kiểm định tự tương quan Stata là gì?

Trong kinh tế lượng, kiểm định tự tương quan Stata (Autocorrelation) dùng để mô tả hiện tượng mà sai số của mô hình tại thời điểm hiện tại có mối liên hệ với sai số ở các thời điểm trước đó. Cụ thể, sai số tại thời điểm t (ký hiệu là uₜ) có thể tương quan với sai số tại t–1 hoặc xa hơn trong quá khứ. Hiện tượng này thường gặp khi phân tích dữ liệu chuỗi thời gian và dữ liệu bảng.

Với dữ liệu chuỗi thời gian, kiểm định tự tương quan Stata được gọi là autocorrelation. Trường hợp phổ biến nhất là tự tương quan bậc 1, khi sai số ở kỳ t phụ thuộc vào sai số ở kỳ t–1, được biểu diễn ngắn gọn qua công thức: uₜ = ρuₜ₋₁ + εₜ.

Trong khi đó, với dữ liệu bảng, hiện tượng này thường được gọi là serial correlation. Tự tương quan bậc 1 trong dữ liệu bảng phản ánh mối liên hệ giữa sai số của cùng một đối tượng quan sát qua các thời điểm khác nhau, và có thể viết dưới dạng: uᵢₜ = ρuᵢₜ₋₁ + εᵢₜ.

Kiểm định tự tương quan là gì?

Kiểm định tự tương quan Stata là gì?

Lưu ý: Tự tương quan thể hiện sự phụ thuộc của sai số theo thời gian, chứ không phải giữa các biến khác nhau. 

Nếu hệ số tương quan ρ khác 0, mô hình đang tồn tại tự tương quan; ngược lại, khi ρ = 0, hiện tượng tự tương quan không xảy ra.

Xem thêm: Các câu lệnh trong Stata

2. Cách phát hiện và kiểm định tự tương quan trong Stata

Hiểu rõ bản chất của tự tương quan là bước khởi đầu quan trọng, nhưng để mô hình thực sự đáng tin cậy, bạn cần phải biết cách nhận diện và thực hiện kiểm định tự tương quan Stata qua phần dưới đây. 

2.1. Phát hiện tự tương quan bằng phương pháp vẽ đồ thị

Để đánh giá mức độ tin cậy của một mô hình hồi quy, quan sát đồ thị phần dư là bước không nên bỏ qua. Bởi tự tương quan thực chất là mối liên hệ giữa các sai số uₜ theo thời gian, nên cách trực quan và dễ tiếp cận nhất để phát hiện hiện tượng này chính là theo dõi sự biến động của phần dư qua các kỳ.

Tuy nhiên, sai số thực uₜ không thể quan sát trực tiếp mà phải quan sát qua phần dư ước lượng (ký hiệu là eₜ). Trong Stata, bạn có thể tạo và trực quan hóa phần dư bằng các lệnh sau:

predict s1, resid

gen s1_100 = 100*s1

label var s1_100 “Residuals”

predict s2, rstandard

twoway (line s1_100 time) (line s2 time)

Thông qua đồ thị phần dư theo thời gian, bạn có thể nhận diện nhanh dấu hiệu tự tương quan:

  • Tự tương quan dương: phần dư có xu hướng biến động cùng chiều, tạo thành các “chuỗi” tăng hoặc giảm liên tiếp.
  • Tự tương quan âm: phần dư dao động lên xuống xen kẽ, giống hình răng cưa.
  • Không có tự tương quan: phần dư phân bố ngẫu nhiên quanh trục 0, không có quy luật rõ ràng.
Phát hiện tự tương quan bằng phương pháp vẽ đồ thị

Phát hiện tự tương quan bằng phương pháp vẽ đồ thị

2.2. Kiểm định tự tương quan với dữ liệu chuỗi thời gian trong Stata

Trước khi tiến hành kiểm định tự tương quan Stata, bạn cần khai báo dữ liệu chuỗi thời gian bằng lệnh tsset timevar, trong đó timevarbiến đại diện cho yếu tố thời gian của mô hình. Đây là bước nền tảng để Stata hiểu cấu trúc dữ liệu và thực hiện các kiểm định chính xác.

Một điểm quan trọng bạn cần lưu ý là phải hồi quy mô hình trước khi áp dụng các phương pháp dưới đây để kiểm định tự tương quan Stata.

Giả thuyết H0:

  • H0: Mô hình không có hiện tượng tự tương quan
  • H1: Mô hình có xảy ra hiện tượng tự tương quan

Cách 1: Kiểm định Durbin–Watson

Chỉ số Durbin–Watson nhận giá trị trong khoảng từ 0 đến 4.

  • Giá trị gần 0 cho thấy tự tương quan dương lớn
  • Giá trị gần 4 phản ánh tự tương quan âm lớn
  • Giá trị gần giữa cho thấy tự tương quan không đáng kể

Lệnh thực hiện: dwstat

Xem thêm: Cách chạy Stata

Cách 2: Kiểm định Durbin’s alternative

Phương pháp này giúp bổ sung và làm rõ hơn kết quả Durbin–Watson bằng cách ánh xạ tuyến tính mối quan hệ tương quan Pearson giữa các sai số và độ trễ của chúng, từ đó cung cấp p-value để đánh giá ý nghĩa thống kê.

Lệnh thực hiện: estat durbinalt

Kiểm định tự tương quan với dữ liệu chuỗi thời gian trong Stata

Kiểm định tự tương quan với dữ liệu chuỗi thời gian trong Stata

Cách 3: Kiểm định Breusch–Godfrey

Đây là kiểm định cho phép phát hiện tự tương quan ở các bậc cao. Ưu điểm lớn của phương pháp này là vẫn áp dụng được ngay cả khi mô hình có chứa độ trễ của biến phụ thuộc.

Lệnh thực hiện: bgodfrey

Nếu kết quả từ Durbin–Watson và Durbin’s alternative đều cho p-value < 0.05, ta có đủ cơ sở để bác bỏ giả thuyết H0 và kết luận rằng mô hình đang tồn tại hiện tượng tự tương quan.

2.3. Kiểm định tự tương quan với dữ liệu bảng trong Stata

Với dữ liệu bảng, trước hết bạn cần khai báo cấu trúc dữ liệu để Stata hiểu bằng lệnh: xtset bank YEAR, trong đó bankbiến đại diện cho đối tượng quan sát và YEARbiến thời gian.

Sau đó, ta tiến hành kiểm định tự tương quan Stata bằng lệnh: xtserial [BPT] [BĐL], như minh họa bên dưới.

Kiểm định tự tương quan với dữ liệu bảng trong Stata

Kiểm định tự tương quan với dữ liệu bảng trong Stata

Dựa trên kết quả thu được, p-value = 0.0849, lớn hơn mức ý nghĩa 5% nên chấp nhận giả thuyết H0. Từ đó kết luận rằng mô hình không xuất hiện hiện tượng tự tương quan, và các ước lượng có thể được xem là đáng tin cậy.

Xem thêm: Hướng dẫn tải STATA

3. Các phương pháp khắc phục hiện tượng tự tương quan trong Stata

Sau khi kiểm định tự tương quan Stata, nếu có xảy ra hiện tượng này, chúng ta phải tiến hành xử lý đúng cách để mô hình trở nên chính xác và đáng tin cậy. Vậy trong Stata, đâu là những phương pháp hiệu quả giúp khắc phục hiện tượng này? Hãy cùng theo dõi nhé!

3.1. Cách khắc phục bằng sai phân bậc nhất

  • Một trong những cách đơn giản và hiệu quả để xử lý tự tương quan là chuyển các biến về dạng sai phân bậc 1, tức lấy hiệu số giữa giá trị tại thời điểm t và t–1. 
  • Trong Stata, bạn không cần thao tác thủ công phức tạp, chỉ cần thêm tiền tố D. trước các biến trong mô hình: reg D.Y D.X1 D.X2 D.X3

3.2. Khắc phục tự tương quan bằng hệ số tương quan ước lượng

  • Khi giả định sai số tuân theo quá trình AR(1), ta có thể áp dụng phương pháp bình phương bé nhất tổng quát khả thi (FGLS) để khắc phục tự tương quan. Phương pháp này sử dụng hệ số tương quan ước lượng để điều chỉnh mô hình, đặc biệt phù hợp với dữ liệu bảng.
  • Trong Stata, bạn có thể thực hiện bằng lệnh: xtgls [BPT] [BĐL], corr(ar1)
  • Với mẫu đủ lớn, hệ số 𝜌̂ thu được sẽ là ước lượng nhất quán, giúp mô hình phản ánh đúng cấu trúc phụ thuộc của sai số theo thời gian.
Khắc phục tự tương quan bằng hệ số tương quan ước lượng

Khắc phục tự tương quan bằng hệ số tương quan ước lượng

3.3. Sử dụng phương pháp Newey-West để điều chỉnh sai số chuẩn OLS

  • Nếu cỡ mẫu lớn, bạn vẫn có thể ước lượng hồi quy OLS như bình thường, nhưng điều chỉnh sai số chuẩn để khắc phục đồng thời hiện tượng tự tương quan và phương sai thay đổi. 
  • Phương pháp này cho ra các sai số chuẩn HAC (heteroskedasticity and autocorrelation consistent), thường lớn hơn sai số OLS thông thường nhưng đáng tin cậy hơn.
  • Trong Stata, bạn có thể sử dụng một trong hai cách sau: reg Y X1 X2 X3, vce(robust) hoặc newey Y X1 X2 X3, lag(n)
  • Lưu ý: Khi dùng lệnh newey, bậc trễ tối thiểu nên đặt từ 1 trở lên để phản ánh đúng cấu trúc tự tương quan.

3.4. Đưa biến trễ vào biến phụ thuộc trong mô hình hồi quy

Một giải pháp khác là thêm biến trễ cho biến phụ thuộc, đặc biệt khi giá trị của biến này có mối liên hệ chặt chẽ giữa các kỳ liên tiếp.

Ví dụ trong Stata:

  • reg Y L.Y X1 X2 X3          // Biến phụ thuộc trễ 1 kỳ
  • reg Y L(1/2).Y X1 X2 X3    // Biến phụ thuộc trễ 1 và 2 kỳ

Sau khi thêm biến trễ, đừng quên thực hiện lại kiểm định tự tương quan Stata để chắc chắn rằng hiện tượng này đã được xử lý triệt để và mô hình đạt độ tin cậy mong muốn.

Xem thêm: Tải AMOS full bản quyền 

4. Phân biệt tự tương quan và tương quan chuỗi

Trong thực tế, nhiều người thường sử dụng tự tương quan và tương quan chuỗi như những khái niệm tương đương, dù vẫn có ý kiến cho rằng hai thuật ngữ này nên được phân biệt rõ ràng. Tuy nhiên, sự khác biệt đó không ảnh hưởng nhiều đến nội dung phân tích, nên trong phạm vi bài viết này, hai khái niệm sẽ được hiểu theo cùng một nghĩa.

Kiểm định tự tương quan Stata thường gắn liền với dữ liệu chuỗi thời gian, nhưng trên thực tế, hiện tượng này cũng có thể xuất hiện trong dữ liệu chéo. Khi đó, một số nhà nghiên cứu gọi đây là tự tương quan không gian — phản ánh mối liên hệ giữa các quan sát theo vị trí hay không gian, thay vì theo dòng thời gian.

Tuy nhiên với dữ liệu chéo, cách sắp xếp thứ tự dữ liệu sao cho logic hoặc theo lợi ích kinh tế đóng vai trò quyết định. Chỉ khi dữ liệu được tổ chức hợp lý, việc kiểm tra và diễn giải hiện tượng tự tương quan mới thực sự có ý nghĩa và mang lại giá trị phân tích.

Phân biệt tự tương quan và tương quan chuỗi

Phân biệt tự tương quan và tương quan chuỗi

5. Nguyên nhân gây ra hiện tượng tự tương quan

Hiện tượng tự tương quan có thể xuất phát từ nhiều nguyên nhân khác nhau, trong đó phổ biến nhất gồm:

  • Tác động của quán tính kinh tế: Phần lớn các chuỗi thời gian trong kinh tế mang tính quán tính và chu kỳ, khiến giá trị ở hiện tại thường chịu ảnh hưởng mạnh từ các giai đoạn trước. Sự “kéo dài” này dễ làm cho các sai số có mối liên hệ với nhau theo thời gian.
  • Hiện tượng mạng nhện: Khi phản ứng của thị trường diễn ra chậm so với tín hiệu ban đầu, các biến kinh tế có thể điều chỉnh dần qua nhiều kỳ, tạo ra chuỗi dao động lặp lại và làm phát sinh tự tương quan.
  • Ảnh hưởng của độ trễ: Trong phân tích chuỗi thời gian, không hiếm trường hợp biến phụ thuộc tại thời điểm t chịu tác động từ chính nó ở t–1 hoặc từ các biến khác có độ trễ. Nếu những yếu tố này chưa được đưa đầy đủ vào mô hình, tự tương quan rất dễ xuất hiện.
  • Quá trình xử lý và làm trơn dữ liệu: Dữ liệu thực nghiệm thường được xử lý trước khi phân tích, chẳng hạn chuyển số liệu tháng sang số liệu quý bằng cách lấy trung bình. Việc làm này giúp giảm biến động ngắn hạn nhưng đồng thời có thể tạo ra các sai số mang tính hệ thống, dẫn đến sự phụ thuộc giữa các sai số.
  • Sai sót trong việc xây dựng mô hình: Đây là nguyên nhân cốt lõi và thường gặp nhất. Việc bỏ sót biến quan trọng, chọn sai dạng hàm hay cấu trúc mô hình không phù hợp đều có thể khiến sai số không còn độc lập, từ đó gây ra hiện tượng tự tương quan.
Nguyên nhân gây ra hiện tượng tự tương quan

Nguyên nhân gây ra hiện tượng tự tương quan

6. Ý nghĩa của hiện tượng tự tương quan trong phân tích kinh tế lượng

Tự tương quan là một khái niệm quan trọng trong thống kê, còn được biết đến với tên gọi tương quan nối tiếp. Khái niệm này thường xuất hiện trong các mô hình phân tích chuỗi thời gian như ARMA hay ARIMA. Thông qua kiểm định tự tương quan Stata, người nghiên cứu có thể nhận diện các chu kỳ lặp lại ẩn trong dữ liệu.

Về bản chất, tự tương quan phản ánh mức độ tương đồng giữa một chuỗi thời gian và chính nó ở các thời điểm trễ, qua những khoảng thời gian liên tiếp. Nói cách khác, nó đo lường mức độ mà giá trị hiện tại của một biến chịu ảnh hưởng từ các giá trị trong quá khứ.

Khi hệ số tự tương quan bằng +1, ta có mối tương quan dương hoàn hảo; ngược lại, giá trị –1 cho thấy mối tương quan âm hoàn hảo. Dựa vào chỉ số này, các nhà phân tích kỹ thuật có thể đánh giá mức độ chi phối của biến động quá khứ đối với xu hướng giá trong tương lai, từ đó hỗ trợ việc dự báo và ra quyết định đầu tư hiệu quả hơn.

Ý nghĩa của hiện tượng tự tương quan trong phân tích kinh tế lượng

Ý nghĩa của hiện tượng tự tương quan trong phân tích kinh tế lượng

7. Hậu quả của hiện tượng tự tương quan đối với mô hình hồi quy

Ngay cả khi mô hình xuất hiện hiện tượng tự tương quan, các ước lượng OLS vẫn giữ được tính nhất quán và không bị chệch theo phân phối chuẩn. Tuy nhiên, điều đó không có nghĩa là mô hình hoàn toàn đáng tin cậy.

  • Trên thực tế, các ước lượng này không còn đạt hiệu quả tối ưu, tức không còn là ước lượng tuyến tính không chệch tốt nhất (BLUE). Hệ quả kéo theo là sai số chuẩn của OLS thường bị đánh giá thấp, khiến các thống kê t bị phóng đại một cách không cần thiết.
  • Khi sai số chuẩn không còn đáng tin cậy, các kiểm định giả thuyết trở nên kém chính xác. Lúc này, kiểm định t và F có thể cho kết luận sai lệch, dẫn đến việc chấp nhận hoặc bác bỏ giả thuyết không đúng thực tế.
  • Nghiêm trọng hơn, trong một số trường hợp, tự tương quan còn có thể làm phát sinh hiện tượng hồi quy giả mạo (spurious regression) — khiến mô hình tưởng chừng có ý nghĩa thống kê nhưng thực chất lại không phản ánh đúng mối quan hệ kinh tế thực sự.
Hậu quả của hiện tượng tự tương quan đối với mô hình hồi quy

Hậu quả của hiện tượng tự tương quan đối với mô hình hồi quy

8. Lời kết

Nếu bạn đang gặp khó khăn trong quá trình phân tích dữ liệu, chưa tự tin kiểm định hay xử lý các lỗi mô hình trong Stata, dịch vụ nhận chạy Stata thuê tại VietGuru sẽ là giải pháp nhanh gọn và đáng tin cậy. Với đội ngũ am hiểu kinh tế lượng, thao tác chuẩn kỹ thuật và hỗ trợ tận tâm, VietGuru giúp bạn tiết kiệm thời gian mà vẫn đảm bảo kết quả chính xác, đúng yêu cầu học tập và nghiên cứu.

Hy vọng bài viết trên đã giúp bạn nắm rõ bản chất, cách thực hiện cũng như khắc phục hiện tượng tự tương quan một cách bài bản và dễ áp dụng. Việc hiểu và thực hiện đúng kiểm định tự tương quan Stata không chỉ giúp mô hình đáng tin cậy hơn mà còn nâng cao chất lượng phân tích và kết luận nghiên cứu của bạn. Chúc bạn học tốt và làm chủ Stata ngày càng hiệu quả!

Có thể bạn quan tâm: Viết thuê nghiên cứu khoa học

Bài đăng này hữu ích như thế nào?

Bấm vào một ngôi sao để đánh giá nó!

Đánh giá trung bình 0 / 5. Số phiếu bầu: 0

Hãy là người đầu tiên đánh giá bài viết này.

Chia sẻ

Bài viết liên quan

Mai Phương Uyên

Xin chào bạn, tôi là Mai Phương Uyên – Trưởng Bộ phận Nội dung tại Vietguru. Với hơn 15 năm kinh nghiệm trong lĩnh vực nghiên cứu và biên soạn học thuật, tôi cùng đội ngũ chuyên gia Vietguru cam kết mang đến những bài viết chuẩn mực, chất lượng cao và đáp ứng chính xác mọi yêu cầu của bạn. Chúng tôi luôn sẵn sàng đồng hành cùng bạn từ bước lên ý tưởng, định hướng nội dung đến hoàn thiện và chỉnh sửa, giúp mỗi sản phẩm không chỉ đạt chuẩn mà còn thực sự nổi bật, thuyết phục.👉 Hãy liên hệ ngay với Vietguru để được tư vấn miễn phí và nhận hỗ trợ tận tâm trong suốt quá trình thực hiện bài viết. 📞 Hotline/Zalo: 0946.19.1900
_Tác giả bài viết_
Bạn cần một đơn vị uy tín để đồng hành trên con đường học thuật

Chúng tôi sẽ đồng hành cùng các bạn trên con đường kết nối với tri thức

Bạn cần một đơn vị uy tín để đồng hành trên con đường học thuật