Đối với những ai tìm hiểu và học về kinh tế lượng, chắc chắn đã từng nghe qua và sử dụng mô hình hồi quy. Vậy cách chạy mô hình hồi quy trong Stata như thế nào, cách đọc và phân tích số liệu ra sao, hãy cùng Best4Team tìm hiểu trong bài viết sau nhé!

1 cach chay mo hinh hoi quy trong stata

1. Cách chạy mô hình hồi quy tuyến tính đơn giản

Mô hình hồi quy tuyến tính (Linear Regression Model) là một trong những công cụ quan trọng, là phương pháp thống kê giúp hồi quy dữ liệu giữa một hoặc nhiều giá trị liên tục, định danh và phân loại có liên quan.

1.1. Khái niệm

Hồi quy tuyến tính trong thống kê là phương pháp tiếp cận tuyến tính để mô tả mối quan hệ giữa một phản ứng vô hướng và một hoặc nhiều biến độc lập ( Wikipedia )

Cụ thể hơn, đây là cách tiếp cận tuyến tính hỗ trợ dự đoán các thông số liên quan của biến phụ thuộc Y (biến kết cục) trên trục tung dựa trên các biến độc lập X (biến giải thích) trên trục hoành trong mô hình.

Phương trình hồi quy tuyến tính tổng quát có dạng:

Yi = β1 + β2X2i + β3X3i + … + βnXni + ui

Trong đó:

  • Y: biến phụ thuộc, hay còn được gọi là regressand
  • X: biến độc lập (explanatory variables/independent variables) hay còn được biết đến với các tên gọi như covariates, predictors hoặc regressors.
  • βn: hệ số của các biến độc lập (B1 là hệ số tự do)
  • u: sai số ngẫu nhiên
  • i: ký hiệu cho quan sát thứ i trong tập mẫu

Phương trình trên có thể viết gọn thành mô hình tổng thể (true model hay population model) như sau:

Yi = βX + ui

với βX = β1 + β2X2i + β3X3i + … + βnXni

Trong đó:

  • βX: được xem như trung bình có điều kiện của Yi, tức là E(Yi|X)
  • ui: thành phần ngẫu nhiên (random component) hoặc thành phần phi hệ thống (nonsystematic component)

2 khai niem mo hinh hoi quy

1.2. 3 bước chạy mô hình

Giả sử chúng ta đang quan tâm đến việc tìm hiểu mối quan hệ giữa trọng lượng của một chiếc ô tô và số dặm trên gallon (đơn vị đo thể tích thường được dùng ở Mỹ và Anh) của nó. Để khám phá mối quan hệ này, chúng ta có thể thực hiện hồi quy tuyến tính đơn giản sử dụng trọng lượng làm biến giải thích và dặm trên gallon làm biến phụ thuộc.

Thực hiện chạy mô hình hồi quy tuyến tính đơn giản trong Stata bằng cách sử dụng tập dữ liệu chứa dữ liệu về 74 ô tô khác nhau.

  • Bước 1: Load dữ liệu lên Stata.
  • Bước 2: Trên thanh Menu nhấn chọn Statistics > Linear models and related > Linear regression. Bạn sẽ thấy hộp thoại Regress – Linear regression.

3 chay mo hiinh hoi quy tuyen tinh don gian

  • Bước 3: Tại hộp thoại Regress – Linear regression, chọn biến MPG vào ô biến phục thuộc, WEIGH vào biến độc lập. Nhấn OK, hệ thống sẽ đưa ra kết quả như sau:

4 buoc 3 chay mo hinh hoi quy don gian

5 ket qua mo hinh hoi quy don gian

1.3. Ý nghĩa cách đọc kết quả

Với kết quả trên, ta quan tâm đến các trị số quan trọng như:

  • Bình phương R: 0,6515. Đây là tỷ lệ của phương sai trong biến phản hồi có thể được giải thích bởi biến giải thích. Trong ví dụ này, 65,15% sự thay đổi trong MPG có thể được giải thích theo trọng lượng.
  • Coef (trọng lượng): -0,006. Điều này cho chúng ta biết sự thay đổi trung bình trong biến phản hồi liên quan đến sự gia tăng một đơn vị trong biến giải thích. Trong ví dụ này, mỗi cân nặng tăng một pound có liên quan đến việc giảm trung bình 0,006 mpg.
  • Coef (_cons): 39.44028. Điều này cho chúng ta biết giá trị trung bình của biến phản hồi khi biến giải thích bằng không. Trong ví dụ này, mpg trung bình là 39.44028 khi trọng lượng của một chiếc ô tô bằng không. Điều này thực sự không có nhiều ý nghĩa để giải thích vì trọng lượng của một chiếc ô tô không thể bằng 0, nhưng số 39.44028 là cần thiết để lập phương trình hồi quy.
  • P> | t | (trọng lượng): 0,000. Đây là giá trị p được liên kết với thống kê thử nghiệm cho trọng lượng. Trong trường hợp này, vì giá trị này nhỏ hơn 0,05, chúng ta có thể kết luận rằng có mối quan hệ có ý nghĩa thống kê giữa trọng lượng và mpg.

Từ các thông số trên, chúng ta có thể lập phương trình hồi quy tuyến tính đơn giản như sau:

mpg = 39.44028 – 0.0060087*(weight)

Có thể thấy, chúng ta đã thiết lập được một mối quan hệ có ý nghĩa thống kê giữa trọng lượng và mpg (t = -11,60, p <0,0001) và trọng lượng chiếm 65,15% sự thay đổi được giải thích trong mpg. Với mỗi pound trọng lượng tăng sẽ làm giảm trung bình -.006 dặm một gallon.

2. Cách chạy mô hình hồi quy tuyến tính đa biến trong Stata

Trong phần trên, chúng ta đã nghiên cứu về mô hình hồi quy tuyến tính đơn biến, tức là chỉ có một biến độc lập. Nếu xét nhiều hơn 1 biến độc lập, chúng ta sẽ sử dụng hồi quy tuyến tính đa biến (Multiple Regression Linear).

2.1. Khái niệm mô hình hồi quy tuyến tính đa biến

Xét về cơ bản, không có quá nhiều sự khác biệt giữa hồi quy tuyến tính “đơn giản” và “đa biến”. Cả hai mô hình này đều tuân theo nguyên tắc OLS cùng những thuật toán nhất định để có được đường hồi quy tối ưu nhất.

2.2. Phương pháp bình phương nhỏ nhất (OLS) là gì?

Mô hình hồi quy bằng phương pháp bình phương nhỏ nhất (Ordinary Least Square – OLS) là một trường hợp đặc biệt của phương pháp bình phương tổng quát, sử dụng để tìm đường hồi quy gần nhất với giá trị liên tục của biến phụ thuộc. Nói cách khác, phương pháp này tìm cách làm sao để tổng bình phương các hạng nhiễu hay sai số (∑u2i ) là nhỏ nhất.

2.3. 4 bước chạy mô hình hồi quy tuyến tính bằng cách dùng Menu trong Stata

Trước khi chạy hồi quy bằng phương pháp bình phương nhỏ nhất OLS, người thực hiện cần xác định được dữ liệu của mình thuộc dữ liệu thời gian (time-series) hay dữ liệu bảng (panel data) để khai báo chính xác.

  • Bước 1: Bấm vào thanh menu chọn Statistics > Linear models and related > Linear regression.
  • Bước 2: Chọn biến phụ thuộc vào ô Dependent Variable, các biến độc lập vào ô Independent Variables. Trong ví dụ dưới đ.ây, các biến phụ thuộc là SIZE, PB, LEV, CF, TANG, biến độc lập là CASH

6 cac buoc thuc hien

  • Bước 3: Nhấn chọn tab Reporting, trong hộp thoại hiện ra tích vào ô Standardized beta coefficients để hiển thị hệ số hồi quy chuẩn hóa.

7 buoc 3

  • Bước 4: Nhấn OK để hiển thị kết quả.

9 ket qua mo hinh hoi quy trong stata

2.4. Chạy hồi quy bằng phương pháp bình phương nhỏ nhất OLS trong Stata thông qua việc dùng lệnh

  • Lệnh dùng để hồi quy là regress, bạn có thể ghi tắt thành reg.
  • Sử dụng bộ dữ liệu mosl.dta, ta sẽ thu được kết quả như hình dưới.

8 ket qua khi dung lenh

Nhìn chung, việc xử lý dữ liệu trên các phần mềm Eviews, Stata, SPSS khá mất thời gian, đòi hỏi người thực hiện phải am hiểu và cẩn thận trong quá trình thực hiện. Để có được kết quả tối ưu nhất, bạn đọc có thể tham khảo dịch vụ tại các đơn vị nhận xử lý số liệu SPSS uy tín. Với kinh nghiệm hỗ trợ cho hàng ngàn khách hàng, Beest4team tự tin mang tới giải pháp tối ưu nhất cho khách hàng. Tham khảo dịch vụ tại Best4team ngay!

2.5. Ý nghĩa cách đọc kết quả

Đối với kết quả hiện ra, chúng ta sẽ chú ý đến một số trọng số quan trọng như:

  • Prob > F = 0.0000: mức ý nghĩa của kiểm định F với giả thuyết H0. Đối với các biến độc lập đồng thời bằng 0, ta sẽ bác bỏ H0 và đưa ra kết luận mô hình có ý nghĩa thống kê.
  • R – squared = 0.1100: thể hiện mức độ phù hợp của mô hình nghiên cứu, đồng thời giải thích nhân tố phục thuộc đạt bao nhiêu % trong nghiên cứu.
  • Adj R-squared = 0.1018: còn gọi là R bình phương hiệu chỉnh. Trị số 0.1018 thể hiện các biến độc lập trong mô hình đang giải thích được khoảng 10.18% sự biến thiên của biến phụ thuộc CASH trong mô hình.
  • Coef. : hệ số hồi quy của biến độc lập.
  • Std. Err.: sai số chuẩn của cột giá trị t.
  • P > |t| : hay p – value, là mức ý nghĩa của các biến độc lập trong mô hình. P-value<5% chúng ta có thể kết luận biến độc lập có mối quan hệ với biến phụ thuộc và ngược lại.

10 nhung tri so can luu y 1

Từ kết quả nhận được, ta có phương trình hồi quy tuyến tính như sau:

CASH = 0.1754 – 0.0155*SIZE + 0.0090*PB -0.0345*LEV + 2.23e-06*CF + 0.0004*TANG

Có thể thấy, các biến SIZE; PB và CF đạt ý nghĩa thống kê tại mức 1% (vì p-value = 0.0000 < 5%), đồng thời biến LEV đạt ý nghĩa thống kê tại mức 5% (Vì p-value = 0.039 < 5%), ta có thể kết luận:

  • Biến SIZE và LEV có tương quan âm với biến CASH (hệ số hồi quy <0)
  • Biến PB và CF có tương quan dương với biến CASH (hệ số hồi quy >0)
  • Biến TANG không có mối quan hệ với biến CASH (p-value=0.850 > 5%)

Diễn giải:

  • Khi SIZE (quy mô công ty) giảm đi 1, thì lượng tiền mặt CASH giảm đi 0.0155 lần trong điều kiện các yếu tố khác không đổi. Tương tự với biến LEV.
  • Khi giá trị sổ sách trên thị trường (PB) của công ty tăng 1, lượng tiền mặt (CASH) của công ty sẽ tăng lên 0.0090 lần trong điều kiện các yếu tố khác không đổi. Tương tự với biến CF.
  • Biến TANG (Tỷ trọng tài sản cố định hữu hình) không đạt ý nghĩa thống kê, nên không thể xác định được mối quan hệ giữa TANG và CASH.

Trên đây là toàn bộ những kiến thức liên quan cũng như hướng dẫn cách chạy mô hình hồi quy trong Stata mà chúng tôi muốn gửi tới bạn đọc. Tham khảo thêm những bài viết khác của chúng tôi để có thêm kỹ năng làm việc cùng các phần mềm nghiên cứu phổ biến nhé!

Trong quá trình phân tích SPSS, bạn muốn tìm kiếm thêm nhiều tài liệu về hướng dẫn cách chạy SPSS cập nhật mới của Trung tâm Best4Team .Liên hệ qua SĐT Zalo: 091.552.1220 hoặc email: best4team.com@gmail.com  để hỗ trợ ngay nhé!

0/5 (0 Reviews)
Nguyễn Phương Nam
Nguyễn Phương Nam
Tôi là Nguyễn Phương Nam chức vụ phó phòng nội dung tại Best4Team. Công việc của tôi là nghiên cứu, sản xuất nội dung thông tin cho website Best4Team.com ở lĩnh vực tài liệu và chạy mô hình kinh tế lượng bằng các phần mềm Eview, Stata, Spss,...
guest
0 Bình luận
Inline Feedbacks
View all comments

LIÊN HỆ

Nếu bạn chưa biết mình cần cung cấp những thông tin gì thì đừng ngại để lại thông tin tại đây. Chúng tôi sẽ liên hệ lại sớm nhất có thể.

Sau khi trao đổi bạn sẽ nhận được:

  • Sự tư vấn tận tâm về tất cả băn khoăn của bạn
  • Báo giá chi tiết và thời hạn hoàn thành.
  • Quy trình làm việc an toàn Hỗ Trợ Viết Báo Cáo

ĐỂ LẠI THÔNG TIN LIÊN HỆ

*Xin vui lòng điền đầy đủ thông tin và chính xác để được hỗ trợ tư vấn nhanh nhất.