Ordinal Least Square

Xây dựng mô hình OLS bằng SAS

Mục lục

Overview

Trong SAS, chúng ta có thể sử dụng thủ tục proc reg để xây dựng mô hình hồi quy tuyến tính (OLS - Ordinary Least Squares Regression). Thủ tục này cho phép ta ước lượng các hệ số và giá trị dự đoán của biến phụ thuộc dựa trên các biến đầu vào.

Cú pháp chung của câu lệnh proc reg như sau:

proc reg data=dataset;
  model dependent_variable = independent_variable_1 independent_variable_2 ... / selection options;
run;

Trong đó:

  • dataset là tên bộ dữ liệu mà ta muốn sử dụng để xây dựng mô hình.
  • dependent_variable là biến phụ thuộc trong mô hình.
  • independent_variable_1, independent_variable_2,… là danh sách các biến đầu vào trong mô hình.
  • selection options là tùy chọn để điều chỉnh việc lựa chọn các biến trong mô hình, ví dụ như backward, forward, stepwise,…

Sau khi chạy câu lệnh proc reg, SAS sẽ hiển thị kết quả về các hệ số, thông tin về mô hình (R-square, F-test, AIC,…) và các giá trị liên quan khác.

Ví dụ: Giả sử ta có bộ dữ liệu salary gồm các biến salary (lương), age (tuổi), education (trình độ học vấn) và experience (kinh nghiệm làm việc). Ta muốn xây dựng mô hình hồi quy tuyến tính để dự đoán lương dựa trên các biến đầu vào này. Ta có thể sử dụng câu lệnh như sau:

proc reg data=salary;
  model salary = age education experience / selection=backward;
run;

Trong ví dụ này, ta sử dụng các biến đầu vào là age, education, và experience để dự đoán biến phụ thuộc salary. Ta sử dụng tùy chọn selection=backward để SAS tự động loại bỏ các biến không quan trọng trong mô hình. Kết quả sau khi chạy câu lệnh này sẽ hiển thị các hệ số, thông tin về mô hình và các giá trị liên quan khác, để giúp ta đánh giá hiệu quả của mô hình trong dự đoán lương dựa trên các biến đầu vào.


Overview
Data Step
Data Aggregation
Data Visualization
Proc SQL
Variable Analysis
Macro
Model Regression
Variable Selection
Model Assessment