Mục lục
Overview
Trong SAS, chúng ta có thể sử dụng thủ tục proc reg
để xây dựng mô hình hồi quy tuyến tính (OLS - Ordinary Least Squares Regression). Thủ tục này cho phép ta ước lượng các hệ số và giá trị dự đoán của biến phụ thuộc dựa trên các biến đầu vào.
Cú pháp chung của câu lệnh proc reg
như sau:
proc reg data=dataset;
model dependent_variable = independent_variable_1 independent_variable_2 ... / selection options;
run;
Trong đó:
dataset
là tên bộ dữ liệu mà ta muốn sử dụng để xây dựng mô hình.dependent_variable
là biến phụ thuộc trong mô hình.independent_variable_1
,independent_variable_2
,… là danh sách các biến đầu vào trong mô hình.selection options
là tùy chọn để điều chỉnh việc lựa chọn các biến trong mô hình, ví dụ nhưbackward
,forward
,stepwise
,…
Sau khi chạy câu lệnh proc reg
, SAS sẽ hiển thị kết quả về các hệ số, thông tin về mô hình (R-square, F-test, AIC,…) và các giá trị liên quan khác.
Ví dụ: Giả sử ta có bộ dữ liệu salary
gồm các biến salary
(lương), age
(tuổi), education
(trình độ học vấn) và experience
(kinh nghiệm làm việc). Ta muốn xây dựng mô hình hồi quy tuyến tính để dự đoán lương dựa trên các biến đầu vào này. Ta có thể sử dụng câu lệnh như sau:
proc reg data=salary;
model salary = age education experience / selection=backward;
run;
Trong ví dụ này, ta sử dụng các biến đầu vào là age
, education
, và experience
để dự đoán biến phụ thuộc salary
. Ta sử dụng tùy chọn selection=backward
để SAS tự động loại bỏ các biến không quan trọng trong mô hình. Kết quả sau khi chạy câu lệnh này sẽ hiển thị các hệ số, thông tin về mô hình và các giá trị liên quan khác, để giúp ta đánh giá hiệu quả của mô hình trong dự đoán lương dựa trên các biến đầu vào.