Proc Univariate

Các lệnh cơ bản của [Proc Univariate](https://documentation.sas.com/?docsetId=procstat&docsetTarget=procstat_univariate_syntax01.htm&docsetVersion=9.4&locale=en)

Mục lục

Overview

Trong SAS, thủ tục proc univariate được sử dụng để mô tả phân phối của một biến trong bộ dữ liệu. Thủ tục này cung cấp cho chúng ta thông tin về giá trị trung bình, độ lệch chuẩn, phân vị, giá trị tối đa và tối thiểu, và khả năng xuất hiện của các giá trị bất thường (outliers).

Cú pháp chung của câu lệnh proc univariate như sau:

proc univariate data=dataset;
  var variable_1 variable_2 ...;
  options;
run;

Trong đó:

  • dataset là tên bộ dữ liệu chứa biến cần phân tích.
  • variable_1, variable_2,… là danh sách các biến cần phân tích.
  • options là các tùy chọn để điều chỉnh phân tích, ví dụ như plots, normaltest,…

Sau khi chạy câu lệnh proc univariate, SAS sẽ hiển thị kết quả phân tích với các thông tin như: số lượng quan sát, giá trị trung bình, độ lệch chuẩn, phân vị, giá trị tối đa và tối thiểu, và khả năng xuất hiện của các giá trị bất thường.

Ví dụ: Giả sử ta có bộ dữ liệu salary gồm một biến salary (lương). Ta muốn phân tích phân phối của biến này, bao gồm các thông tin như giá trị trung bình, độ lệch chuẩn, phân vị 25%, 50%, và 75%, giá trị tối đa và tối thiểu, và khả năng xuất hiện của các giá trị bất thường. Ta có thể sử dụng câu lệnh như sau:

proc univariate data=salary;
  var salary;
run;

Kết quả sau khi chạy câu lệnh này sẽ hiển thị các thông tin như số lượng quan sát, giá trị trung bình, độ lệch chuẩn, phân vị 25%, 50%, và 75%, giá trị tối đa và tối thiểu, và khả năng xuất hiện của các giá trị bất thường trong biến salary.


Overview
Data Step
Data Aggregation
Data Visualization
Proc SQL
Variable Analysis
Macro
Model Regression
Variable Selection
Model Assessment