Mục lục
Overview
Trong SAS, thủ tục proc univariate
được sử dụng để mô tả phân phối của một biến trong bộ dữ liệu. Thủ tục này cung cấp cho chúng ta thông tin về giá trị trung bình, độ lệch chuẩn, phân vị, giá trị tối đa và tối thiểu, và khả năng xuất hiện của các giá trị bất thường (outliers).
Cú pháp chung của câu lệnh proc univariate
như sau:
proc univariate data=dataset;
var variable_1 variable_2 ...;
options;
run;
Trong đó:
dataset
là tên bộ dữ liệu chứa biến cần phân tích.variable_1
,variable_2
,… là danh sách các biến cần phân tích.options
là các tùy chọn để điều chỉnh phân tích, ví dụ nhưplots
,normaltest
,…
Sau khi chạy câu lệnh proc univariate
, SAS sẽ hiển thị kết quả phân tích với các thông tin như: số lượng quan sát, giá trị trung bình, độ lệch chuẩn, phân vị, giá trị tối đa và tối thiểu, và khả năng xuất hiện của các giá trị bất thường.
Ví dụ: Giả sử ta có bộ dữ liệu salary
gồm một biến salary
(lương). Ta muốn phân tích phân phối của biến này, bao gồm các thông tin như giá trị trung bình, độ lệch chuẩn, phân vị 25%, 50%, và 75%, giá trị tối đa và tối thiểu, và khả năng xuất hiện của các giá trị bất thường. Ta có thể sử dụng câu lệnh như sau:
proc univariate data=salary;
var salary;
run;
Kết quả sau khi chạy câu lệnh này sẽ hiển thị các thông tin như số lượng quan sát, giá trị trung bình, độ lệch chuẩn, phân vị 25%, 50%, và 75%, giá trị tối đa và tối thiểu, và khả năng xuất hiện của các giá trị bất thường trong biến salary
.