Mục lục
Overview
Trong SAS, thủ tục proc rank
được sử dụng để tạo ra một biến mới dựa trên việc xếp hạng các giá trị của một biến trong bộ dữ liệu. Thủ tục này cho phép chúng ta xác định vị trí của mỗi giá trị trong phân phối của biến, và gán cho nó một giá trị xếp hạng tương ứng.
Cú pháp chung của câu lệnh proc rank
như sau:
proc rank data=dataset out=new_dataset;
var variable;
ranks new_variable;
run;
Trong đó:
dataset
là tên bộ dữ liệu chứa biến cần xếp hạng.new_dataset
là tên của bộ dữ liệu mới được tạo ra, chứa cả biến cũ và biến mới được xếp hạng.variable
là tên của biến cần xếp hạng.new_variable
là tên của biến mới được tạo ra để lưu các giá trị xếp hạng.
Sau khi chạy câu lệnh proc rank
, SAS sẽ tạo ra một biến mới có tên là new_variable
, chứa các giá trị xếp hạng của biến variable
. Các giá trị này được tính toán bằng cách sắp xếp các giá trị của biến variable
theo thứ tự tăng dần hoặc giảm dần, và gán cho mỗi giá trị một số nguyên tương ứng.
Ví dụ: Giả sử ta có bộ dữ liệu salary
gồm một biến salary
(lương). Ta muốn tạo một biến mới để xếp hạng các giá trị của biến này. Ta có thể sử dụng câu lệnh như sau:
proc rank data=salary out=new_salary;
var salary;
ranks rank_salary;
run;
Kết quả sau khi chạy câu lệnh này sẽ tạo ra một bộ dữ liệu mới có tên là new_salary
, chứa cả biến cũ salary
và biến mới rank_salary
chứa các giá trị xếp hạng tương ứng với các giá trị của biến salary
. Các giá trị được xếp hạng theo thứ tự tăng dần.