Proc Rank

Binning biến sử dụng [Proc Rank](https://documentation.sas.com/?docsetId=proc&docsetTarget=p16s2o8e4bnqrin1phywxdaxqba7.htm&docsetVersion=9.4&locale=en)

Mục lục

Overview

Trong SAS, thủ tục proc rank được sử dụng để tạo ra một biến mới dựa trên việc xếp hạng các giá trị của một biến trong bộ dữ liệu. Thủ tục này cho phép chúng ta xác định vị trí của mỗi giá trị trong phân phối của biến, và gán cho nó một giá trị xếp hạng tương ứng.

Cú pháp chung của câu lệnh proc rank như sau:

proc rank data=dataset out=new_dataset;
  var variable;
  ranks new_variable;
run;

Trong đó:

  • dataset là tên bộ dữ liệu chứa biến cần xếp hạng.
  • new_dataset là tên của bộ dữ liệu mới được tạo ra, chứa cả biến cũ và biến mới được xếp hạng.
  • variable là tên của biến cần xếp hạng.
  • new_variable là tên của biến mới được tạo ra để lưu các giá trị xếp hạng.

Sau khi chạy câu lệnh proc rank, SAS sẽ tạo ra một biến mới có tên là new_variable, chứa các giá trị xếp hạng của biến variable. Các giá trị này được tính toán bằng cách sắp xếp các giá trị của biến variable theo thứ tự tăng dần hoặc giảm dần, và gán cho mỗi giá trị một số nguyên tương ứng.

Ví dụ: Giả sử ta có bộ dữ liệu salary gồm một biến salary (lương). Ta muốn tạo một biến mới để xếp hạng các giá trị của biến này. Ta có thể sử dụng câu lệnh như sau:

proc rank data=salary out=new_salary;
  var salary;
  ranks rank_salary;
run;

Kết quả sau khi chạy câu lệnh này sẽ tạo ra một bộ dữ liệu mới có tên là new_salary, chứa cả biến cũ salary và biến mới rank_salary chứa các giá trị xếp hạng tương ứng với các giá trị của biến salary. Các giá trị được xếp hạng theo thứ tự tăng dần.


Overview
Data Step
Data Aggregation
Data Visualization
Proc SQL
Variable Analysis
Macro
Model Regression
Variable Selection
Model Assessment