Mục lục
Đánh giá sự phân biệt được chia thành hai loại: Đánh giá trên toàn dữ liệu và đánh giá theo từng biến.
Đánh giá sự phân biệt trên toàn bộ dữ liệu
Đánh giá sự phân biệt của từng biến
Sử dụng Macro
Syntax
Cú pháp chạy macro để output ra báo cáo ổn định của mô hình như sau:
%Let data_GB=
%Let varlist=
%Let devday=
Proc format;
/* score */
Value scoreF
run;
%Moni_DCRM;
Trong đó:
ds_in
(data): Dữ liệu để kiểm định cần chứa tất cả các thông tin như sau:- Dữ liệu bao gồm thông tin train và outtime. Phân biệt bởi biến yearmonth có định dạng YYYYMM (ví dụ 202202 nghĩa là tháng 2 năm 2022).
- Dữ liệu phải chứa các biến trong
varlist
dưới dạng WOE_ và GRP_. Ví dụvarlist
=X1 X2 thì dữ liệu phải chứa WOE_X1 WOE_X2 GRP_X1 GRP_X2. - score là output từ mô hình.
- Dữ liệu phải chứa biến Good/Bad ở dạng 0/1 là outcome của mô hình.
varlist
(list): Các biến này sẽ được đưa vào báo cáo tính ổn định.devday
(YYYYMM): thể hiện cách phân tách dữ liệu train và outtime. Macro hiểu rằng nếu yearmonth <=devday
thì dữ liệu và Development, còn lại là out of time.weight
(float=0.8) là trọng số để tính điểm đánh giá cuối cùng dựa trên điểm đánh giá của từng yearmonth.
Detail
Kết quả
Ví dụ
Ví dụ 1: Chạy báo cáo monitoring discriminatory với dữ liệu all_data bao gồm cả train và out of time (các dữ liệu phải có biến Good Bad).
%moni_dcrm(all_data, 201903,
varlist=c_z1_m11_z1_min_c12
c_z1_m10_z3_min_c12
x2
c_x10_x3
z2_max_c9
z1_m9
z3_max_c12
z2_min_c12
z1_max_c12
z1_m8
z1_m7
z1_m12
x4
z1_m6
x5
x3
z1_m5
x6);