Monitoring Report Discriminatory

Hậu kiểm tính phân biệt của mô hình

Mục lục

Đánh giá sự phân biệt được chia thành hai loại: Đánh giá trên toàn dữ liệu và đánh giá theo từng biến.

Đánh giá sự phân biệt trên toàn bộ dữ liệu

Đánh giá sự phân biệt của từng biến

Sử dụng Macro

Syntax

Cú pháp chạy macro để output ra báo cáo ổn định của mô hình như sau:

%Let data_GB=
%Let varlist=	
%Let devday=
Proc format;
  /* score */
  Value scoreF 
run;
%Moni_DCRM;

Trong đó:

  • ds_in (data): Dữ liệu để kiểm định cần chứa tất cả các thông tin như sau:
    • Dữ liệu bao gồm thông tin train và outtime. Phân biệt bởi biến yearmonth có định dạng YYYYMM (ví dụ 202202 nghĩa là tháng 2 năm 2022).
    • Dữ liệu phải chứa các biến trong varlist dưới dạng WOE_ và GRP_. Ví dụ varlist=X1 X2 thì dữ liệu phải chứa WOE_X1 WOE_X2 GRP_X1 GRP_X2.
    • score là output từ mô hình.
    • Dữ liệu phải chứa biến Good/Bad ở dạng 0/1 là outcome của mô hình.
  • varlist (list): Các biến này sẽ được đưa vào báo cáo tính ổn định.
  • devday (YYYYMM): thể hiện cách phân tách dữ liệu train và outtime. Macro hiểu rằng nếu yearmonth <= devday thì dữ liệu và Development, còn lại là out of time.
  • weight (float=0.8) là trọng số để tính điểm đánh giá cuối cùng dựa trên điểm đánh giá của từng yearmonth.

Detail

Kết quả

Ví dụ

Ví dụ 1: Chạy báo cáo monitoring discriminatory với dữ liệu all_data bao gồm cả train và out of time (các dữ liệu phải có biến Good Bad).

%moni_dcrm(all_data, 201903,
	varlist=c_z1_m11_z1_min_c12
	c_z1_m10_z3_min_c12
	x2
	c_x10_x3
	z2_max_c9
	z1_m9
	z3_max_c12
	z2_min_c12
	z1_max_c12
	z1_m8
	z1_m7
	z1_m12
	x4
	z1_m6
	x5
	x3
	z1_m5
	x6);