SAS Enterprise Miner

Giới thiệu về giao diện SAS Enterprise Miner

SAS Enterprise Guide là phần mềm phổ biến nhất cho các doanh nghiệp. SAS EG có một số ưu điểm như sau:

  • Dễ dàng tổ chức thành các Project.
  • Tạo các Process Flow.
  • Sử dụng linh hoạt giữa coding và các công cụ kéo thả thích hợp sẵn.
  • Tích hợp nhiều tiện tích để quản lý file: Tự động lưu (auto save), kiểm soát phiên bản (version control), kết nối với GitHub.

Giao diện

Sau khi mở chương trình, SAS Enterprise có giao diện như sau:

SAS Enterprise Guide
Giao diện SAS Enterprise Guide

Chi tiết về các phần như sau:

Menu chứa các tiện tích

SAS Enterprise Guide
Giao diện SAS Enterprise Guide

Project ở dạng cây thể hiện cấu trúc của một Project. Mỗi Project có nhiều Process Flow và trong mỗi Process Flow lại có các Programs.

SAS Enterprise Guide
Giao diện SAS Enterprise Guide

Library chứa các thư viện.

SAS Enterprise Guide
Giao diện SAS Enterprise Guide

Thư viện trong SAS là nơi lưu trữ dữ liệu. Có ba dạng thư viện như sau:

  • Thư việc tạm có tên mặc định là WORK. Thư viện được tạo ra khi khởi động chương trình SAS. Các dữ liệu trong thư viện này sẽ mất khi đóng chương trình SAS.
  • Thư viện hệ thống gồm các thư viện SASHELP, MAPSSAS là các thư viện tích hợp sẵn của SAS. Các thư viện này chưa các thông tin do SAS cung cấp. Dữ liệu về bản đồ được chứa trong MAPSSAS và các dữ liệu ví dụ được cung cấp trong thư viện SASHELP. Các dữ liệu trong thư mục này không bao giờ bị mất.
  • Thư viện tự tạo do người dùng tạo ra. Để tạo thư viện, ta dùng lệnh
		LIBNAME DATA "PATH";

Trong đó DATA là tên thư viện và PATH là đường dẫn đến thư mục chứa dữ liệu (ví dụ E:\textbackslash THANHTRA254\textbackslash SASPROJECT\textbackslash DATA)

Project Flow chứa các chương trình. Các chương trình có thể kết nối với nhau bằng mũi tên để chương trình SAS chạy theo thứ tự đó. Trong Project Flow cũng trình bày Ouput của mỗi chương trình (bằng mũi tên đi ra)

SAS Enterprise Guide
Giao diện SAS Enterprise Guide

Program là phần dùng để gõ code và chạy chương trình.

SAS Enterprise Guide
Giao diện SAS Enterprise Guide

Phần này có 4 tab như sau:

  • Code là phần dùng để gõ code.
  • Log là phần thông báo về tiến trình chạy chương trình. Mục Log sẽ đưa ra các phần như sau:

  • Notes: Các thông báo về chương trình. Ví dụ dữ liệu output có bao nhiêu quan sát. Các nội dụng ở phần Note sẽ có màu xanh.
    • Warnings: Các vấn đề không làm chương trình sai nhưng cần cẩn trọng. Các nội dung ở phần này sẽ có màu vàng.
    • Errors: Các vấn đề làm chương trình sai và không thể chạy tiếp được. Các nội dung sẽ có màu đỏ
  • Result là các kết quả của chương trình. Ví dụ kết quả của \textbf{PROC PRINT}.
  • Output Data là các dữ liệu kết quả của việc chạy chương trình. Một chương trình có thể output ra nhiều dữ liệu. Chú ý rằng khi mở dữ liệu, SAS có hỗ trợ một số công cụ để phân tích dữ liệu nhanh ví dụ như WHERE để lọc dữ liệu.

Coding in SAS

Một số cài đặt


Overview
Data Step
Data Aggregation
Data Visualization
Proc SQL
Variable Analysis
Macro
Model Regression
Variable Selection
Model Assessment