Tổng quan
SAS (viết tắt của Statistical Analysis System) là một hệ thống tích hợp các sản phẩm phần mềm thương mại cung cấp bởi SAS Institute Inc. SAS cung cấp nhiều gói phần mềm khác nhau. Giá cả các gói là khá đắt so với người dùng cá nhân. Tuy nhiên SAS cũng cung cấp các gói miễn phí như SAS University. SAS được viết bằng C, chạy trên các hệ điều hành: Winhdows, IBM mainframe, Unix/Linux, OpenVMS Alpha.
SAS cho phép thực hiện:
- Nhập, truy cập, quản lý và khai thác dữ liệu
- Xuất báo cáo bằng văn bản và đồ họa
- Phân tích thống kê
- Lập kế hoạch kinh doanh, dự báo, và ra quyết định hỗ trợ
- Hoạt động nghiên cứu và quản lý dự án
- Cải tiến chất lượng
- Các ứng dụng phát triển
- Kho dữ liệu (trích xuất, chuyển đổi, tải)
- Nền tảng điện toán độc lập và từ xa
Chương trình SAS là sự kết hợp giữa Point and Click và Coding. Khi sử dụng, người dùng có thể sử dụng công cụ được thiết kế sẵn (Point and click) hoặc tuỳ biến linh hoạt (coding). Sơ đồ dưới đây minh hoạ các gói phần mềm và cách thức sử dụng:
Ưu điểm và nhược điểm
Ưu điểm
Hiện tại, thị phần SAS chiếm không nhiều. Tuy nhiên, ngôn ngữ lập trình SAS có các lợi thế như sau so với các phầm mềm khác:
- SAS là phầm mềm thương mại. Do đó các gói lệnh (procedure) đều được tối ưu về thuật toán và tính chính xác cao. Các tổ chức lớn (ngân hàng) ưu tiên sử dụng SAS do sự chính xác (ví dụ có xảy ra lỗi có thể bắt đền. Với các phần mềm miễn phí thì không thể làm điều này). Theo quan điểm cá nhân của mình thì trong tương lai (khi các bank đủ khả năng kinh tế) sẽ chuyển sang dùng SAS thay cho các phần mềm miễn phí.
- Cộng đồng sử dụng SAS khá đông đảo. SAS cũng hay tổ chức các buổi training (Ví dụ Credit Scoring) và hội thảo. Bạn đọc có thể tìm thấy rất nhiều paper về SAS ở đây: SAS Global Forum, SAS Conference Proceedings hoặc các cộng đồng về SAS SAS Communities.
- SAS là phần mềm chuyên về xử lý dữ liệu bảng. Một số task xử lý trên SAS cho tốc độ cao hơn so với trên các phần mềm khác. Ngoài ra SAS cũng chuẩn bị sẵn các công cụ để tính toán hiệu năng cao SAS High Performance
Nhược điểm
SAS cũng có những nhược điểm so với các phần mềm khác:
- SAS Base không hỗ trợ tính toán ma trận. Để tính toán ma trận trên SAS cần phải mua thêm gói mới là SAS IML. Do đó, việc lập trình thực sự trên SAS là khá khó.
- SAS Base không có sẵn các gói với các thuật toán machine learning (phải mua thêm SAS Miner). Do đó, SAS có vẻ “lạc hậu” so với các phần mềm như R hoặc Python. Điều này cũng gây khó khăn cho các bạn muốn nghiên cứu thuật toán Machine Learning trên dữ liệu.
Kết luận
Với các ưu điểm và nhược điểm trên, SAS phù hợp với các đối tượng như sau:
- Các tổ chức ngân hàng (đặc biệt phù hợp)
- Các bạn nghiên cứu với các mô hình thống kê cơ bản.
- Hay phải xử lý các dữ liệu lớn.