Mục lục
Object trong SAS thường chỉ bao gồm bảng (dữ liệu - data). Điều này khá khác biệt với các phần mềm thống kê khác như R hoặc Python khi mà Object có thể gồm Array, List, … Tên của bảng trong SAS có cấu trúc như sau:
LIBRARY.DATA
Trong đó
LIBRARYlà tên của thư viện (đã được đề cập ở mục trước). Chú ý rằng nếu dữ liệu ở trong thư việcWORKthì có thể bỏ phầnLIBRARYđi. Khi đó tên dữ liệu chỉ cần viết DATA.-
DATAlà tên của dữ liệu. Quy tắc đặt tên dữ liệu trong SAS như sau:- Độ dài tối đa 32 ký tự.
- Không được chứa ký tự đặc biệt ngoài trừ gạch dưới (_).
- Phải bắt đầu bằng chữ cái Latin (A-Z) hoặc gạch dưới (_).
- Độ dài tối đa 32 ký tự.
Dữ liệu bao gồm các biến. Ví dụ về các biến trong dữ liệu được cho dưới đây:
Quy tắc đặt tên biến tương tự với quy tắc đặt tên dữ liệu:
- Độ dài tối đa 32 ký tự.
- Không được chứa ký tự đặc biệt ngoài trừ gạch dưới (_).
- Phải bắt đầu bằng chữ cái Latin (A-Z) hoặc gạch dưới (_).
Các biến trong SAS có hai định dạng là dạng chữ hoặc dạng số. Trong đó dạng số có một số hình thái khác là dạng thời gian hoặc tiền tệ. Các biến có định dạng - format là cách thức các biến hiển trị trong các báo cáo/ dữ liệu trong SAS. Tên định dạng của các loại biến được cho như sau:
- Biến chữ:
$FORMATw.biến chữ có độ dài là w. - Biến số:
FORMATw.dhiển thị w số trước dấu phảy là d số sau dấu phảy. - Biến thời gian:
FORMATw.hiển thị w số trước dấu phảy.
Bảng sau đây ví dụ về một số định dạng và cách hiển thị dữ liệu tương ứng.
Mỗi biến có ba tham số quan trọng. Để đặt các tham số này ta dùng lệnh ATTRIB (attribute) như sau:
ATTRIB VAR_NAME FORMAT= LABEL= LENGTH=;
Trong đó:
VAR_NAMElà tên của biến thoả mãn quy tắc đặt tên.FORMATlà định dạng của biến theo nội dung phía trên.LABELlà label của biến là ký tự sẽ hiển thị khi report dữ liệu. Label của biến có thể đặt tuỳ ý. Ví dụ SUM OF MATH AND PHYSICS;LENGTHlà độ dài của biến.