Phân tích thống kê đã và đang là một công cụ thiết yếu cho
các nhà nghiên cứu khoa học xã hội trong hơn một thế kỷ qua. Ứng dụng của
phương pháp thống kê đã mở rộng đáng kể với sự ra đời của phần cứng và phần mềm
máy tính, đặc biệt trong những năm gần đây với khả năng truy cập rộng rãi vào
nhiều phương pháp hơn do giao diện thân thiện với người dùng với kiến thức được
cung cấp công nghệ. Các nhà nghiên cứu ban đầu dựa vào phân tích đơn biến và
song biến để hiểu dữ liệu và các mối quan hệ. Để hiểu được các mối quan hệ phức
tạp hơn liên quan đến các hướng nghiên cứu hiện tại trong các ngành khoa học xã
hội, chúng ta cần phải áp dụng các phương pháp phân tích dữ liệu đa biến phức tạp
hơn.
Mô hình cấu trúc tuyến tính hay còn gọi là SEM (Structural
Equation Modeling) là một kỹ thuật phân tích thống kê thế hệ thứ hai được phát
triển để phân tích mối quan hệ đa chiều giữa nhiều biến trong một mô hình
(Haenlein & Kaplan, 2004). Đa quan hệ giữa các biến có thể được biểu diễn
trong một loạt các phương trình hồi quy đơn và bội. Kỹ thuật mô hình cấu trúc
tuyến tính sử dụng kết hợp dữ liệu định lượng và các giả định tương quan
(nguyên nhân – kết quả) vào mô hình. Với SEM, các nhà nghiên cứu có thể kiểm tra
trực quan các mối quan hệ tồn tại giữa các biến quan tâm để ưu tiên các nguồn lực
để phục vụ khách hàng tốt hơn. Thực tế là các biến tiềm ẩn khó đo lường có thể
được sử dụng trong SEM làm cho nó lý tưởng để giải quyết các vấn đề nghiên cứu
kinh doanh. SEM là một kỹ thuật thống kê mạnh mẽ hơn để giải quyết các yêu cầu
sau:
1. Phân tích nhiều mô hình hồi quy bội một cách đồng thời;
2. Phân tích hồi quy với bài toán đa cộng tuyến;
3. Phân tích phân tích đường dẫn với nhiều biến phụ thuộc;
4. Mô hình hóa mối quan hệ đa chiều giữa các biến trong một
mô hình.
Có một số cách tiếp cận khác nhau đối với SEM. Cách tiếp cận đầu tiên
là SEM dựa trên hiệp phương sai (CB-SEM), sử dụng các gói phần mềm như AMOS,
EQS, LISREL và MPlus. Cách tiếp cận thứ hai là bình phương nhỏ nhất một phần
(PLS), tập trung vào phân tích phương sai và có thể được thực hiện bằng
PLS-Graph, VisualPLS, SmartPLS và WarpPLS. Nó cũng có thể được sử dụng bằng
cách sử dụng mô-đun PLS trong gói phần mềm thống kê của “r”. Cách tiếp cận thứ
ba là một SEM dựa trên thành phần được gọi là Phân tích thành phần cấu trúc tổng
quát (GSCA); nó được triển khai thông qua VisualGSCA hoặc một ứng dụng dựa trên
web có tên GeSCA. Một cách khác để thực hiện SEM được gọi là Mô hình quan hệ cấu
trúc phổ tuyến tính phi tuyến (NEUSREL), sử dụng phần mềm NEUSREL dòng nhân quả
phân tích. Đối mặt với các cách tiếp cận khác nhau để mô hình hóa đường dẫn,
chúng ta phải xem xét các ưu điểm và nhược điểm của chúng để chọn một phương
pháp phù hợp.
Tuy nhiên, hiện nay các nhà nghiên cứu thường sử dụng hai
phương pháp chủ yếu để phân tích mô hình cấu trúc tuyến tính SEM, đó là: CBSEM
và PLS-SEM (hay còn được gọi là mô hình đường dẫn PLS). CBSEM chủ yếu được sử dụng
để xác nhận (hoặc từ chối) các lý thuyết (nghĩa là, một tập hợp các mối quan hệ
giữa nhiều biến có thể được kiểm định bởi thực nghiệm). Nó thực hiện điều này bằng
cách xác định một mô hình lý thuyết được đề xuất có thể ước tính ma trận hiệp
phương sai cho một tập dữ liệu mẫu tốt đến mức nào. Ngược lại, PLS-SEM chủ yếu
được sử dụng để phát triển các lý thuyết trong nghiên cứu khám phá. Nó thực hiện
điều này bằng cách tập trung vào giải thích phương sai trong các biến phụ thuộc
khi kiểm tra mô hình.