Trong nhiều trường hợp chúng ta cần tìm mối tương quan giữa các biến tiềm ẩn (latent variable/construct) cũng như tương quan giữa các biến quan sát (item/observed variable/indicator) trong SMARTPLS. Vậy xem chỉ số tương quan ở đâu, chúng ta sẽ đi vào nội dung chi tiết bên dưới.
1. Chạy phân tích ước lượng để lấy hệ số tương quan trên SMARTPLS
Hệ số tương quan sẽ được lấy từ kết quả phân tích PLS Algorithm. Tại giao diện diagram, chúng ta nhấp vào Calculate > PLS Algorithm.
Bài viết này sẽ sử dụng các thuật ngữ của PLS-SEM, để hiểu được chính xác nội dung, bạn vui lòng xem trước bài viết Mô hình cấu trúc và mô hình đo lường trong PLS-SEM. Cửa sổ Partial Least Squares Algorithm xuất hiện, tiến hành thiết lập phân tích mô hình ước lượng SMARTPLS như sau:
Tiếp tục nhấp vào Start Calculation ở góc phải bên dưới để tiến hành phân tích.
2. Đọc kết quả tương quan trên SMARTPLS
2.1 Tương quan giữa các biến tiềm ẩn trong SMARTPLS
Tại cửa sổ output của PLS Algorithm, nhấp vào Latent Variable.
Lúc này ở khung kết quả phía trên sẽ xuất hiện các tab kết quả liên quan đến biến tiềm ẩn. Chúng ta sẽ chuyển sang tab Latent Variable Correlations.
Đây chính là bảng hệ số tương quan giữa các biến tiềm ẩn hay các cấu trúc trong mô hình. Cấu trúc trình bày bảng dạng ma trận khá cơ bản với đường chéo mang giá trị tương quan là 1 do biến đó tương quan với chính nó. Các giá trị còn lại là tương quan giữa các cặp biến với nhau. Ví dụ: tương quan giữa DK với CV là 0.307, giữa GV với CV là 0.519….
Để kiểm định mối tương quan có ý nghĩa thống kê hay không, chúng ta sẽ cần thực hiện phân tích bootstrapping trên SMARTPLS. Quay lại giao diện diagram, chúng ta nhấp vào Calculate > Bootstrapping.
Cửa sổ Bootstrapping xuất hiện, tiến hành thiết lập phân tích bootstrap SMARTPLS như mặc định, riêng phần Amout of Results, chọn vào Complete Bootstrapping.
Nhấp vào Start Calculation để tiến hành phân tích bootstrap trên SMARTPLS.
Output kết quả Bootstrap xuất hiện, nhấp vào Laten Variable Correlations.
Đây là bảng kết quả kiểm định tương quan giữa các cặp biến.
- Original Sample là hệ số tương quan của mẫu gốc.
- Sample Mean là trung bình hệ số tương quan của mẫu bootstrap (trung bình cộng 1000 giá trị Original Sample của 1000 mẫu bootstrap).
- P Values là giá trị sig đánh giá mức ý nghĩa thống kê của hệ số tương quan. Trong ví dụ này có hai mối tương quan không có ý nghĩa thống kê là TL với CV và TL với DK do P Value lớn hơn 0.05 (ở mức ý nghĩa 5%). Các mối tương quan khác đều có ý nghĩa thống kê.
Tương quan của biến tiềm ẩn chúng ta sẽ dùng đến trong trường hợp:
– Cần đánh giá tương quan giữa các cấu trúc trong mô hình: cặp biến nào có quan hệ mạnh/yếu, quan hệ thuận/nghịch.
– Trong trường hợp xảy ra cộng tuyến hoặc vi phạm tính phân biệt, chúng ta sẽ dựa vào bảng ma trận tương quan này để xác định cặp nhân tố nào có tương quan quá cao để xử lý. Hướng xử lý đó là loại bỏ một trong hai nhân tố (còn gọi là biến tiềm ẩn hoặc cấu trúc) có tương quan mạnh nếu cộng tuyến quá nặng/vi phạm tính phân biệt nặng. Trường hợp vi phạm không quá lớn, chúng ta sẽ loại lần lượt các biến quan sát có tương quan mạnh giữa các cấu trúc nhân tố với nhau. Chúng ta sẽ tiếp tục đi tới mục 2.2 ngay bên dưới.
2.2 Tương quan giữa các biến quan sát trong SMARTPLS
Tại cửa sổ output của PLS Algorithm, nhấp vào Indicator Data (Correlations).
Lúc này ở khung kết quả phía trên sẽ xuất hiện các tab kết quả liên quan đến tương quan của biến quan sát. Chúng ta sẽ xem ở tab đầu tiên Empirical Correlation Matrix.
Bảng kết quả này sẽ hiển thị hệ số tương quan giữa tất cả các biến quan sát trong mô hình. Ví dụ: tương quan giữa CV1 với CV2 là 0.407, giữa CV1 với DK1 là 0.089….
Hiện SMARTPLS chưa hỗ trợ kiểm định ý nghĩa thống kê tương quan giữa các biến quan sát.
Tương quan của biến quan sát chúng ta sẽ dùng đến trong trường hợp:
– Cần đánh giá tương quan giữa các biến quan sát trong mô hình: cặp biến nào có quan hệ mạnh/yếu, quan hệ thuận/nghịch.
– Như đã đề cập ở phần tương quan biến tiềm ẩn, khi xảy ra tình trạng vi phạm tính phân biệt hoặc hiện tượng cộng tuyến, nghĩa là trong mô hình tồn tại một hoặc một vài cặp biến có tương quan quá mạnh. Để xử lý 2 loại vi phạm này, chúng ta hoặc loại cả một nhân tố hoặc loại dần các biến quan sát bên trong nhân tố. Tối ưu nhất vẫn là loại các biến quan sát trước, tới khi nào loại hết các biến quan sát rồi mà vẫn còn cộng tuyến hoặc vi phạm tính phân biệt, chúng ta mới loại cả một nhân tố.