Giá trị R2 (R Square) là chỉ số đại diện cho năng lực giải thích của các biến độc lập lên một biến phụ thuộc của tập dữ liệu mẫu đang phân tích (Hair và cộng sự, 2019). R2 không phản ánh được năng lực dự báo của mô hình (predictive power) bởi tính dự báo sẽ liên quan đến tính chất dữ liệu ngoài mẫu nghiên cứu. Để đo lường được khả năng dự báo của mô hình, Stone (1974) và Geisser (1974) đã đề xuất ra chỉ số Q2 – Hệ số đánh giá năng lực dự báo ngoài mẫu (out-of sample predictive power).
1. Công thức tính Q2 trong SMARTPLS
Có hai phương pháp tính chỉ số Q2 trong SMARTPLS là cross-validated communality và cross-validated redundancy. Phương pháp cross-validated redundancy được nhiều tác giả như Wold (1982), Henseler và cộng sự (2012), Hair và cộng sự (2016) khuyến nghị sử dụng.
Công thức tính và tiến trình để tính toán ra chỉ số Q2 cực kỳ phức tạp. Bài viết này sẽ không đề cập tới công thức, phương thức tính để có được Q2, các bạn có thể tìm hiểu sâu bản chất của chỉ số trong cuốn “Phân tích dữ liệu: Áp dụng mô hình PLS-SEM” của Nguyễn Minh Hà và Vũ Hữu Thành (NXB Kinh tế TP.HCM, 2020).
Để thu được giá trị Q2 trong SMARTPLS, chúng ta sẽ sử dụng đến thủ tục dò tìm Blindfolding. Cứ có một biến có chức năng là “phụ thuộc” trong mô hình nghiên cứu, chúng ta sẽ tự xác định là có một mô hình thành phần tồn tại. Mỗi mô hình thành phần sẽ gồm: 1 biến phụ thuộc và 1 hoặc nhiều biến độc lập tác động lên biến phụ thuộc này. Như vậy, một mô hình cấu trúc tổng thể sẽ được cấu thành từ một hoặc nhiều mô hình thành phần.
2. Ngưỡng đánh giá hệ số Q2 trong SMARTPLS
Trong PLS-SEM, từng mô hình thành phần sẽ có một giá trị R2 đại diện cho mức độ giải thích của các biến độc lập lên biến phụ thuộc và đồng thời cũng có một giá trị Q2 đại diện cho mức độ dự báo của các biến độc lập lên biến phụ thuộc.
Tenenhaus và cộng sự (2005) đã nhận định Q2 được coi là chỉ số đánh giá chất lượng tổng thể của mô hình thành phần. Theo đó, nếu tất cả các mô hình thành phần đều có Q2 > 0, mô hình cấu trúc tổng thể của nghiên cứu cũng đạt chất lượng tổng thể.
Hair và cộng sự (2019) đưa ra các mức độ của Q2 tương ứng với khả năng dự báo của mô hình như sau:
0 < Q2 < 0.25: mức độ chính xác dự báo thấp
0.25 ≤ Q2 ≤ 0.5: mức độ chính xác dự báo trung bình
Q2 > 0.5: mức độ chính xác dự báo cao
3. Phân tích Blindfolding tìm hệ số Q2 trong SMARTPLS 3
Xét một mô hình nghiên cứu như sau:
Có 2 biến phụ thuộc trong mô hình là HL và GB. Như vậy mô hình cấu trúc tổng thể này gồm 2 mô hình thành phần. Chúng ta sẽ tìm 2 giá trị Q2 tương ứng của 2 mô hình thành phần.
Tại giao diện diagram SMARTPLS, nhấp vào Calculate > Blindfolding
Cửa sổ Blindfolding xuất hiện, nhập khoảng cách loại bỏ quan sát vào mục Omission Distance. Khoảng cách này từ 1 trở lên nhưng tốt nhất trong khoảng từ 5 đến 10 (Apel và Wold, 1982). Các tác giả phát triển phần mềm SMARTPLS khuyến nghị sử dụng mức 7 (giá trị mặc định). Một số trường hợp nếu mức 7 không sử dụng được cho Blindfolding, bạn có thể thử nhập các giá trị dao động quanh 7 như 6, 8, 9… Sau đó nhấp vào Start Calculation để tiến hành phân tích.
Output của Blindfolding xuất hiện, nhấp vào Construct Crossvalidaded Redundancy.
Chúng ta sẽ có được kết quả như sau:
Mô hình thành phần tương ứng của biến phụ thuộc GB có Q2 = 0.324 (nằm trong khoảng 0.25-0.5), như vậy mô hình này có tính chính xác dự báo trung bình. Trong khi đó, mô hình thành phần tương ứng biến phụ thuộc HL có Q2 = 0.657 (lớn hơn 0.5), như vậy mô hình này có tính chính xác dự báo cao.