1. Do người được phỏng vấn không trả lời
Nguyên nhân: Những câu hỏi quá dài, khó hiểu, liên quan đến vấn đề nhạy cảm hoặc cách thiết kế các câu hỏi dày đặt, không rõ ràng sẽ khiến người được khảo sát mệt mỏi nên đôi khi họ không đánh giá hoặc bỏ sót do không nhìn thấy.
Cách xử lý: Nếu missing chỉ ở một tỷ lệ nhỏ trong tập dữ liệu, cách lấp đầy các ô missing là sử dụng giá trị trung bình đáp án trả lời của câu hỏi đó. Ví dụ ở data gồm 10 quan sát hình bên dưới, biến TN4 ở quan sát số 6 có missing. Để xử lý chúng ta sẽ lấy trung bình cộng của 9 quan sát còn lại, làm tròn và điền vào ô thiếu giá trị. Trung bình cộng của 9 quan sát là (3+4+3+5+2+3+5+1+5)/9 = 3.4444. Làm tròn là 3, như vậy điền 3 vào ô còn thiếu.
2. Do tính chất câu hỏi
Nguyên nhân: Một số dạng câu hỏi được thiết kế nếu đáp viên không có câu trả lời thì sẽ để trống, việc này làm xuất hiện missing trong data.
Cách xử lý: Khi thiết kế đáp án, bổ sung thêm đáp án “Không có câu trả lời”. Ví dụ, chúng ta có câu hỏi như sau: Anh/Chị đã từng sử dụng điện thoại của hãng nào rồi? (Tích vào lựa chọn)
1. Apple ◻
2. Samsung ◻
3. Huawei ◻
1. Apple ◻ 1. Rồi ◻ 0. Chưa
2. Samsung ◻ 1. Rồi ◻ 0. Chưa
3. Huawei ◻ 1. Rồi ◻ 0. Chưa
Nếu đáp viên chưa dùng sản phẩm của Apple thì sẽ tích vào ô 0 – Chưa. Khi nhập liệu, thay vì để ô trống thì hãy nhập vào số 0. Ở hình thức câu ban đầu bạn để 1 ô vuông như vậy cũng được, đến khi nhập liệu, nếu đáp viên không tích thì bạn sẽ nhập vào số 0. Tuy nhiên, cách nhập liệu như vậy sẽ khiến bạn mất thời gian để suy nghĩ giá trị cần nhập vào là bao nhiêu thay vì con số trực quan như hình thức câu số 2.
3. Do lỗi hàng trống cuối dữ liệu
Nguyên nhân: Vô tính việc xóa giá trị ở các hàng cuối hoặc vấn đề khi thao tác dẫn đến các hàng cuối của dữ liệu bị trống nhưng SPSS vẫn báo là missing. Đây là một lỗi khá phổ biến.