Trong quá trình phân tích dữ liệu mẫu, gần như chúng ta luôn gặp không ít khó khăn khi các số liệu có trục trặc làm chúng ta đau đầu. Trong bài viết dưới đây, Best4Team sẽ chia sẻ bí quyết giúp các bạn chỉnh sửa dữ liệu SPSS chuẩn nhất để khắc phục những lỗi thường gặp nhanh nhất. Hãy tham khảo ngay! 

Cẩm Nang 7 Cách Sửa Dữ Liệu SPSS Đầy Đủ Nhất
Cẩm Nang 7 Cách Sửa Dữ Liệu SPSS Đầy Đủ Nhất

7 trường hợp thường gặp mà bạn cần chỉnh sửa dữ liệu SPSS, chi tiết bao gồm: 

  • Hệ số Cronbach Alpha nhỏ hơn 0.6
  • Tương quan biến tổng nhỏ hơn 0.3
  • EFA bị lỗi không xác định dương
  • EFA không thỏa các yêu cầu kiểm định
  • Ma trận xoay xoay lung tung, nhân tố bị loại/gộp không theo ý muốn
  • Giá trị R hiệu chỉnh rất thấp
  • Các dữ liệu dạng số bị lỗi   

Trong các lỗi trên đây ít nhiều đã gây ra cho chúng ta những cản trở khi chạy các kiểm định trong SPSS, ở đây chúng tôi sẽ đưa ra các giải pháp chung nhất cho từng lỗi, bạn có thể tham khảo và ứng dụng cho từng trường hợp thực tế đã gặp phải. 

1. Hệ số Cronbach Alpha nhỏ hơn 0.6

Thực hiện kiểm định Cronbach Alpha (CA) là bước đầu tiên khi thực hiện phân tích định lượng với SPSS. Khi một nhân tố trong CA mà bạn đưa ra sẽ bao gồm nhiều biến quan sát nhỏ, các biến quan sát này phản ánh được tính chất của nhân tố mẹ thì khi đó giá trị CA sẽ cao và giá trị CA nhỏ hơn 0.6 đồng nghĩa thang đo không đạt yêu cầu.

3 nguyên nhân làm cho Cronbach Alpha bị lỗi: 

  • Do số liệu thu thập không đảm bảo tính trung thực: Người được khảo sát trả lời bảng khảo sát một cách bừa bãi, đánh cho có hoàn thành,…
  • Do thiết kế nội dung câu hỏi không phù hợp.
  • Do nội dung của các câu hỏi trong cùng một nhân tố không có liên quan nhiều với nhau, không có sự đóng góp cho cùng một nội dung.
Dữ liệu SPSS bị lỗi hệ số Cronbach Alpha nhỏ hơn 0.6
Dữ liệu SPSS bị lỗi hệ số Cronbach Alpha nhỏ hơn 0.6

2 cách sửa dữ liệu SPSS bị lỗi hệ số Cronbach Alpha < 0.6: 

  • Cách 1: Loại những câu hỏi có hệ số tương quan biến tổng bé hơn 0.3.
  • Cách 2: Xác định lại chất lượng các câu hỏi để khảo sát thêm số liệu, hoặc giảm bớt số liệu:
  • Quan sát nhân tố con có phản ánh được tính chất của nhân tố mẹ hay không.
  • Những câu hỏi nào không có cơ sở lý luận nguồn gốc rõ ràng cần được loại bỏ, chỉnh sửa lại bảng câu hỏi và khảo sát lại.
  • Rất khó để khảo sát lại do nhiều yếu tố khách quan, vậy nên cần tập trung loại bỏ những bảng câu hỏi xấu đi để cải thiện số liệu hơn.

2. Tương quan biến tổng nhỏ hơn 0.3 

Tương quan biến tổng cho biết các số liệu hiện tại có đóng góp nhiều hay ít cho thang đo chung hay không. Số liệu nào không đóng góp nhiều thì hệ số tương quan biến tổng nghĩa là nhỏ hơn 0.3 thì phải loại bỏ ngay vì có khả năng dữ liệu này sẽ tạo thành những “biến rác” nếu đưa vào phân tích trong SPSS.

Để làm sạch các dữ liệu trong tương quan biến tổng duy chỉ có cách là loại bỏ các biến yếu, vậy dựa vào đâu để biết đó là biến cần xóa? Hãy tham khảo một số ngưỡng được đề xuất bởi các chuyên gia để biết ngưỡng mức bao nhiêu thì chúng ta sẽ phải loại các biến số liệu có quan sát yếu:

  • 0.30 by Nunnally, J. C., & Bernstein, I. H. (1994)
  • 0.30 by Cristobal et al. (2007)
  • 0.40 by Loiacono et al. (2002)
  • 0.50 by Francis and White (2002) and Kim and Stoel (2004)

2 lưu ý khi chọn ngưỡng mức để loại bỏ các biến quan sát yếu: 

– Tầm trên 7 quan sát thì chọn ngưỡng 0.4 hoặc 0.5 để chọn ra được các biến quan sát tốt nhất. 

– Nếu thang đo ít biến quan sát thì nên chọn mức 0.3 để giữ lại nhiều biến quan sát nhất có thể vì các biến này cũng phản ánh được một số đặc điểm của nhân tố mẹ.

3. EFA bị lỗi không xác định dương

Không xác định dương là một lỗi thường xuyên gặp phải trong SPSS bởi 3 lý do xuất hiện lỗi này thường là:

  •  Trong dữ liệu của có sự chồng chéo giữa các nhân tố độc lập với nhau. 
  • Giá trị các biến quan sát của nhân tố độc lập 1 khá giống với giá trị các biến quan sát 2, 3, 4… 
  • Sự trùng lắp này quá nhiều làm cho tính phân biệt trong EFA bị loại bỏ, nên khi chạy kiểm định trong SPSS sẽ hiển thị lỗi “This matrix is not positive definite”.
Số liệu SPSS bị lỗi EFA bị lỗi không xác định dương
Số liệu SPSS bị lỗi EFA bị lỗi không xác định dương

3 cách sửa dữ liệu SPSS để EFA không bị lỗi 

  • Tìm và loại bớt các biến có tương quan mạnh với nhau vì chúng có sự trùng lắp dữ liệu. 
  • Nếu không thể loại bỏ câu hỏi, thì bạn chỉ còn cách phải thay đổi số liệu và đừng để số liệu biến quan sát này giống đến hơn 70% số liệu biến quan sát trong nhân tố khác.
  • Ngoài ra, để nhận biết biến nào đang trùng lặp dữ liệu đó là sử dụng tương quan Pearson với giá trị sig < 0.05, cặp nhân tố nào có tương quan r từ 0.6 trở lên thì đồng nghĩa giữa 2 biến đang có sự trùng lặp dữ liệu đáng kể.
Trong quá trình nghiên cứu dùng SPSS để thực hiện, đôi khi bạn sẽ gặp khó khăn khi số liệu khảo sát thu được không như mong muốn hay thậm chí  là “không đẹp” để chạy kiểm định. Do đó, Best4Team đã tổng hợp bài viết cách fake dữ liệu SPSS để giúp bạn thuận tiện thực hiện đề tài. Hãy tham khảo ngay!

4.  EFA không thỏa các yêu cầu kiểm định

Một lỗi phổ biến hay thường gặp là EFA không thỏa yêu cầu kiểm định bởi một số nguyên nhân chủ quan và khách quan dẫn đến tình trạng số nhân tố được trích từ EFA ít hơn hoặc nhiều hơn so với lý thuyết ban đầu và kết quả thu được số liệu là không thỏa yêu cầu kiểm định như mong muốn.

3 lý do chính khiến bạn gặp lỗi EFA không thỏa điều kiện trong SPSS:

  • Người nghiên cứu: Nhập liệu bị lỗi, không làm sạch dữ liệu trước khi thực hiện phân tích, chọn phương pháp xoay, trích không phù hợp,… 
  • Bảng khảo sát: Khi xây dựng câu hỏi khảo sát, người nghiên cứu xây dựng câu hỏi không rõ ràng dẫn đến tình trạng người trả lời hiểu nhầm nội dung, do vậy mà câu trả lời của họ không chính xác. 
  • Người được khảo sát: Không hợp tác khi khảo sát như trả lời cho qua, bao lô, không chú tâm vào nội dung câu hỏi,…

Đối với trường hợp thứ tư này, để sửa dữ liệu SPSS thì người nghiên cứu cần: 

– Bước 1: Làm thật tốt phần chuẩn bị để có bảng câu hỏi chất lượng, cụ thể như: 

  • Xác định đúng mục đích và đối tượng cần khảo sát.
  • Thiết kế bảng hỏi thật ngắn gọn và dễ hiểu.
  •  Không được thêm hay bớt câu hỏi theo cảm tính, tất cả phải dựa vào cơ sở lý luận.
  • Nên tham khảo ý kiến của chuyên gia, giảng viên, người có kinh nghiệm.
  • Vận dụng  lồng ghép vào các câu hỏi “gài” và câu hỏi “đảo đáp án”.

– Bước 2: Lựa chọn phương pháp lấy mẫu phù hợp, áp dụng kỹ thuật câu hỏi gài để loại bỏ phiếu khảo sát kém chất lượng, làm sạch dữ liệu trước khi đi vào phân tích trong SPSS. 

5. Ma trận xoay lung tung, nhân tố bị loại/gộp không theo ý muốn.

Trong ma trận xoay khi phân tích nhân tố khám phá, các biến quan sát đều bị chạy nhảy lung tung, từ 4 nhân tố lại biến thành 5, 6, 7,…nhân  tố, biến quan sát nhóm này bị gộp chung với nhóm khác, các nhân tố ban đầu gần như bị mất có thể do  2 nguyên nhân phổ biến dẫn đến lỗi:

  • Các biến quan sát trong nhóm này lại tương đồng giá trị với các biến quan sát của nhóm khác. 
  • Người được khảo sát thì họ trả lời qua loa nên dẫn đến số liệu có quá nhiều trục trặc xảy ra.

Để sửa lỗi ma trận xoay lung tung trong SPSS, chúng ta sẽ thực hiện theo 3 bước sau: 

  • Bước 1: Chạy thống kê trung bình để kiểm tra xem có biến nào có giá trị bị lỗi không trùng đáp án trong thang đo không, hoặc biến nào có dấu hiệu bất thường về mean, min, max, độ lệch chuẩn hay không.
  • Bước 2: Thực hiện quy tắc loại biến biến xấu trong EFA để loại đi các biến rác và nên thử việc loại lần lượt với loại từng biến để xem trường hợp nào ma trận xoay tốt hơn, cái nào tốt hơn thì thực hiện. 
Kết quả ma trận xoay quy tắc loại biến biến xấu trong EFA
Kết quả ma trận xoay quy tắc loại biến biến xấu trong EFA
  • Bước 3: Nếu biến bị loại quá nhiều và thang đo không cải thiện được nhiều, hãy thử thực hiện việc tìm kiếm và loại bỏ các quan sát kém (bản khảo sát không đi theo xu hướng chung của dữ liệu) bằng biểu đồ boxplot, scatter…
Biểu đồ Scatter 
Biểu đồ Scatter
Việc cần làm sau khi chúng ta thu được các dữ liệu khảo sát đó là nhập số liệu và tạo biến trong SPSS. Vậy làm thế nào để tạo các biến chuẩn chỉnh và hợp lý nhất? Hãy truy cập ngay bài viết cách tạo biến mới trong SPSS của Best4Team để hiểu rõ hơn về cách làm sao cho tối ưu nhất.

6. Giá trị R hiệu chỉnh rất thấp

Giá trị R bình phương hiệu chỉnh phản ánh mức độ giải thích biến phụ thuộc của các biến độc lập. Giá trị càng cao nghĩa là các biến độc lập bạn trong mô hình càng tốt thường nằm trong mức 0.5 – 1. Nếu trường hợp mức trung gian dưới 0.5 đồng nghĩa các biến độc lập không phù hợp với nghiên cứu.

Dữ liệu SPSS có giá trị R hiệu chỉnh rất thấp
Dữ liệu SPSS có giá trị R hiệu chỉnh rất thấp

Để khắc phục lỗi và tăng R hiệu chỉnh trong SPSS thì chúng ta cần rà soát lại toàn bộ dữ liệu, những bảng câu hỏi nào là “dữ liệu rác” thì cần loại đi, cụ thể như ví dụ minh họa phía dưới.

Ví dụ như giả thuyết ban đầu các biến độc lập của bạn đều tác động tích cực đến biến phụ thuộc nhưng kết quả khảo sát có biến độc lập giá trị thiên về giá trị đồng ý, rất đồng ý và biến phụ thuộc lại là rất không đồng ý, không đồng ý. Đây là bảng hỏi cần được loại bỏ ngay lập tức để giảm thời gian và sức lựa chỉnh sửa dữ liệu SPSS.

3 lưu ý khi sửa giá trị R hiệu chỉnh: 

  • Không có tiêu chuẩn chính xác R hiệu chỉnh ở mức bao nhiêu thì mô hình mới đạt yêu cầu, chỉ số này nếu càng tiến về 1 thì mô hình càng có ý nghĩa, càng tiến về 0 thì ý nghĩa mô hình càng yếu. 
  • Trong một số ít tình huống, việc yêu cầu giá trị R2 phải lớn hơn 0.5 là đi ngược với lý thuyết thống kê. 
  • Ngoại lệ, đôi khi kết quả hồi quy phân tích được có R hiệu chỉnh dưới < 0,5 thì kết quả vẫn được chấp nhận.

7. Các dữ liệu dạng số bị lỗi

Khi nhập dữ liệu vào SPSS, chúng ta sẽ thường gặp các dữ liệu dạng số sẽ bị biến thành dấu chấm và không thể chạy kiểm định được. 

Các dữ liệu dạng số bị lỗi
Các dữ liệu dạng số bị lỗi

4 lý do làm cho các con số trong SPSS bị lỗi: 

  • Nhiều người tham gia trả lời không được hỏi một số câu hỏi do định tuyến của bảng câu hỏi.
  • Người được khảo sát đã bỏ qua một số câu hỏi.
  • Có lỗi khi chuyển đổi hoặc chỉnh sửa dữ liệu.
  • Các giá trị không được ghi lại do lỗi của thiết bị.

Để xử lý dữ liệu số bị lỗi hiển thị dưới dạng dấu chấm, chúng ta thực hiện 5 bước như sau. 

  • Bước 1: Tính trung bình cộng của biến có giá trị bị thiếu trong hệ thống (làm tròn thành số nguyên).
Bước 1: Tính trung bình cộng của biến có giá trị bị thiếu
Bước 1: Tính trung bình cộng của biến có giá trị bị thiếu
  • Bước 2: Chọn toàn bộ biến có giá trị bị thiếu.
  • Bước 3: Nhấn tổ hợp phím Ctrl + H để mở hộp thoại Find and Replace.
  • Bước 4: Nhập dấu chấm “.” vào ô Find và kết quả giá trị trung bình vào ô Replace.
Bước 4: Nhập dấu chấm “.” vào ô Find
Bước 4: Nhập dấu chấm “.” vào ô Find
  • Bước 5: Nhấn Replace All để hoàn thành.
Bước 5: Nhấn Replace All để hoàn thành
Bước 5: Nhấn Replace All để hoàn thành
Khi đã có trong tay bảng kết quả khảo sát thì bạn cần mã hóa dữ liệu để phần mềm có thể hiểu và chạy kiểm định đúng. Để biết rõ hơn về cách mã hóa dữ liệu sao cho tối ưu nhất, hãy cùng Best4Team tìm hiểu qua bài viết cách mã hóa dữ liệu trong SPSS được tổng hợp mới nhất. 

8. Bí quyết sửa dữ liệu SPSS  

Bên cạnh những cách sửa dữ liệu SPSS đơn thuần, chúng ta có thể chủ động phòng ngừa và điều tra số liệu lỗi một cách linh hoạt, cụ thể như sau:  

8.1. Phòng ngừa số liệu lỗi từ 

Đây là cách đơn giản để bạn có thể phòng tránh các dữ liệu lỗi trong SPSS, cách thức này bạn có thể hoàn toàn chủ động thực hiện trước khi tiến hành khảo sát với 5 bí quyết như sau: 

  • Thiết kế bảng câu hỏi khảo sát rõ ràng, rành mạch, dễ nhìn, dễ trả lời.
  • Bảng khảo sát nên gắn gọn nhất có thể để người tham gia khảo sát không “lười” trả lời.
  • Chuẩn bị thật kỹ để hỏi rõ ràng, dễ hiểu nếu như bạn phỏng vấn trực tiếp.
  • Các bảng câu hỏi sau khi thu thập được  nên kiểm tra lại trước khi nhập liệu.
  • Mã hóa thống nhất về quy tắc, cách thức để không bị nhầm lẫn.

Ví dụ: Trong một trường hợp nhất định thì bảng hỏi có 2 câu hỏi như bên dưới sẽ khiến cho dữ liệu bị lỗi hiển thị ở dạng số 7 như đã đề cập ở trên.  

Câu 5: Bạn có sở hữu xe phân khối lớn không (nếu không bỏ qua các câu bên dưới và tiến tới câu hỏi số 10).

Câu 6: Xe ô tô của bạn màu gì?

Kết quả thu được có nhiều người trả lời câu số 5 với đáp án là “Không” đã khiến cho dữ liệu câu hỏi số 6 đến số 9 bị thiếu và chúng sẽ biến thành dấu chấm. Cách tốt nhất để phòng ngừa là bạn nên điều chỉnh câu hỏi cho phù hợp với định tuyến. 

8.2. Dùng thống kê tần số kiểm tra số liệu lỗi

Với phương thức dùng thống kê tần số để kiểm tra số liệu lỗi thì chúng ta sẽ lập riêng từng bảng tần số cho từng biến để kiểm tra các giá trị bất thường, các lỗi sẽ có dạng là “0” hoặc “.” hoặc nằm ngoài vùng giá trị,…

Sau khi lập bảng tần số và xác định được giá trị bất thường là gì thì chúng ta tiến hành tìm chính xác vị trí của chúng tại Data View bằng lệnh Find như sau:

Dùng thống kê tần số kiểm tra số liệu lỗi
Dùng thống kê tần số kiểm tra số liệu lỗi

3 bước sửa dữ liệu SPSS:

  • Bước 1: Chọn cột chứa giá trị lỗi.
  • Bước 2: Trên thanh công cụ, chọn Edit – Find.
  • Bước 3: Nhập giá trị lỗi vào ô Find What bấm tìm và con trỏ sẽ dẫn đến giá trị bị lỗi.
SPSS là công cụ phổ biến trong lĩnh vực nghiên cứu khoa học vì tính hữu dụng và đa nhiệm, tuy nhiên đối với người mới bắt đầu sử dụng sẽ gặp không ít khó khăn về lý thuyết lẫn thực hành. Hiểu được khó khăn đó mà Best4Team đã đề xuất  ra những dịch vụ nhận chạy mô hình SPSS nằm giúp các nghiên cứu sinh có được những bài nghiên cứu ưu tú nhất. Hãy liên hệ ngay, đừng chần chờ!

8.3. Dùng bảng phối hợp các biến kiểm tra số liệu lỗi

Dùng bảng phối hợp là cách thức để tìm những lỗi bất thường được sử dụng phổ biến trong SPSS vì nó cho phép chọn nhiều điều kiện kết hợp để lọc giá trị.

Ví dụ: Kết hợp độ tuổi và nghề nghiệp hoặc tình trạng hôn nhân có thể có điểm bất thường như: độ tuổi 13, nghề nghiệp là designer, đã kết hôn.

4 bước sửa dữ liệu SPSS dạng này là dùng lệnh Select Cases để tìm ra vị trí lỗi: 

Bước 1: Mở cửa sổ Select Cases tìm vị trí lỗi.

Bước 2: Trên thanh công cụ, chọn Data/Select CasesIf condition is satisfied/If

Bước 3: Nhập điều kiện tìm dữ liệu lỗi: Trong ô điều kiện chọn các điều kiện kết hợp (Độ tuổi = 22, Nghề nghiệp = số mã hóa của “designer” là 2).

Bước 3: Nhập điều kiện tìm dữ liệu lỗi
Bước 3: Nhập điều kiện tìm dữ liệu lỗi

Bước 4: Sửa số liệu để chạy SPSS: 

  • Sau khi bấm OK, một biến mới filter được tạo (biến = 0 là không thỏa lệnh If và = 1 là thỏa lệnh If,  tức hàng có điều kiện biến bị lỗi).
  • Vào Data View xem các biến thỏa lệnh If (biến bị lỗi) sẽ không được gạch chéo, tiến hành kiểm tra hàng đó và sửa lại các giá trị cho thỏa mãn.
  • Tích lại giá trị All Cases trên cửa sổ Select Cases để chạy kiểm định.
  • Trong trường hợp mẫu quá lớn hoặc quá nhiều trường hợp lỗi thì dùng thêm lệnh Sort Cases bổ trợ cho filter.
  • Trên thanh công cụ, chọn Data – Sort Cases để sắp xếp dữ liệu, nếu chọn xếp giảm dần thì giá trị filter 1 xuất hiện trên đầu tức hàng có biến bị lỗi. 
Phát hiện ra số liệu lỗi khi trong cửa sổ số liệu SPSS
Phát hiện ra số liệu lỗi khi trong cửa sổ số liệu SPSS

Qua bài viết, Best4team mong rằng bạn đọc đã hiểu hơn các bí quyết sửa dữ liệu SPSS và áp dụng có hiệu quả các cách thức này vào bài nghiên cứu thực tiễn của mình. Chúc các bạn thành công!

5/5 (1 Review)
Nguyễn Phương Nam
Nguyễn Phương Nam
Tôi là Nguyễn Phương Nam chức vụ phó phòng nội dung tại Best4Team. Công việc của tôi là nghiên cứu, sản xuất nội dung thông tin cho website Best4Team.com ở lĩnh vực tài liệu và chạy mô hình kinh tế lượng bằng các phần mềm Eview, Stata, Spss,...
guest
0 Bình luận
Inline Feedbacks
View all comments

LIÊN HỆ

Nếu bạn chưa biết mình cần cung cấp những thông tin gì thì đừng ngại để lại thông tin tại đây. Chúng tôi sẽ liên hệ lại sớm nhất có thể.

Sau khi trao đổi bạn sẽ nhận được:

  • Sự tư vấn tận tâm về tất cả băn khoăn của bạn
  • Báo giá chi tiết và thời hạn hoàn thành.
  • Quy trình làm việc an toàn Hỗ Trợ Viết Báo Cáo

ĐỂ LẠI THÔNG TIN LIÊN HỆ

*Xin vui lòng điền đầy đủ thông tin và chính xác để được hỗ trợ tư vấn nhanh nhất.