Mẹo nhỏ: Để tìm kiếm chính xác các bài viết của Vuihecungchocopie.vn, hãy search trên Google với cú pháp: "Từ khóa" + "vuihecungchocopie". (Ví dụ: công thức giải rubik 3x3 vuihecungchocopie). Tìm kiếm ngay
88 lượt xem

Phương pháp làm sạch dữ liệu bằng SPSS

Bạn đang xem: Phương pháp làm sạch dữ liệu bằng SPSS Tại Vuihecungchocopie                        

Bạn đang quan tâm đến Phương pháp làm sạch dữ liệu bằng SPSS phải không? Nào hãy cùng Vuihecungchocopie đón xem bài viết này ngay sau đây nhé, vì nó vô cùng thú vị và hay đấy!

Dữ liệu sau khi được nhập vào, không thể xử lý và phân tích ngay lập tức, vì có thể có nhiều lỗi cần được loại bỏ. Nguyên nhân như sau:

  • Chất lượng khảo sát: Người trả lời hiểu sai câu hỏi dẫn đến việc thu thập dữ liệu không chính xác; Người được hỏi trả lời mơ hồ và không hợp tác trong việc hoàn thành cuộc phỏng vấn; Người trả lời không điền vào biểu mẫu khảo sát vì nhiều lý do khác nhau; Người điều tra lập hồ sơ không chính xác,… …
  • Lỗi nhập liệu: Trong quá trình nhập kết quả phiếu điều tra vào phần mềm, người nhập liệu đã nhập dữ liệu thiếu, thừa, sai.

Những sai sót có thể phát sinh từ những nguyên nhân chủ quan hoặc khách quan. Nếu số liệu có quá nhiều sai sót thì kết quả phân tích thống kê sẽ không còn chính xác, có trường hợp số liệu sai sót thậm chí dẫn đến việc toàn bộ số liệu điều tra bị hủy bỏ.

Bạn đang xem: Cách làm sạch dữ liệu trong spss

Phương pháp làm sạch số liệu

Dưới đây là 2 phương pháp làm sạch dữ liệu phổ biến mà các nhà nghiên cứu sử dụng để xác định các giá trị ngoại lai, ngoại lệ.

1. Sử dụng bảng tần suất

Lập bảng tần suất cho tất cả các biến, kiểm tra các giá trị lẻ, như trong ví dụ trong Phần 3.1. Sau đó, tại biến có dữ liệu sai, hãy sử dụng lệnh tìm kiếm / thay thế Tìm và Thay thế để tìm giá trị sai và sửa nó. Cách lập bảng tần số mà bạn sẽ làm quen trong chương 4, và cách sử dụng lệnh find để tìm giá trị lỗi, tác giả sẽ chỉ cho từng người một.

Trong màn hình Chế độ xem dữ liệu , hãy nhấp vào tên biến ở đầu cột và chọn cột biến có giá trị sai. Tác giả sẽ sử dụng biến giới tính để thực hành ví dụ:

Làm sạch dữ liệu SPSS

Khi biến giới tính chỉ có 2 giá trị 1, 2 tương ứng với nam và nữ, nhưng lại thiếu 3 giá trị 11, 12 và 1 khi bảng thống kê tần suất xuất hiện thì có sự mâu thuẫn ở đây. những dữ liệu sai sót này. Với trường biến giới tính được chọn, đi tới Chỉnh sửa & gt; Tìm hoặc nhấn tổ hợp phím ctrl + f để mở hộp thoại Tìm và Thay thế.

Làm sạch dữ liệu SPSS

Nhập giá trị 11 vào hộp Tìm, nhấp vào nút Tìm tiếp theo , vị trí ô chứa giá trị 11 sai sẽ chuyển sang màu vàng và các khu vực khác sẽ mặc định thành màu trắng. p>

Làm sạch dữ liệu SPSS

Xem thêm: Hướng dẫn sử dụng, cách tạo game trên Kahoot – iSST – Hệ thống Dạy và học Trực tuyến

Đảo ngược số dòng, chỉ thấy giá trị 11 sai trên dòng 14, kiểm tra lại bảng câu hỏi số 14 và sửa lại giá trị sai. Nếu có nhiều giá trị 11, bạn tiếp tục nhấn tìm tiếp theo để tìm tất cả các lỗi và chỉnh sửa.

2. Sử dụng bảng kết hợp

Sử dụng bảng kết hợp 2 hoặc 3 biến, sau đó dựa vào logic để tìm lỗi. Trong Chương 4, bạn sẽ làm quen với cách lập bảng kết hợp. Ví dụ: khi bạn kết hợp biến độ tuổi với trình độ học vấn, bạn sẽ thấy rằng có những trường hợp độ tuổi chỉ là 15 nhưng trình độ học vấn đã tốt nghiệp, tức là biến độ tuổi hoặc biến trình độ học vấn bị lỗi nhập dữ liệu. Để tìm và sửa lỗi, chúng tôi sẽ sử dụng lệnh select case trong spss. Tác giả sẽ thực hành một ví dụ về bảng kết hợp giữa biến độ tuổi và biến trình độ học vấn:

Làm sạch dữ liệu SPSS

Nhận thức được sự mâu thuẫn ở đây đối với những người dưới 18 tuổi có bằng đại học, cần kiểm tra dữ liệu lỗi này bằng lệnh select case. Đi tới Dữ liệu & gt; Chọn Trường hợp … Hộp thoại Chọn Trường hợp xuất hiện.

Làm sạch dữ liệu SPSS

Chọn hộp nếu điều kiện , sau đó nhấp vào nút nếu… bên dưới để mở hộp thoại điều kiện lọc.

Làm sạch dữ liệu SPSS

Nhập hàm vào hộp tiêu chí: dotuoi = 1 & amp; hocvan = 3 để lọc ra các trường hợp dưới 18 tuổi có trình độ đại học. trong đó dotuoi, hocvan là các tên biến được mã hóa trong tệp dữ liệu. Tuổi 1 là “dưới 18 tuổi”, và trình độ 3 là “cao đẳng trở lên”. Sau khi nhập chức năng, hãy tiếp tục và nhấp vào nút Tiếp tục và chọn ok .

Làm sạch dữ liệu SPSS

Làm sạch dữ liệu SPSS

Xem thêm: Cúng đầy tháng cho bé trai: Từ A đến Z nghi thức cần chuẩn bị cho mẹ

Khi lệnh này được thực thi, spss sẽ tạo một biến mới gọi là filter_ $, biến này nhận giá trị 0 trong tất cả các trường hợp không thỏa mãn và 1 trong trường hợp điều kiện lệnh được thỏa mãn, tức là trường hợp sai. Lưu ý rằng biến filter_ $ chỉ là một biến tạm thời sẽ bị mất khi bạn thực hiện một lệnh chọn trường hợp mới. Ngoài ra, ô thứ tự hàng sẽ bị gạch chéo ở hàng không đáp ứng điều kiện (giá trị filter_ $ là 0) và ô không có dấu gạch chéo cho biết hàng đó đáp ứng điều kiện lọc (giá trị filter_ $ là 1).

Làm sạch dữ liệu SPSS

Sau khi lọc các hàng dựa trên một điều kiện, một vấn đề khác nảy sinh, nếu số lượng hàng quá lớn, hãy tìm hàng chứa giá trị sai (hàng có giá trị là 1 trong cột filter_ $, nhưng không có trong bộ lọc_ $ cột). gạch bỏ theo thứ tự hàng) sẽ mất nhiều thời gian và công sức. Tại thời điểm này, bạn cần sự trợ giúp của lệnh sắp xếp trường hợp , đi tới dữ liệu & gt; trường hợp sắp xếp …

Làm sạch dữ liệu SPSS

Hộp thoại

​​ Sắp xếp Trường hợp xuất hiện, đặt biến cần sắp xếp vào hộp Sắp xếp theo . Cụ thể là biến filter_ $ trong ví dụ này. Chọn sắp xếp theo thứ tự tăng dần hoặc giảm dần. Nếu bạn sắp xếp theo thứ tự giảm dần, hàng có giá trị 1 sẽ ở trên cùng và ngược lại. Tiếp tục nhấp vào ok .

Làm sạch dữ liệu SPSS

Sau khi sắp xếp các giá trị của cột filter_ $ variable, hãy kiểm tra các hàng có chứa giá trị trong điều kiện lọc, tìm dữ liệu sai và sửa nó.

Cũng cần lưu ý rằng khi thực hiện thành công lệnh select case, bạn phải quay lại giao diện cửa sổ select case và trở về trạng thái dữ liệu bình thường all case , nếu không lệnh thống kê sẽ chỉ lọc thực hiện của tình huống.

Làm sạch dữ liệu SPSS

Đây là 2 phương pháp làm sạch dữ liệu spss được sử dụng rộng rãi hiện nay và bạn có thể tìm kiếm thêm trên mạng nhiều phương pháp khác. Tuy nhiên, nguyên tắc để có một tập dữ liệu tốt vẫn là “phòng bệnh hơn chữa bệnh”, để giảm thiểu các lỗi dữ liệu xảy ra sau này, chúng ta cần thực hiện các biện pháp sửa lỗi sau:

Xem thêm: Khéo tay hay làm: 2 cách tự làm gối ôm handmade cực đáng yêu | Gỗ Trang Trí

  • Thiết kế một bảng câu hỏi rõ ràng có tham khảo các đánh giá từ các chuyên gia và người cố vấn.
  • Việc thiết kế bảng câu hỏi nên sử dụng “câu hỏi đẩy” và “câu hỏi trả lời ngược” để loại trừ những bảng câu hỏi chất lượng thấp và những người trả lời có câu trả lời mơ hồ. Bạn có thể tham khảo bài viết Các câu hỏi cần điền vào bảng câu hỏi xây dựng để biết hai loại câu hỏi này.
  • Các câu hỏi khảo sát cần được người trả lời dễ hiểu để đưa ra đánh giá và phản hồi chính xác
  • Một cuộc khảo sát sơ bộ được thực hiện để đưa ra những điều chỉnh cần thiết trước khi bước vào cuộc khảo sát chính thức. to lớn.
  • Lựa chọn có chọn lọc người trả lời, người trả lời không ủng hộ quan điểm hoặc thái độ và người trả lời không thuộc đối tượng khảo sát sẽ đưa ra những nhận định không phù hợp và mắc sai lầm dẫn đến sai lệch so với thực tế.
  • Khi bảng câu hỏi đã được thu thập, các lỗi phải được kiểm tra và sửa chữa trước khi nhập dữ liệu.

Công khai: VUIHECUNGCHOCOPIE.VN là trang web Tổng hợp Ẩm Thực - Game hay và Thủ Thuật hàng đầu VN, thuộc Chocopie Vietnam. Mời thính giả đón xem.

Chúng tôi trân trọng cảm ơn quý độc giả luôn ủng hộ và tin tưởng!

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *