Tương quan Pearson (R) là phương pháp xử lý số liệu được nhiều người ưa chuộng vì tính quan trọng và luôn cho các kết quả chính xác, nhanh gọn. Trong bài viết dưới đây, Best4Team sẽ giới thiệu đến bạn đọc những thông tin về khái niệm, các yêu cầu, cách thực hiện, ý nghĩa và sự ứng dụng để giúp các bạn hiểu rõ hơn hệ số tương quan Pearson trong SPSS. Cùng tìm hiểu nhé!

Phân Tích Tương Quan Pearson (R) Trong SPSS
Phân Tích Tương Quan Pearson (R) Trong SPSS

1. Hệ số tương quan Pearson (R) là gì?

Tương quan Pearson (Pearson correlation coefficient, ký hiệu R) là một phép đo tham số thống kê để kiểm tra cường độ và hướng của mối quan hệ tuyến tính giữa các cặp biến liên tục. Hay nói cách khác, Tương quan Pearson đánh giá liệu rằng có bằng chứng thống kê cho mối quan hệ tuyến tính giữa các cặp biến giống nhau trong tổng thể hay không. 

Hệ số tương quan Pearson (R) là gì?
Hệ số tương quan Pearson (R) là gì?

Ví dụ: Hệ số tương quan sẽ trả lời cho các câu hỏi như: Có mối quan hệ tương quan giữa thời tiết và doanh thu bán kem? Có mối quan hệ tương quan giữa sự hài lòng công việc và thu nhập? Có mối liên hệ chặt chẽ nhất giữa quy mô gia đình và thu nhập gia đình?…

Trong SPSS, tương quan Pearson là mối quan hệ tương đối giữa các biến, các biến này có quan hệ với nhau trong một số điều kiện nhất định chứ không phải trong mọi trường hợp (quan hệ tuyệt đối). Và hệ số này được xem là phương pháp kiểm định dữ liệu tốt nhất bởi 3 điều như sau: 

  • Đo lường mối liên hệ giữa các biến quan tâm bởi vì hệ số tương quan Pearson dựa trên phương pháp hiệp phương sai. 
  • Hệ số tương quan Pearson cung cấp thông tin về mức độ quan trọng của mối liên hệ, mối tương quan, hoặc hướng của mối quan hệ. 
  • Việc kiểm tra hệ số tương quan Pearson còn giúp phát hiện sớm các vấn đề đa cộng tuyến khi các biến độc lập có sự tương quan mạnh với nhau.

2. Yêu cầu về dữ liệu SPSS khi phân tích tương quan Pearson

Để sử dụng tương quan Pearson trong SPSS thì dữ liệu phải đáp ứng đủ 7 yêu cầu như sau:

1/ Có hai hoặc nhiều biến liên tục (nghĩa là mức khoảng hoặc tỷ lệ).

2/ Các trường hợp phải có các giá trị không thiếu trên cả hai biến.

3/ Mối quan hệ tuyến tính giữa các biến.

4/ Các trường hợp có tính độc lập trong các quan sát.

– Không có mối quan hệ giữa các giá trị của các biến giữa các trường hợp: 

  • Các giá trị cho tất cả các biến trong mọi trường hợp không liên quan nhau. 
  • Đối với mọi trường hợp, giá trị của biến này không thể ảnh hưởng đến giá trị của bất kỳ biến khác trong tất cả các trường hợp.
  • Không trường hợp nào có thể ảnh hưởng đến trường hợp khác đối với bất kỳ biến nào. 

– Hệ số tương quan Pearson hai chiều và kiểm tra ý nghĩa tương ứng không mạnh mẽ khi tính độc lập bị vi phạm.

5/ Hai biến bình thường nhưng có chất lượng:

  • Mỗi cặp biến được phân phối chuẩn hai biến.
  • Mỗi cặp biến được phân phối chuẩn hai biến ở tất cả các cấp của các biến khác.
  • Giả định đảm bảo rằng các biến có liên quan tuyến tính: Vi phạm giả định này có thể chỉ ra sự tồn tại các mối quan hệ phi tuyến tính giữa các biến. Độ tuyến tính có thể được đánh giá trực quan bằng cách sử dụng biểu đồ phân tán của dữ liệu.

6/ Mẫu dữ liệu phải là ngẫu nhiên từ dân số.

7/ Không có giá trị ngoại lệ.

Trong phân tích định lượng, chúng ta rất dễ gặp khó khăn vì số liệu thu được “không hợp tác”. Vậy làm thế nào để làm đẹp số liệu như mong muốn? Hãy truy cập ngay bài viết cách fake dữ liệu SPSS của Best4Team để biết được hướng dẫn chi tiết. Chúng tôi không khuyến khích các hành động làm sai lệch kết quả nghiên cứu, nhưng về mặt kỹ thuật chúng tôi có thể hướng dẫn và bạn sẽ làm được như bài viết. 

3. Cách chạy tương quan Pearson bằng SPSS

Để hiểu rõ hơn về cách chạy tương quan Pearson trong SPSS, chúng ta sẽ tìm hiểu chi tiết ví dụ minh họa dưới đây.

3.1. Đặt vấn đề

Ví dụ: Tìm hiểu mối liên hệ tuyến tính giữa cân nặng và chiều cao để xem có ý nghĩa thống kê giữa hai biến liên tục này hay không. Sử dụng Tương quan Pearson hai biến để kiểm tra xem liệu có mối quan hệ tuyến tính, đồng thời để xác định cường độ và hướng của mối liên hệ này.

3.2. Sơ lược dữ liệu trước khi chạy kiểm định

– Biến “Chiều cao” là phép đo chiều cao liên tục tính bằng inch và thể hiện một dải giá trị từ 55,00 đến 84,41. 

– Biến “Trọng lượng” là thước đo liên tục về trọng lượng tính bằng pound và thể hiện một loạt giá trị từ 101,71 đến 350,07.

– Dùng biểu đồ phân tán: Nhằm xem xét các mối tương quan R để biết được điều gì sẽ xảy ra, và xác định xem có hợp lý hay không khi chúng ta cho rằng các biến có mối quan hệ tuyến tính. 

Biểu đồ phân tán 
Biểu đồ phân tán

(Graphs – Legacy Dialogs – Scatter/Dot – Simple Scatter – Define, di chuyển biến Chiều cao vào hộp Trục X và biến Trọng lượng sang Trục Y, hoàn tất rồi bấm OK).

Từ biểu đồ phân tán, có thể thấy rằng khi chiều cao tăng lên thì cân nặng cũng có xu hướng tăng lên. Dường như chúng có một số mối quan hệ tuyến tính.

3.3. Chạy tương quan Pearson trong SPSS

Để chạy hệ số tương quan Pearson trong SPSS, chúng ta thực hiện 3 bước trong SPSS như sau: 

Bước 1: Trên thanh công cụ, chọn  Analyze – Correlate – Bivariate.

Bước 1 chạy tương quan Pearson 
Bước 1 chạy tương quan Pearson

Bước 2.1: Cửa sổ Bivariate Correlations mở ra, di chuyển biến Chiều cao và Cân vào hộp Variables

Bước 2 chạy tương quan Pearson 
Bước 2 chạy tương quan Pearson

Bước 2.2: Trong khu vực Correlation Coefficients, chọn Pearson. Trong khu vực Test of Significance, hãy chọn kiểm tra ý nghĩa mong muốn là Two-tailed hoặc One-tailed. Sau đó nhấp chọn ô Flag significant correlation

Bước 3: Nhấn OK để hoàn thành và đợi kết quả. 

Bạn gặp khó khăn gì khi chạy kiểm định trong SPSS? Hãy chia sẻ với Best4Team ,với dịch vụ chạy SPSS thuê của chúng tôi sẽ mang đến cho bạn những kết quả nghiên cứu hoàn hảo đến từng chi tiết để bài nghiên cứu khoa học của bạn thêm chất lượng. 

4. Phân tích tương quan Pearson SPSS

Khi cửa sổ Bivariate Correlations ở bước 2 chạy Pearson mở ra, đây là nơi chỉ định các biến sẽ được sử dụng trong phân tích, hãy cùng Best4Team tìm hiểu các thanh công cụ trong cửa sổ này: 

Cửa sổ Bivariate Correlations
Cửa sổ Bivariate Correlations

(A) Variables (Các biến): Bạn phải chọn ít nhất hai biến liên tục, nhưng có thể chọn nhiều hơn hai. Phép thử sẽ đưa ra các hệ số tương quan cho từng cặp biến trong danh sách này. Lưu ý khi chạy SPSS thì nên sắp xếp biến phụ thuộc nằm trên cùng trong bảng Variables.

(B) Correlation Coefficients (Hệ số tương quan): Có nhiều loại hệ số tương quan. Theo mặc định, Pearson luôn được chọn. 

(C) Test of Significance (Kiểm tra mức độ quan trọng): Nhấp vào Two-tailed hoặc One-tailed, tùy thuộc vào kiểm tra mức độ quan trọng mà bạn mong muốn. SPSS sử dụng kiểm tra hai đầu theo mặc định.

(D) Flag significant correlations (Gắn cờ các mối tương quan có ý nghĩa thống kê): Đánh dấu tùy chọn này sẽ bao gồm các dấu hoa thị (**) bên cạnh các mối tương quan có ý nghĩa thống kê trong đầu ra. Theo mặc định, SPSS đánh dấu ý nghĩa thống kê ở mức alpha = 0,05 và alpha = 0,01.

(E) (Options) Tùy chọn: Nhấp vào đây để mở ra một cửa sổ có thể chỉ định Thống kê nào sẽ bao gồm (như Phương tiện và độ lệch chuẩn, Độ lệch chuẩn và phương sai của các sản phẩm chéo) và cách giải quyết các giá trị bị thiếu (tức là loại trừ các trường hợp theo cặp hoặc loại trừ các trường hợp theo danh sách ).

Sau khi thực hiện 3 bước chạy hệ số tương quan Pearson như ở mục 3, chúng ta sẽ thu được kết quả như sau: 

Bảng Correlations  
Bảng Correlations

Từ bảng trên, chúng ta thấy được rằng: 

  • A/ tương quan của Chiều cao với chính nó (r=1) và số quan sát không bỏ sót đối với chiều cao (n=408).
  • B/ Tương quan giữa chiều cao và cân nặng (r=0,513), dựa trên n=354 quan sát với các giá trị không thiếu theo cặp.
  • C/ Tương quan giữa chiều cao và cân nặng (r=0,513), dựa trên n=354 quan sát với các giá trị không thiếu theo cặp.
  • D/ Tương quan giữa trọng số với chính nó (r=1) và số quan sát không bỏ sót đối với trọng số (n=376).

*** Nhận xét: 

– Các ô quan trọng cần xem xét là B hoặc C (2 giá trị giống nhau), các ô B và C chứa hệ số tương quan cho mối tương quan giữa chiều cao và cân nặng, giá trị p và số lượng quan sát theo cặp hoàn chỉnh.

– Các mối tương quan trong đường chéo chính ô A và D đều bằng 1. Tuy nhiên, kích thước mẫu của A và D khác nhau (408/376). Điều này là có nhiều quan sát bị thiếu cho biến Cân nặng hơn là biến Chiều cao.

– Trong ô B (được lặp lại trong ô C), có thể thấy rằng hệ số tương quan Pearson cho chiều cao và cân nặng là 0,513, có ý nghĩa (p < 0,001 đối với thử nghiệm hai đầu), dựa trên 354 quan sát hoàn chỉnh (giá trị không thiếu đối với cả chiều cao và cân nặng).

*** Kết luận: Từ kết quả kiểm định và các nhận xét chi tiết, chúng ta rút ra kết luận cho vấn đề đã được đặt ra như sau: 

  • Cân nặng và chiều cao có mối quan hệ tuyến tính có ý nghĩa thống kê (r = 0,513, p < 0,001).
  • Chiều của mối quan hệ này là tương quan thuận, tức là các biến có xu hướng tăng cùng nhau (chiều cao lớn hơn có liên quan đến cân nặng lớn hơn).
  • Độ lớn hoặc cường độ của mối liên hệ ở mức vừa phải (0.3 < | r | < 0.5).
Bạn chưa có kinh nghiệm thực hiện kiểm định trong SPSS. Bạn không biết nguồn tài liệu hướng mới nhất về SPSS. Hãy tham khảo ngay bài viết cách sử dụng SPSS được Best4Team tổng hợp mới nhất để có thêm nhiều mẹo hay cho SPSS của bạn. 

5. Ý nghĩa hệ số tương quan Pearson

Ý nghĩa hệ số tương quan Pearson
Ý nghĩa hệ số tương quan Pearson

Hệ số tương quan Pearson có giá trị giao động trong khoảng liên tục từ -1 đến +1, trong đó mỗi khoảng sẽ có ý nghĩa khác nhau, cụ thể:

  • r = 0: Hai biến không có tương quan tuyến tính
  • r = 1; r = -1: Hai biến có mối tương quan tuyến tính tuyệt đối. 
  • r < 0: Hệ số tương quan âm, nghĩa là giá trị biến x tăng thì giá trị biến y giảm và ngược lại.
  • r > 0: Hệ số tương quan dương, có nghĩa là giá trị biến x tăng thì giá trị biến y tăng và ngược lại
  • Hệ số tương quan Pearson (r) chỉ có ý nghĩa khi và chỉ khi mức ý nghĩa quan sát (sig.) nhỏ hơn mức ý nghĩa α = 0.05.
  • Nếu r nằm trong khoảng từ 0.50 đến ± 1, thì nó được cho là tương quan mạnh.
  • Nếu r nằm trong khoảng từ 0,30 đến ± 0,49, thì nó được gọi là tương quan trung bình.
  • Nếu r nằm dưới ±  0.29, thì nó được gọi là một mối tương quan yếu.
  • Trên đồ thị phân tán Scatter, nếu r = -1 thì dữ liệu sẽ phân bổ trên một đường thẳng với độ dốc âm. Hoặc nếu r = 1 dữ liệu sẽ phân bổ trên một đường thẳng với độ dốc dương.

6. Ứng dụng phân tích tương quan Pearson SPSS

Tương quan Pearson trong SPSS thường được sử dụng để đo lường 5 điều sau:

– Mối tương quan giữa các cặp biến

– Mối tương quan trong và giữa các tập hợp biến

– Liệu có tồn tại mối quan hệ tuyến tính có ý nghĩa thống kê giữa hai biến liên tục hay không.

– Độ mạnh của một mối quan hệ tuyến tính (mối quan hệ mạnh như thế nào để trở thành một đường thẳng).

– Hướng của một mối quan hệ tuyến tính (tăng hoặc giảm).

2 lưu ý của tương quan hệ số R

  • Tương quan Pearson không thể giải quyết các mối quan hệ phi tuyến tính hoặc mối quan hệ giữa các biến phân loại. 
  • Tương quan R chỉ cho thấy mối liên hệ giữa các biến liên tục. 
  • Hệ số R này không cung cấp bất kỳ suy luận nào về mối quan hệ nhân quả, cho dù hệ số tương quan có lớn đến đâu.
Lỗi dữ liệu SPSS là cụm từ quen thuộc khi thực hiện chạy SPSS, đôi khi chúng sẽ khiến bạn đau đầu vì không biết phải bắt đầu sữa lỗi từ đâu. Đừng quá lo lắng, Best4Team đã tổng hợp bài viết sửa dữ liệu SPSS được cập nhật mới nhất nhằm giúp cho các nghiên cứu sinh dễ dàng hơn trong việc nghiên cứu khoa học. Hãy tham khảo ngay!

Bài viết trên nhằm cung cấp đến bạn đọc những thông tin về khái niệm, yêu cầu, cách chạy, ý nghĩa hệ số và ứng dụng của tương quan Pearson (R) trong SPSS. Qua đây, Best4Team mong rằng các bạn đã có thêm nhiều thông tin hữu ích cho quá trình làm nghiên cứu khoa học của mình. Chúc các bạn thành công!

5/5 (1 Review)
Nguyễn Phương Nam
Nguyễn Phương Nam
Tôi là Nguyễn Phương Nam chức vụ phó phòng nội dung tại Best4Team. Công việc của tôi là nghiên cứu, sản xuất nội dung thông tin cho website Best4Team.com ở lĩnh vực tài liệu và chạy mô hình kinh tế lượng bằng các phần mềm Eview, Stata, Spss,...
guest
0 Bình luận
Inline Feedbacks
View all comments

LIÊN HỆ

Nếu bạn chưa biết mình cần cung cấp những thông tin gì thì đừng ngại để lại thông tin tại đây. Chúng tôi sẽ liên hệ lại sớm nhất có thể.

Sau khi trao đổi bạn sẽ nhận được:

  • Sự tư vấn tận tâm về tất cả băn khoăn của bạn
  • Báo giá chi tiết và thời hạn hoàn thành.
  • Quy trình làm việc an toàn Hỗ Trợ Viết Báo Cáo

ĐỂ LẠI THÔNG TIN LIÊN HỆ

*Xin vui lòng điền đầy đủ thông tin và chính xác để được hỗ trợ tư vấn nhanh nhất.