1
Bạn cần hỗ trợ?

Hướng dẫn phân tích và đọc kết quả hồi quy đa biến trong SPSS

       Các phần trước, Luận Văn 3C  đưa ra các bài viết hướng dẫn phân tích độ tin cậy thang đo Cronbach’s Alpha, phân tích nhân tố khám phá EFA, kiểm định độ tin cậy thang đo Cronbach’s Alpha, Phân tích tương quan pearson trong SPSS … cùng với đó là cách chạy và đọc kết quả bằng phần mềm SPSS. Tiếp tục, phần tiếp theo  Luận Văn 3C sẽ hướng dẫn lý thuyết cùng với cách chạy số liệu SPSS để phân tích hồi quy đa biến.

          Lý thuyết về hồi quy đa biến

        Hồi quy đa biến hay còn gọi là hồi quy tuyến tính bội là mở rộng của hồi quy tuyến tính đơn. Nó được sử dụng khi chúng ta muốn dự đoán giá trị của một biến phụ thuộc dựa trên giá trị của nhiều biến độc lập khác. Hồi quy đa biến cho phép chúng ta xác định mức độ ảnh hưởng từng nhân tố độc lập  lên biến phụ thuộc.

phân tích hồi quy đa biến

       Phương trình hồi quy đa biến có dạng tổng quát như sau

      Y = β0 + β1X1 + β2X2 + … + βnXn + e

Trong đó:

Y: biến phụ thuộc, là biến chịu tác động của biến khác.

•X, X1, X2, Xn: biến độc lập tác động lên biến phụ thuộc

•β0:  là hệ số chặn, hay còn gọi là tung độ gốc

•β1, β2, βn: hệ số hồi quy, hay còn được gọi là hệ số góc. Chỉ số này cho  cho biết có bao nhiêu đơn vị Y sẽ thay đổi khi  X tăng hoặc giảm một đơn vị.

 •e: là sai số ngẫu nhiên, hình thành từ nhiều nguồn, ngoài tầm kiểm tra của hệ thống nghiên cứu (sai số rất nhỏ trong điều kiện thí nghiệm, sai số của dụng cụ, sai số khi theo dõi, ghi chép kết quả . . . ).

         Ước lượng phân tích hồi quy tuyến tính bội bằng OLS (h2)

         Mô hình hồi quу bình phương nhỏ nhất OLS (Ordinary Least Squares ) thường được ѕử dụng trong хem хét ѕự ảnh hưởng của các biến độc lập (biến giải thích) ᴠới biến phụ thuộc (biến được giải thích), từ đó хem хét tính phù hợp cũng như dự báo.

        Giả định mô hình hồi quy tuyến tính bội

        Khả năng áp dụng của kỹ thuật OLS dựa trên một số giả định nhất định. Các giả định của OLS như sau:

•Sai số của phần dư (residuals errors) ở đường thẳng hồi quy có phân phối chuẩn hoặc xấp xỉ phân phối chuẩn.

•Phương sai sai số đồng nhất theo tất cả các quan sát.

•Sai số ngẫu nhiên sẽ độc lập thống kê lẫn nhân. Đây là giả định về không tự tương quan.

•Dữ liệu không có chứa các điểm dị biệt (Xem thêm phát hiện điểm dị biệt).

•Biến phụ thuộc trong mô hình phải là biến liên tục (có thể dạng tỉ lệ, hoặc dạng khoảng)

•Có mối quan hệ tuyến tính giữa biến phụ thuộc với các biến giải thích của mô hình. Nếu dữ liệu có dạng phi tuyến, thì chúng ta thực hiện biến đổi biến thành biến mới qua một dạng hàm phù hợp sao cho biến mới này thỏa mãn giả định tuyến tính của mô hình hồi quy.

 •Không có sự đa cộng tuyến giữa các biến giải thích. Điều đó có nghĩa các biến giải thích trong mô hình không có sự tương quan cao với nhau.

      Nguyên tắc của phương pháp hồi quy OLS là làm cho biến đổi phần dư này trong phép hồi quy là nhỏ nhất. Khi biểu diễn trên mặt phẳng Oxy, đường hồi quy OLS là một đường thẳng đi qua phần tử dữ liệu mà ở đó, khoảng cách từ các điểm dữ liệu (trị tuyệt đối của ε) đến đường hồi quy là ngắn nhất.

phân tích hồi quy đa biến

         Trên đồ thị scatter thể hiện mối quan hệ giữa các biến độc lập và biến phụ thuộc, các điểm số liệu sẽ  nằm phân tán nhưng có xu hướng chung tạo thành dạng một đường thẳng. Có thể có rất nhiều đường đường thẳng hồi quy đi qua các điểm số liệu này, chúng ta phải giải quyết bài toán chọn ra đường thẳng nào mô tả sát nhất xu hướng dữ liệu. Bình phương nhỏ nhất OLS sẽ tìm ra đường thẳng đó dựa trên nguyên tắc cực tiểu hóa khoảng cách từ các điểm dữ liệu đến đường thẳng.

        Hướng dẫn phân tích hồi quy đa biến trong SPSS

        Khi chạy phần mềm SPSS để phân tích hồi quy đa biến ta cần quan tâm đến các thông số sau:

Hệ số Beta: hệ số hồi quy chuẩn hoá cho phép so sánh trực tiếp giữa các hệ số dựa trên mối quan hệ giải thích của chúng với biến phụ thuộc. 

Hệ số R2: đánh giá phần biến động của biến phụ thuộc được giải thích bởi các biến dự báo hay biến độc lập. Hệ số này có thể thay đổi từ 0 đến 1. Nếu giá trị này nằm trong khoảng từ 0.5 - 1 thì là mô hình tốt, < 0.5 là mô hình chưa tốt.

Kiểm định ANOVA để kiểm tra tính phù hợp của mô hình với tập dữ liệu gốc. 

Giá trị Sig. của kiểm định t được sử dụng để kiểm định ý nghĩa của hệ số hồi quy, nếu mức ý nghĩa của kiểm định < 0.05 thì ta có thể kết luận mô hình hồi quy phù hợp với tập dữ liệu.

 Hệ số phóng đại phương sai (VIF): là một chỉ số đánh giá hiện tượng cộng tuyến trong mô hình hồi quy. VIF càng nhỏ, càng ít khả năng xảy ra đa cộng tuyến. Hair và cộng sự (2009) cho rằng, ngưỡng VIF từ 10 trở lên sẽ xảy ra đa cộng tuyến mạnh. Nhà nghiên cứu nên cố gắng để VIF ở mức thấp nhất có thể, bởi thậm chí ở mức VIF bằng 5, bằng 3 đã có thể xảy ra đa cộng tuyến nghiêm trọng. Theo Nguyễn Đình Thọ (2010) , trên thực tế, nếu VIF > 2, thì đã có thể xảy ra sự đa cộng tuyến gây sai lệch các ước lượng hồi quy. Vì vậy nếu VIF > 2 có thể kiểm tra hiện tượng đa cộng tuyến.

       Cách chạy hồi quy đa biến trong SPSS

       Xét ví dụ về phân tích hồi quy đa biến trong SPSS: Nghiên cứu nghiên cứu các tác động của quảng cáo trên mạng xã hội đến hành vi mua sắm trực tuyến của giới trẻ

       Mô hình nghiên cứu

phân tích hồi quy đa biến

 
         Phương trình hồi quy đa biến như sau:
       Biến phụ thuộc: ý định mua sắm trực tuyến của giới trẻ
       Biến độc lập: Tính thông tin, Tính giải trí, Sự tin cậy, Sự phiền nhiễu, Tính tương tác xã hội

       Các bước thực hành phân tích hồi quy đa biến  bằng phần mềm SPSS như sau:

       Bước 1: Vào  Analyze > Regression > Linear…

phân tích hồi quy đa biến

 
Bước 2: Đưa biến phụ thuộc YD_F vào ô Dependent, các biến độc lập TT_F, GT_F, STC_F, SPN_F, TTXH_F,  vào ô Independents