Hướng dẫn phân tích và đọc kết quả hồi quy đa biến trong SPSS
Các phần trước, Luận Văn 3C đưa ra các bài viết hướng dẫn phân tích độ tin cậy thang đo Cronbach’s Alpha, phân tích nhân tố khám phá EFA, kiểm định độ tin cậy thang đo Cronbach’s Alpha, Phân tích tương quan pearson trong SPSS … cùng với đó là cách chạy và đọc kết quả bằng phần mềm SPSS. Tiếp tục, phần tiếp theo Luận Văn 3C sẽ hướng dẫn lý thuyết cùng với cách chạy số liệu SPSS để phân tích hồi quy đa biến.
Nội dung chính
1. Lý thuyết về hồi quy đa biến
Hồi quy đa biến hay còn gọi là hồi quy tuyến tính bội là mở rộng của hồi quy tuyến tính đơn. Nó được sử dụng khi chúng ta muốn dự đoán giá trị của một biến phụ thuộc dựa trên giá trị của nhiều biến độc lập khác. Hồi quy đa biến cho phép chúng ta xác định mức độ ảnh hưởng từng nhân tố độc lập lên biến phụ thuộc.
Phương trình hồi quy đa biến có dạng tổng quát như sau
Y = β0 + β1X1 + β2X2 + … + βnXn + e
Trong đó:
Y: biến phụ thuộc, là biến chịu tác động của biến khác.
•X, X1, X2, Xn: biến độc lập tác động lên biến phụ thuộc
•β0: là hệ số chặn, hay còn gọi là tung độ gốc
•β1, β2, βn: hệ số hồi quy, hay còn được gọi là hệ số góc. Chỉ số này cho cho biết có bao nhiêu đơn vị Y sẽ thay đổi khi X tăng hoặc giảm một đơn vị.
•e: là sai số ngẫu nhiên, hình thành từ nhiều nguồn, ngoài tầm kiểm tra của hệ thống nghiên cứu (sai số rất nhỏ trong điều kiện thí nghiệm, sai số của dụng cụ, sai số khi theo dõi, ghi chép kết quả . . . ).
2. Ước lượng phân tích hồi quy tuyến tính bội bằng OLS
Mô hình hồi quу bình phương nhỏ nhất OLS (Ordinary Least Squares ) thường được ѕử dụng trong хem хét ѕự ảnh hưởng của các biến độc lập (biến giải thích) ᴠới biến phụ thuộc (biến được giải thích), từ đó хem хét tính phù hợp cũng như dự báo.
Giả định mô hình hồi quy tuyến tính bội
Khả năng áp dụng của kỹ thuật OLS dựa trên một số giả định nhất định. Các giả định của OLS như sau:
•Sai số của phần dư (residuals errors) ở đường thẳng hồi quy có phân phối chuẩn hoặc xấp xỉ phân phối chuẩn.
•Phương sai sai số đồng nhất theo tất cả các quan sát.
•Sai số ngẫu nhiên sẽ độc lập thống kê lẫn nhân. Đây là giả định về không tự tương quan.
•Dữ liệu không có chứa các điểm dị biệt (Xem thêm phát hiện điểm dị biệt).
•Biến phụ thuộc trong mô hình phải là biến liên tục (có thể dạng tỉ lệ, hoặc dạng khoảng)
•Có mối quan hệ tuyến tính giữa biến phụ thuộc với các biến giải thích của mô hình. Nếu dữ liệu có dạng phi tuyến, thì chúng ta thực hiện biến đổi biến thành biến mới qua một dạng hàm phù hợp sao cho biến mới này thỏa mãn giả định tuyến tính của mô hình hồi quy.
•Không có sự đa cộng tuyến giữa các biến giải thích. Điều đó có nghĩa các biến giải thích trong mô hình không có sự tương quan cao với nhau.
Nguyên tắc của phương pháp hồi quy OLS là làm cho biến đổi phần dư này trong phép hồi quy là nhỏ nhất. Khi biểu diễn trên mặt phẳng Oxy, đường hồi quy OLS là một đường thẳng đi qua phần tử dữ liệu mà ở đó, khoảng cách từ các điểm dữ liệu (trị tuyệt đối của ε) đến đường hồi quy là ngắn nhất.
Trên đồ thị scatter thể hiện mối quan hệ giữa các biến độc lập và biến phụ thuộc, các điểm số liệu sẽ nằm phân tán nhưng có xu hướng chung tạo thành dạng một đường thẳng. Có thể có rất nhiều đường đường thẳng hồi quy đi qua các điểm số liệu này, chúng ta phải giải quyết bài toán chọn ra đường thẳng nào mô tả sát nhất xu hướng dữ liệu. Bình phương nhỏ nhất OLS sẽ tìm ra đường thẳng đó dựa trên nguyên tắc cực tiểu hóa khoảng cách từ các điểm dữ liệu đến đường thẳng.
3. Hướng dẫn phân tích hồi quy đa biến trong SPSS
Khi chạy phần mềm SPSS để phân tích hồi quy đa biến ta cần quan tâm đến các thông số sau:
Hệ số Beta: hệ số hồi quy chuẩn hoá cho phép so sánh trực tiếp giữa các hệ số dựa trên mối quan hệ giải thích của chúng với biến phụ thuộc.
Hệ số R2: đánh giá phần biến động của biến phụ thuộc được giải thích bởi các biến dự báo hay biến độc lập. Hệ số này có thể thay đổi từ 0 đến 1. Nếu giá trị này nằm trong khoảng từ 0.5 – 1 thì là mô hình tốt, < 0.5 là mô hình chưa tốt.
Kiểm định ANOVA để kiểm tra tính phù hợp của mô hình với tập dữ liệu gốc.
Giá trị Sig. của kiểm định t được sử dụng để kiểm định ý nghĩa của hệ số hồi quy, nếu mức ý nghĩa của kiểm định < 0.05 thì ta có thể kết luận mô hình hồi quy phù hợp với tập dữ liệu.
Hệ số phóng đại phương sai (VIF): là một chỉ số đánh giá hiện tượng cộng tuyến trong mô hình hồi quy. VIF càng nhỏ, càng ít khả năng xảy ra đa cộng tuyến. Hair và cộng sự (2009) cho rằng, ngưỡng VIF từ 10 trở lên sẽ xảy ra đa cộng tuyến mạnh. Nhà nghiên cứu nên cố gắng để VIF ở mức thấp nhất có thể, bởi thậm chí ở mức VIF bằng 5, bằng 3 đã có thể xảy ra đa cộng tuyến nghiêm trọng. Theo Nguyễn Đình Thọ (2010) , trên thực tế, nếu VIF > 2, thì đã có thể xảy ra sự đa cộng tuyến gây sai lệch các ước lượng hồi quy. Vì vậy nếu VIF > 2 có thể kiểm tra hiện tượng đa cộng tuyến.
3.1. Cách chạy hồi quy đa biến trong SPSS
Xét ví dụ về phân tích hồi quy đa biến trong SPSS: Nghiên cứu nghiên cứu các tác động của quảng cáo trên mạng xã hội đến hành vi mua sắm trực tuyến của giới trẻ
Mô hình nghiên cứu
3.2. Các bước thực hành phân tích hồi quy đa biến bằng phần mềm SPSS như sau:
Bước 1: Vào Analyze > Regression > Linear…
Bước 2: Đưa biến phụ thuộc YD_F vào ô Dependent, các biến độc lập TT_F, GT_F, STC_F, SPN_F, TTXH_F, vào ô Independents




3.3. Đọc kết quả phân tích hồi quy đa biến trong SPSS
Kết quả chạy hồ quy đa biến trong SPSS sẽ xuất ra nhiều bảng, chúng ta sẽ tập trung vào các bảng ANOVA, Model Summary, Coefficients và ba biểu đồ Histogram, Normal P-P Plot, Scatter Plot.Dựa vào ý nghĩa chỉ số trong hồi quy ở phần trước, chúng ta sẽ tiến hành đọc kết quả hồi quy đa biến trong SPSS lần lượt trong các bảng:
Bảng Model Summary:
Tham số R bình phương hiệu chỉnh (Adjusted R Square) cho biết mức độ (%) sự biến thiên của biến phụ thuộc được giải thích bởi biến độc lập. Theo bảng kết quả trên trên R2 =0,754. nói rằng nói 75,4% sự biến các yếu tố quảng cáo trên mạng xã hội tác động đến ý định mua sắm trực tuyến của giới trẻ.
Model Summaryb | |||||
Model | R | R Square | Adjusted R Square | Std. Error of the Estimate | Durbin-Watson |
1 | .754a | .569 | .557 | .47799 | 1.977 |
a. Predictors: (Constant), TTXH_F, GT_F, SPN_F, STC_F, TT_F | |||||
b. Dependent Variable: YD_F |
Bảng ANOVA
ANOVAa | ||||||
Model | Sum of Squares | df | Mean Square | F | Sig. | |
1 | Regression | 55.183 | 5 | 11.037 | 48.306 | .000b |
Residual | 41.811 | 183 | .228 | |||
Total | 96.995 | 188 | ||||
a. Dependent Variable: YD_F | ||||||
b. Predictors: (Constant), TTXH_F, GT_F, SPN_F, STC_F, TT_F |
Từ kết quả trên cho thấy F = 48.306 với giá trị sig = 0,000 < 0,05) nên ta đủ cơ sở kết luận mô hình hồi quy đã xây dựng là phù hợp với tập dữ liệu, các biến độc lập đều có tác động nhất định đến biến phụ thuộc. Mô hình hồi quy tuyến tính có thể có thể suy rộng và áp dụng cho tổng thể.
Bảng Coefficients
Coefficientsa | ||||||||
Model | Unstandardized Coefficients | Standardized Coefficients | t | Sig. | Collinearity Statistics | |||
B | Std. Error | Beta | Tolerance | VIF | ||||
1 | (Constant) | -.047 | .247 | -.190 | .849 | |||
TT_F | .245 | .042 | .297 | 5.771 | .000 | .889 | 1.124 | |
GT_F | .117 | .038 | .157 | 3.106 | .002 | .919 | 1.088 | |
STC_F | .300 | .035 | .434 | 8.559 | .000 | .918 | 1.090 | |
SPN_F | .335 | .038 | .432 | 8.842 | .000 | .987 | 1.013 | |
TTXH_F | .254 | .049 | .261 | 5.236 | .000 | .947 | 1.056 | |
a. Dependent Variable: YD_F |
Kết quả hồi quy cho thấy cả 5 yếu tố có giá trị sig < 0,05, nên tất cả 05 yếu tố này đều có ý nghĩa thống kê ở độ tin cậy 95%. Vì vậy, các yếu tố này đều thật sự ảnh hưởng đến ý định mua sắm trực tuyến của giới trẻ.
Hệ số phóng đại phương sai VIF đều bé hơn 2 = > không có hiện tượng đa cộng tuyến.
4. Đánh giá giả định hồi quy đa biến qua 3 biểu đồ
4.1. Biểu đồ tần số phần dư chuẩn hóa Histogram
Trong phân tích hồi qui đa biến, một mô hình dự báo tốt nguyên tắc bắt buộc là mẫu có phân phối chuẩn. Trong nghiên cứu sẽ xem xét phân phối chuẩn phần dư bằng cách xây dựng biểu đồ tần số Histogram để quan sát phân phối của phần dư. Theo kết quả phân tích phần dư cho thấy giá trị trung bình Mean = 4,13-16 ~ 0 và độ lệch chuẩn Std. Dev = 0,987 ~ 1 có thể nói phân phối phần dư xấp xỉ chuẩn. Do đó có thể kết luận rằng giả thuyết phân phối chuẩn trong mô hình không bị vi phạm.
4.2. Giả định liên hệ tuyến tính
Xem xét mối liên hệ giữa phần dư chuẩn hóa và giá trị dự đoán thông qua biểu đồ phân tán, nếu giả định liên hệ tuyến tính và phương sai bằng nhau được thỏa mãn thì sẽ không có liên hệ giữa giá trị dự đoán và phần dư, chúng sẽ phân tán ngẫu nhiên trong một đường xung quanh đường đi qua trục tung độ 0 và không tạo thành một hình cụ thể. Theo biểu đồ phân tán Normal P-P plot giữa phần dư và giá trị dự đoán của mô hình hồi qui cho thấy không có mối liên hệ giữa phần dư và giá trị dự đoán. Phần dư phân tán ngẫu nhiên xung quanh đường đi qua tung độ 0, do đó giả định liên hệ tuyến tính trong mô hình bị bác bỏ.
4.3. Biểu đồ Scatter Plot kiểm tra giả định liên hệ tuyến tính
Biểu đồ phân tán Scatter Plot giữa các phần dư chuẩn hóa và giá trị dự đoán chuẩn hóa giúp chúng ta dò tìm xem, dữ liệu hiện tại có vi phạm giả định liên hệ tuyến tính hay không.
Kết quả đồ thị xuất ra, các điểm phân bố của phần dư nếu có các dạng đường thẳng thì dữ liệu có liên hệ tuyến tính. Các phần dư phải phân tán ngẫu nhiên trong một vùng xung quanh đường hoành độ 0.
4.4. Giả định về tính độc lập của sai số
Tính độc lập của sai số là không có tương quan giữa các phần dư với sai số thực ei cho là biến ngẫu nhiên, độc lập, có phân phối chuẩn với trung bình bằng 0 và phương sai không đổi σ2.Đại lượng thống kê DurbinP -Watson (d) dùng để kiểm định tương quan của các sai số kề nhau (tương quan chuỗi bậc nhất). Giả thuyết kiểm định là:
Ho: hệ số tương quan tổng thể của các phần dư = 0.
Đại lượng d có giá trị biến thiên trong khoảng từ 0 đến 4. Nếu các phần dư không có tương quan chuỗi bậc nhất với nhau, giá trị d sẽ gần bằng 2. Khi tiến hành kiểm định Durbin-Watson, nếu giá trị d là: 1 < D < 3 thì mô hình không có tự tương quan (Hoàng Trọng & ctg, 2008). Kết quả kiểm định của mô hình bằng kiểm định DurbinWatson có giá trị D = 1,997 cho thấy chưa đủ cơ sở bác bỏ giả thuyết H0: hệ số tương quan tổng thể của các phần dư = 0. Do đó, không có hiện tượng tự tương quan xảy ra trong mô hình.
Từ khóa tìm kiếm: phân tích hồi quy trong spss, phân tích hồi quy đa biến trong spss, phân tích hồi quy tuyến tính bội trong spss, phan tich hoi quy trong spss, phân tích hồi quy bội, Phân tích hồi quy trên SPSS, Phân tích hồi quy đa bội trên SPSS, phân tích hồi quy spss, phan tich hoi quy da bien bang spss, cách đọc kết quả phân tích hồi quy, cách phân tích hồi quy đa biến trong spss, phân tích hồi quy bội, các bước phân tích hồi quy spss, hướng dẫn phân tích hồi quy bằng spss, các bước phân tích hồi quy, phân tích hồi quy tuyến tính trong spss
Xem thêm các bài viết:
=>Phân tích phương sai một yếu tố anova trong SPSS =>Dịch vụ phân tích định lượng, dịch vụ xử lý số liệu SPSS Stata eview.. |

Tôi là Nguyễn Đình Long, hiện tại tôi là Quản lý nội dung của Luận Văn 3C– Chuyên cung cấp dịch vụ làm luận văn uy tín. Chúng tôi đặt lợi ích của khách hàng là ưu tiên hàng đầu. Website: https://luanvan3c.com/ – Hotline: 0966.736.325.
GẶP TƯ VẤN VIÊN
Bình chọn Phân loại tài trợ thương mại quốc tế giành cho đang sinh viên, học viên cao học theo học ngành tài chính ngân hàng đang hoàn thiện khóa luận, luận văn thạc sĩ. Bài viết này cho các bạn cái nhìn tổng quan về: Phân loại tài trợ thương mại quốc tế . Nếu […]
Bình chọn Cơ sở lý luận tài trợ Thương mại Quốc tế giành cho đang sinh viên, học viên cao học theo học ngành tài chính ngân hàng đang hoàn thiện khóa luận, luận văn thạc sĩ. Bài viết này cho các bạn cái nhìn tổng quan về: Khái niệm, Đặc điểm và vai trò […]
Bình chọn Chuyên mục chia sẻ các đề tài luận văn thạc sĩ tài chính ngân hàng Tài trợ thương mại quốc tế của chính phủ đối với doanh nghiệp Việt Nam – Thực trạng và giải pháp đến năm 2020 cho các bạn học viên đang làm luận văn tham khảo. Với những học […]
Bình chọn Sự cần thiết và mô hình tổ chức của kiểm toán nội bộ tại ngân hàng thương mại giành cho đang sinh viên, học viên cao học theo học ngành tài chính ngân hàng đang hoàn thiện khóa luận, luận văn thạc sĩ. Bài viết này cho các bạn cái nhìn tổng quan […]
Bình chọn Kết thúc khóa học thạc sĩ ngành quản lý kinh tế, mỗi học viên sẽ phản chọn lựa đề tài để viết luận văn cao học. Việc lựa chọn đề tài cần mang tính thiết thực với vị trí công việc và đơn vị công tác các học viên cũng cần phải xem […]
Bình chọn Cơ sở lý luận kiểm toán nội bộ ngân hàng thương mại giành cho đang sinh viên, học viên cao học theo học ngành tài chính ngân hàng đang hoàn thiện khóa luận, luận văn thạc sĩ. Bài viết này cho các bạn cái nhìn tổng quan về: Khái niệm kiểm toán nội […]
Bình chọn Chuyên mục chia sẻ các đề tài luận văn thạc sĩ tài chính ngân hàng Kiểm toán nội bộ hoạt động tín dụng tại Ngân hàng thương mại cổ phần Bắc Á cho các bạn học viên đang làm luận văn tham khảo. Với những học viên chuẩn bị làm bài luận văn […]
Bình chọn Ứng dụng thương mại điện tử trong doanh nghiệp bán lẻ giành cho đang sinh viên, học viên cao học theo học ngành quản trị kinh doanh đang hoàn thiện khóa luận, luận văn thạc sĩ. Bài viết này cho các bạn cái nhìn tổng quan về: Marketing điện tử, Quản trị Chuỗi […]
Bình chọn Trước khi chạy dữ liệu trên phần mềm SPSS để làm bài nghiên cứu, đầu tiên ta cần nhập dữ liệu vào SPSS. Để giúp bạn đọc cách nhập dữ liệu SPSS, Luận văn 3C sẽ giới thiệu trong bài viết sau. Nội dung chính1. Các cách nhập dữ liệu trong SPSS2. Nhập […]
Bình chọn Trong bài viết phần 1 “Hướng dẫn phân tích thông kê mô tả trên SPSS – Phần 1: Thống kê tần số”, đã đưa ra khái niệm thống kê mô tả, các loại thống kê mô tả và cách thức thực hiện phân tích thống kê tần số trên SPSS. Bài viết phần […]
Bình chọn Nội dung chính1. Giới thiệu thống kê mô tả2. Phân tích thống kê mô tả trên SPSS: Thống kê tần số2.1. Phân tích thống kê tần số là gì?2.2. Sau đây là hướng dẫn chi tiết thực hiện thống kê tần số trên SPSS 1. Giới thiệu thống kê mô tả Thống kê […]
Bình chọn Phần mềm SPSS (Statistical Product and Services Solutions) về là một phần mềm thống kê, thường được dùng trong nghiên cứu xã hội, tiếp thị, trong nghiên cứu thị trường…. SPSS cung cấp một hệ thống quản lý dữ liệu và khả năng phân tích thống kê với giao diện thân thiện cho người dùng […]
Bình chọn Nội dung chính1. Giới thiệu phần mềm SPSS2. Các chức năng chính của phần mềm SPSS2.1. Chức năng nhập và và làm sạch dữ liệu trong SPSS2.2. Chức năng phân Tích Thống Kê Cơ Bản2.3. Chức năng phân tích độ tin cậy Cronbach’s Alpha2.4. Chức năng phân tích nhân tố khám phá EFA2.5. […]
Bình chọn Phân tích phương sai hay còn gọi là phân tích ANOVA. Trong các bài nghiên cứu khoa học, Phân tích phương sai ANOVA là một phương pháp được dùng để so sánh giá trị từ các bộ dữ liệu khác nhau. Vậy Phân tích ANOVA là gì? Sử dụng Phân tích ANOVA ra sao và […]
5/5 - (1 bình chọn) Phân tích hệ số tương quan pearson là một bước trong bài xử lý số liệu SPSS. Tiếp theo của bước phân tích nhân tố khám phá EFA. Trước khi thực hiện phân tích hồi qui của mô hình thì cần tiến hành phân tích tương quan giữa các nhân tố độc […]
Bình chọn Nội dung chính1. Giới thiệu phân tích nhân tố khám phá2. Cách phân tích nhân tố khám phá EFA 1. Giới thiệu phân tích nhân tố khám phá Trước khi kiểm định lý thuyết khoa học thì cần phải đánh giá độ tin cậy và giá trị của thang đo. Phương pháp Cronbach […]