您好,欢迎来到爱够旅游网。
搜索
您的当前位置:首页统计学实验分析 SPSS

统计学实验分析 SPSS

来源:爱够旅游网


重庆工商大学数学与统计学院

《统计应用软件》课程实验报告

实验项目 实验日期 实验目的 实验内容:

第一步 用统计软件SPSS 打开居民储蓄调查数据。

利用SPSS统计软件,对数据进行分析。

周一,3-5节 实验地点 80608

运用SPSS软件对居民储蓄调查数据进行基本统计分析,T检验,单因素分析,多因素方差分析,相关分析,偏相关分析,以及曲线估计。二项logistic回归分析。

第二步 进行分析。

一.根据提供数据,对居民调查数据进行基本统计分析。

1.选择菜单Analyze- Descriptive statistics-Frequencies,出现下图所示

2.得出结论

Frequency Table

职业 Valid Frequency 国家机关 商业服务业 文教卫生 公交建筑业 经营性公司 学校 一般农户 种粮棉专业户 种果菜专业户 工商运专业户 退役人员 金融机构 现役军人 Total 24 18 15 18 15 35 4 10 34 17 35 3 282 Percent 8.5 19.1 6.4 5.3 6.4 5.3 12.4 1.4 3.5 12.1 6.0 12.4 1.1 100.0 Valid Percent 8.5 19.1 6.4 5.3 6.4 5.3 12.4 1.4 3.5 12.1 6.0 12.4 1.1 100.0 Cumulative Percent 8.5 27.7 34.0 39.4 45.7 51.1 63.5 .9 68.4 80.5 86.5 98.9 100.0 年龄 Valid Frequency 20岁以下 20~35岁 35~50岁 50岁以上 Total 4 146 91 41 282 Percent 1.4 51.8 32.3 14.5 100.0 Valid Percent 1.4 51.8 32.3 14.5 100.0 Cumulative Percent 1.4 53.2 85.5 100.0

Bar Chart

得出结论:

1按职业进行分类。例如,职业为国家机关的人数为24人,占总人数的8.5%; 一般农户的人数为35人,占总人数的2.4%。

按年龄划分,20岁以下的人共有4人,占总人数的1.4%;20~35岁

共有146人,占总人数的51.8%。

因为职业和年龄在变量中,无去ishishuju,因为百分比与有效百分比总是相同的。

2 根据柱形图,本次被调查者的年龄分布情况是:20-35岁最多,其次是35-50

岁,50岁以上,最少的人数是20岁以下。

当选择PIE CHART时,得出结论如下图。

Pie Chart

2. 选择菜单Analyze- Descriptive statistics-Frequencies,出现下图所示

得出结论:

Descriptives

上图表明,

二.对数据进行T检验分析。

1.选择Analyze-compare means-one-samples T test 如下图。

选择Option

2得出结论:

T-Test

One-Sample Statistics 存(取)款金额 N 282 Mean 4738.09 Std. Deviation 10945.569 Std. Error Mean 651.799 One-Sample Test 存(取)款金额 t 4.201 df 281 Test Value = 2000 95% Confidence Interval of the Difference Sig. (2-tailed) .000 Mean Difference 2738.0 Lower 1455.06 Upper 4021.12 该问题应采用双尾检验,因此比较a/2 和p/2。由于p小于a,因此拒绝零假设。认为出乎总体一次平均村会计呢与2000元有显著差异。95%的置信区间告之,有95%的把握认为储户总体平均一次在3455.06 –6021.12元之间。2000元不包含在置信区间内,也证实了上述推断。 三.对数据进行多因素方差检验。

1选择菜单Analyze-general linear model-univariate 于是出现窗口

均值比较。

控制变量交互作用图形分析

2.得出结论

Univariate Analysis of Variance

Between-Subjects Factors 收入水平 1 2 3 4 Value Label 300元以下 300~800元 800~1500元 1500元以上 N 50 1 50 18 物价水平 1 2 3 过高 偏高 正常 45 179 58 Tests of Between-Subjects Effects Dependent Variable:什么合算 Type III Sum of Source Corrected Model Intercept a4 a8 a4 * a8 Error Total Corrected Total Squares 3.787 160.129 1.156 .086 2.155 63.305 612.000 67.092 adf 10 1 3 2 5 271 282 281 Mean Square .379 160.129 .385 .043 .431 .234 F 1.621 685.487 1.650 .184 1.845 Sig. .100 .000 .178 .832 .104 a. R Squared = .056 (Adjusted R Squared = .022) 上图表明,第一列是对观测变量总变差分解的说明;第二列是观测变量变差分解的结果。第三列表明自由度;第四列是均方;第五列是F检验统计量的观测值;第六列是检验统计量的概率P值。

可以看出,观测变量的总变差为67.092。它由4部分组成,分别是收入水平a4=1.156,物价水平a8=.086,由收入水平和物价水平交互作用引起的变差

a4*a8=2.155,由随机因素引起的变差error=63.305。这些变差除以各自的自由度后,得到各自的均方,并可计算出各F检验统计量的观测值和在一定自由度下的概率P值(即第六列)。若显著性水平α=0.05,由于Fa4,Fa8的概率p值小于显著性水平α,则应拒绝零假设。可以认为收入水平和物价水平总体均值存在显著差异,对什么合算的效应不同时为0,各自不同的水平给什么合算带来了显著影响。 同时由于Fa4,Fa8的概率p值小于显著性水平α,则应拒绝零假设,可以认为不同的收入水平和物价水平对什么合算带来了交互作用,不同的收入水平与物价水平会影响到购买什么合算。

Custom Hypothesis Tests

Contrast Results (K Matrix)

Dependent Variable

收入水平 Deviation Contrast Level 1 vs. Mean

Contrast Estimate Hypothesized Value

a

什么合算

.008 0 Difference (Estimate - Hypothesized) Std. Error Sig. 95% Confidence Interval for Lower Bound Difference Level 2 vs. Mean Contrast Estimate Hypothesized Value Difference (Estimate - Hypothesized) Std. Error Sig. 95% Confidence Interval for Lower Bound Difference Level 3 vs. Mean Contrast Estimate Hypothesized Value Difference (Estimate - Hypothesized) Std. Error Sig. 95% Confidence Interval for Lower Bound Difference a. Omitted category = 4 Upper Bound Upper Bound Upper Bound .008 .084 .921 -.156 .173 -.020 0 -.020 .065 .758 -.149 .108 -.036 0 -.036 .080 .651 -.193 .121 上图分别表明收入水平前三个水平下买什么合算的均值检验结果,省略了第四水平的检验结果,检验值是总体均值。可以看出,第一种收入水平下的什么合算的均值与检验值差0.008,标准误差为0.084,检验统计量的概率p值为0.0921,差值的95%置信区间的下限和上限分别是-0.156和0.173。分析结论是,第一种收入水平下的合算均值与检验值不存在显著差异。同理,第二种和第三种也不存在显著差异。所以可得出,在三种情况下,都不存在显著差异。 Test Results Dependent Variable:什么合算 Source Contrast Error Sum of Squares .063 63.305 df 3 271 Mean Square .021 .234 F .090 Sig. .966

Profile Plots

上图表明从收入水平过高,偏高,正常的渐变期间,对购买力有很大程度上的影响。即可以同上述存在明显交互作用达成一致结论。

四.对数据进行偏相关数据分析。 1.选择菜单Analyze-correlate-partial 2.选择参与分析的变量到variable

3.选择一个或多个控制变量到controlling for框中

选择Option Zero-order correlation 表示输出零阶偏相关系数。

2. 得出结论

Partial Corr

Correlations Control Variables -none- a存(取)款金额 Correlation Significance (2-tailed) df 1.000 . 0 .184 .002 280 .014 收入水平 .184 .002 280 1.000 . 0 -.001 物价趋势 .014 .821 280 -.001 .983 280 1.000 存(取)款金额 收入水平 Correlation Significance (2-tailed) df 物价趋势 Correlation Significance (2-tailed) df 物价趋势 存(取)款金额 Correlation Significance (2-tailed) df 收入水平 Correlation Significance (2-tailed) df a. Cells contain zero-order (Pearson) correlations. .821 280 1.000 . 0 .184 .002 279 .983 280 .184 .002 279 1.000 . 0 . 0

五.对数据计算相关系数

1选择菜单analyze-correlate-bivariate

2选择options—cross—product deviations and covariances 表示输出各变量的离差平方和,样本方差,两变量的叉积离差和协方差

3得出结论

Correlations

Correlations 收入情况 Pearson Correlation Sig. (2-tailed) Sum of Squares and Cross-products Covariance N 收入情况 1 存(取)款金额 -.090 .131 -167118.532 物价水平 .046 .439 4.723 101.872 .363 282 -.090 .131 -167118.532 -594.728 282 1 .017 282 -.008 .8 -14216.152 存(取)款金额 Pearson Correlation Sig. (2-tailed) Sum of Squares and Cross-products Covariance N 3.367E10 -594.728 282 .046 .439 4.723 1.198E8 282 -.008 .8 -14216.152 -50.591 282 1 物价水平 Pearson Correlation Sig. (2-tailed) Sum of Squares and Cross-products 102.401 Covariance N

.017 282 -50.591 282 .3 282 上图表明,收入情况与存取款金额的简单相关系数为-0.090,与物价水平的简单相关系数为0.439。它们的相关系数检验的概率p分别为0.131和0.439。当显著性水平α为0.05或0.01时,都接受相关系数检验的零假设,认为两总体不存在线性关系。

六.对数据进行曲线估计

1.选择菜单Analyze-regression- curve estimation。

2 得出结论

Curve Fit

Model Description Model Name Dependent Variable Equation 1 1 2 Independent Variable Constant Variable Whose Values Label Observations in Plots Tolerance for Entering Terms in Equations MOD_1 收入情况 Quadratic Cubic 存(取)款金额 Included 存(取)款种类 Case Processing Summary Total Cases Excluded Cases Forecasted Cases Newly Created Cases aN 282 0 0 0 a. Cases with a missing value in any variable are excluded from the analysis. Variable Processing Summary Number of Positive Values Number of Zeros Number of Negative Values Number of Missing Values Variables Dependent 收入情况 282 0 0 Independent 存(取)款金额 282 0 0 0 0 User-Missing System-Missing 0 0 收入情况

Model Summary Adjusted R R .146 R Square .021 Square .014 Std. Error of the Estimate .598 The independent variable is 存(取)款金额. ANOVA Regression Residual Total Sum of Squares 2.166 99.706 101.872 df 2 279 281 Mean Square 1.083 .357 F 3.031 Sig. .050 The independent variable is 存(取)款金额. Coefficients Unstandardized Coefficients Standardized Coefficients Beta -.337 .272 t -2.396 . 48.500 Sig. .017 . .000 存(取)款金额 存(取)款金额 ** 2 (Constant) B -1.855E-5 2.048E-10 2.080 Std. Error .000 .000 .043 Cubic Model Summary Adjusted R R .165 R Square .027 Square .017 Std. Error of the Estimate .597 The independent variable is 存(取)款金额. ANOVA Regression Residual Total Sum of Squares 2.784 99.0 101.872 df 3 278 281 Mean Square .928 .356 F 2.603 Sig. .052 The independent variable is 存(取)款金额. Coefficients Unstandardized Coefficients Standardized Coefficients Beta -.596 1.090 -.598 t -2.467 . . 45.121 Sig. .014 . . .000 存(取)款金额 存(取)款金额 ** 2 存(取)款金额 ** 3 (Constant) B -3.277E-5 8.193E-10 -5.130E-15 2.104 Std. Error .000 .000 .000 .047 七.二项Logistic回归分析

1选择菜单Analyze-Regression-Binary logistic 。添加变量。

2单击categorical按钮指定如何生成虚拟变量,选择变量

3选择Options 和save 4 得出结论

Logistic Regression

Case Processing Summary Unweighted Cases Selected Cases Included in Analysis Missing Cases Total Unselected Cases Total aN 281 1 282 0 282 Percent 99.6 .4 100.0 .0 100.0 a. If weight is in effect, see classification table for the total number of cases. Dependent Variable Encoding Original Value 城镇户口 农村户口 Internal Value 0 1 Categorical Variables Codings 存(取)款种类 三年以上定期 三年以下定期 活期 定活两便 活期工资帐户 各类信用卡 Frequency 50 59 135 3 22 12 156 34 57 34 (1) 1.000 .000 .000 .000 .000 .000 .000 1.000 .000 .000 (2) Parameter coding (3) .000 .000 1.000 .000 .000 .000 .000 .000 .000 1.000 (4) .000 .000 .000 1.000 .000 .000 (5) .000 .000 .000 .000 1.000 .000 .000 1.000 .000 .000 .000 .000 .000 .000 1.000 .000 现金不存的原因 日常生活用钱 生意周转金 岁制购买中意商品 购买国库券

Block 0: Beginning Block

Classification Table a,b Step 0 Observed 户口 城镇户口 农村户口 Overall Percentage a. Constant is included in the model. b. The cut value is .500 户口 城镇户口 199 82 Predicted Percentage Correct 100.0 .0 70.8 农村户口 0 0

Variables in the Equation Step 0 Constant B -.887 S.E. .131 Wald 45.6 df 1 Sig. .000 Exp(B) .412 Variables not in the Equation Step 0 Variables a4 a6 a6(1) a6(2) a6(3) a6(4) a6(5) a12 a12(1) a12(2) a12(3) Score 15.8 20.4 3.445 12.070 10.599 1.250 .481 32.3 23.620 .284 12.888 68.314 df 1 5 1 1 1 1 1 3 1 1 1 9 Sig. .000 .001 .063 .001 .001 .2 .488 .000 .000 .594 .000 .000 Overall Statistics

Block 1: Method = Enter

Omnibus Tests of Model Coefficients Step 1 Step Block Model Chi-square 79.111 79.111 79.111 df 9 9 9 Sig. .000 .000 .000 Model Summary Cox & Snell R Step -2 Log likelihood Square Nagelkerke R Square 1 260.207 a.245 .350 a. Estimation terminated at iteration number 20 because maximum iterations has been reached. Final solution cannot be found. Hosmer and Lemeshow Test Step 1 Chi-square 4.000 df 7 Sig. .780 Contingency Table for Hosmer and Lemeshow Test Step 1 1 2 3 4 5 6 7 8 9 户口 = 城镇户口 Observed 26 28 26 44 20 15 15 16 9 Expected 25.659 27.635 24.346 41.716 22.216 15.684 17.365 15.351 9.028 户口 = 农村户口 Observed 0 1 2 6 9 9 13 14 28 Expected .341 1.365 3.6 8.284 6.784 8.316 10.635 14.9 27.972 Total 26 29 28 50 29 24 28 30 37 Classification Table a Step 1 Observed 户口 城镇户口 农村户口 Overall Percentage a. The cut value is .500 户口 城镇户口 1 51 Predicted Percentage Correct 95.0 37.8 78.3 农村户口 10 31

Variables in the Equation Step 1 a a4 a6 a6(1) a6(2) a6(3) a6(4) a6(5) a12 a12(1) a12(2) a12(3) Constant B -1.085 S.E. .2 Wald 18.176 18.347 .967 .957 .932 1.771 3.708 .106 .000 .193 28.380 .514 .384 20.511 .047 4.675 .058 df 1 5 1 1 1 1 1 3 1 1 1 1 Sig. .000 .003 .183 .0 .744 .999 .661 .000 .000 .829 .031 .810 Exp(B) .338 1.286 1.843 .304 -18.111 .472 3.619 6.312 1.355 .000 1.604 20993.578 1.076 2.330 -.083 -2.284 .249 10.274 .920 .102 1.283 1.056 1.035 a. Variable(s) entered on step 1: a4, a6, a12.

Step number: 1

Observed Groups and Predicted Probabilities + | | | + |

80 +

|

|

F |

R 60 +

E |

Q | 2

| | + | | | + |

|112 11 11 1 1 1 2 1 2 |

|1111111 1 11 21 2 1 12 1 1 1 1 2 2 2 1 2 2 2 | Predicted

---------+---------+---------+---------+---------+---------+---------+---------+---------+---------- Prob:

0 .1 .2 .3 .4 .5 .6 .7 .8 .9 1 Group:

1111111111111111111111111111111111111111111111111122222222222222222222222222222222222222222222222222

Predicted Probability is of Membership for 农村户口 The Cut Value is .50 Symbols: 1 - 城镇户口

2 - 农村户口

Each Symbol Represents 5 Cases.

U | 1

E 40 + 1

N | 1

C | 1

Y | 1

20 + 1 2 2

| 1 11 2 2 2

八.单因素分析

1选择analyse- compare means-one way-anova

得出结论

Oneway

ANOVA 收入水平 Between Groups (Combined) LUnweighted iWeighted nDeviation ear Term Sum of Squares 1.798 1.203 .001 1.797 df 3 1 1 2 Mean Square .599 1.203 .001 .9 FWithin Groups Total 165.606 167.404 278 281 .596 存(取)款金额 Between Groups (Combined) LUnweighted iWeighted nDeviation ear Term 5.657E8 3.753E8 1.282E8 4.375E8 3 1 1 2 1.886E8 3.753E8 1.282E8 2.188E8 Within Groups Total 3.310E10 3.367E10 278 281 1.191E8 Contrast Coefficients Contrast 1 20岁以下 1 年龄 20~35岁 -.5 35~50岁 0 50岁以上 -.5 Contrast Tests 收入水平 Assume equal variances Does not assume equal variances Contrast Value of Contrast 1 1 -.61 -.61 Std. Error .392 .297 t -1.553 -2.047 df 278 3.370 Sig. (2-t存(取)款金额 Assume equal variances Does not assume equal variances 1 1 9426.49 9426.49 50.370 12365.123 1.701 .762 278 3.009

Post Hoc Tests

Multiple Comparisons Dependent Variable (I) 年龄 (J) 年龄 Mean Difference Std. Error Sig. 95% Confidence Interva(I-J) 收入水平 Scheffe 20岁以下 20~35岁 35~50岁 50岁以上 20~35岁 20岁以下 35~50岁 50岁以上 35~50岁 20岁以下 20~35岁 50岁以上 50岁以上 20岁以下 20~35岁 35~50岁 LSD 20岁以下 20~35岁 35~50岁 50岁以上 20~35岁 20岁以下 35~50岁 50岁以上 35~50岁 20岁以下 20~35岁 50岁以上 50岁以上 20岁以下 20~35岁 35~50岁 存(取)款金额 Scheffe 20岁以下 20~35岁 35~50岁 50岁以上 20~35岁 20岁以下 35~50岁 50岁以上 35~50岁 20岁以下 20~35岁 -.4 -.6 -.573 .4 -.010 .071 .6 .010 .081 .573 -.071 -.081 -.4 -.6 -.573 .4 -.010 .071 .6 .010 .081 .573 -.071 -.081 8327.815 7305.951 10525.159 -8327.815 -1021.865 2197.343 -7305.951 1021.865 .391 .394 .404 .391 .103 .136 .394 .103 .145 .404 .136 .145 .391 .394 .404 .391 .103 .136 .394 .103 .145 .404 .136 .145 5530.039 5574.425 5715.751 5530.039 1457.357 1928.597 5574.425 1457.357 .440 .433 .571 .440 1.000 .966 .433 1.000 .958 .571 .966 .958 .101 .098 .157 .101 .923 .605 .098 .923 .579 .157 .605 .579 .520 .633 .337 .520 .921 .730 .633 .921 Lower Bound -1.74 -1.76 -1.71 -.46 -.30 -.31 -.46 -.28 -.33 -.56 -.45 -.49 -1.41 -1.43 -1.37 -.13 -.21 -.20 -.12 -.19 -.21 -.22 -.34 -.37 -7226.47 -8373.18 -5551.48 -23882.10 -5120.96 -3227.20 -22985.08 -3077.23 Upper Bo238229266723076835150岁以上 50岁以上 20岁以下 20~35岁 35~50岁 LSD 20岁以下 20~35岁 35~50岁 50岁以上 20~35岁 20岁以下 35~50岁 50岁以上 35~50岁 20岁以下 20~35岁 50岁以上 50岁以上 20岁以下 20~35岁 35~50岁 3219.208 -10525.159 -2197.343 -3219.208 8327.815 7305.951 10525.159 -8327.815 -1021.865 2197.343 -7305.951 1021.865 3219.208 -10525.159 -2197.343 -3219.208 2052.406 5715.751 1928.597 2052.406 5530.039 5574.425 5715.751 5530.039 1457.357 1928.597 5574.425 1457.357 2052.406 5715.751 1928.597 2052.406 .484 .337 .730 .484 .133 .191 .067 .133 .484 .256 .191 .484 .118 .067 .256 .118 -2553.58 -26601.80 -7621. -91.99 -2558.25 -3667.49 -726.49 -19213.88 -30.72 -1599.16 -18279.40 -1846.99 -821.02 -21776.81 -5993.85 -7259.44 5532251921822172518593638727158

Homogeneous Subsets

收入水平 Student-Newman-Keulsa,,bSubset for alpha = 0.05 年龄 20岁以下 50岁以上 20~35岁 35~50岁 Sig. N 4 41 146 91 1 1.50 2.07 2.14 2.15 .121 4 41 146 91 1.50 2.07 2.14 2.15 .181 Scheffea,,b 20岁以下 50岁以上 20~35岁 35~50岁 Sig. Means for groups in homogeneous subsets are displayed. a. Uses Harmonic Mean Sample Size = 13.688. b. The group sizes are unequal. The harmonic mean of the group sizes is used. Type I error levels are not guaranteed. 存(取)款金额 Student-Newman-Keulsa,,bSubset for alpha = 0.05 年龄 50岁以上 20~35岁 35~50岁 20岁以下 Sig. N 41 146 91 4 1 2412.34 4609.68 5631.55 12937.50 .059 41 146 91 4 2412.34 4609.68 5631.55 12937.50 .098 Scheffea,,b 50岁以上 20~35岁 35~50岁 20岁以下 Sig. Means for groups in homogeneous subsets are displayed. a. Uses Harmonic Mean Sample Size = 13.688. b. The group sizes are unequal. The harmonic mean of the group sizes is used. Type I error levels are not guaranteed.

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- igbc.cn 版权所有 湘ICP备2023023988号-5

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务