新書推薦:
《
万有引力书系 纳粹亿万富翁 德国财富家族的黑暗历史
》
售價:HK$
109.8
《
中国常见植物野外识别手册:青海册
》
售價:HK$
76.2
《
三星堆对话古遗址(从三星堆出发,横跨黄河流域,长江流域,对话11处古遗址,探源多元一体的中华文明)
》
售價:HK$
87.4
《
迷人的化学(迷人的科学丛书)
》
售價:HK$
143.4
《
宋代冠服图志(详尽展示宋代各类冠服 精美插图 考据严谨 细节丰富)
》
售價:HK$
87.4
《
形似神异:什么是中日传统政治文化的结构性差异
》
售價:HK$
55.8
《
养育不好惹的小孩
》
售價:HK$
77.3
《
加加美高浩的手部绘画技法 II
》
售價:HK$
89.4
|
編輯推薦: |
从基础角度出发,通过34个课堂练习全面讲解SPSS基本知识以及常见的统计分析功能。
从实用角度出发,通过4个专业统计分析案例详细介绍SPSS在相关行业领域的具体应用。
从读者角度出发,配备资源包括50个统计分析的数据文件以及130分钟的语音视频教学文件。
配套资源的获取方式:登录清华大学出版社官网http:www.tup.com.cn,搜索本书书号,进入本书详情页面,在资源下载\网络资源处下载。
|
內容簡介: |
本书从实用角度出发,以实例的形式详细介绍了SPSS常用的统计分析方法在相关行业领域的具体应用。书中首先从SPSS软件开始介绍,详细讲解了SPSS软件的基本知识和统计分析前的准备,描述统计分析,均值比较和T检验,SPSS的方差分析,非参数检验,SPSS的相关分析,SPSS的回归分析,SPSS的多元统计分析,SPSS在时间序列预测中的应用,SPSS在问卷缺失值、信度处理与多重响应分析中的应用,统计图形,酸奶饮料新产品口味测试研究案例,某汽车企业汽车年销量的预测,中国消费者信心指数影响因素分析,偏态分布的激素水平影响因素分析等内容。
配备资源包括书中实例用到的数据文件,以及讲解实例统计分析过程的语音视频教学文件,可帮助读者快速掌握书中介绍的内容。
本书内容编排科学、实例丰富、可操作性强,适合自然科学和社会科学各领域、各专业的研究人员多层次的需要,是相关专业本科生、研究生、专业统计分析人士及管理人员和决策者等理想的参考书,也可作为大中专院校和培训机构相关专业的教材。
|
關於作者: |
刘江涛,哈尔滨理工大学副教授,主要研究方向为证券投资与风险管理,长期从事证券投资、金融工程教学和研发工作。有11年的教学经历,有丰富的教学科研能力,主讲证券投资学、金融工程学、证券技术分析等课程。发表相关论文10余篇。科研方面参与和主持纵向课题项目、横向课题项目多项。
刘立佳,黑龙江职业学院讲师,主要研究方向为机电一体化、机械制造及其自动化、电气工程自动化,长期从事软件教学和软件研发工作。有5年多的高校工作经历,有丰富的教学科研能力,主讲机械制图CAD、数控机床故障诊断与维护、自动化仪表等课程。发表论文10多篇,其中中文核心1篇、EI期刊2篇、SCI 1篇。科研方面主持院重点培育课题1项,参研国家自然基金5项。
|
目錄:
|
目 录
第1章 SPSS 23.0概述 1
1.1 SPSS 23.0的特点与新功能 1
1.2 SPSS 23.0 的环境要求 3
1.3 SPSS 23.0的安装、卸载、启动和
退出 4
1.4 SPSS 23.0相关设置 7
第2章 SPSS统计分析前的准备 17
2.1 SPSS数据文件的建立 17
2.2 SPSS数据文件的属性 20
2.3 SPSS数据文件的整理 24
2.4 思考与练习 27
第3章 描述统计分析 29
3.1 频数分析 29
3.2 描述统计分析 37
3.3 探索性分析 42
3.4 列联表分析 49
3.5 比率分析 53
3.6 思考与练习 56
第4章 均值比较和T检验 58
4.1 均值过程 58
4.2 单样本T检验 61
4.3 独立样本T检验 64
4.4 两配对样本T检验 68
4.5 思考与练习 71
第5章 方差分析 74
5.1 概述 74
5.2 单因素方差分析 75
5.3 多因素方差分析 82
5.4 协方差分析 91
5.5 重复测量方差分析 94
5.6 思考与练习 99
第6章 非参数检验 101
6.1 卡方检验 101
6.2 二项检验 107
6.3 游程检验 110
6.4 单样本K-S检验 113
6.5 两独立样本的非参数检验 117
6.6 多独立样本的非参数检验 121
6.7 思考与练习 124
第7章 相关分析 126
7.1 相关分析概述 126
7.2 简单相关分析 127
7.3 偏相关分析 132
7.4 距离分析 136
7.5 思考与练习 141
第8章 回归分析 143
8.1 一元线性回归分析 143
8.2 多元线性回归分析 149
8.3 曲线回归 152
8.4 非线性回归分析 156
8.5 思考与练习 161
第9章 SPSS的多元统计分析 163
9.1 因子分析 163
9.2 聚类分析 173
9.3 判别分析 179
9.4 思考与练习 188
第10章 时间序列预测 190
10.1 时间序列的预处理 190
10.2 时间序列的确定性分析 194
10.3 时间序列的随机性分析 204
10.4 思考与练习 209
第11章 问卷缺失值、信度处理与
多重响应分析 211
11.1 调查问卷缺失值处理方法 211
11.2 调查问卷的信度分析 220
11.3 调查问卷的多重响应分析 224
11.4 思考与练习 229
第12章 统计图形 231
12.1 SPSS图形的基本功能 231
12.2 条形图 232
12.3 折线图 252
12.4 面积图 257
12.5 饼图 262
12.6 高低图 264
12.7 箱图 267
12.8 误差条形图 270
12.9 散点图 273
12.10 直方图 276
12.11 思考与练习 278
第13章 酸奶饮料新产品口味测试
研究案例 279
13.1 案例背景 279
13.2 数据理解 280
13.3 不同品牌的评分差异分析 283
13.4 两因素方差分析模型 288
13.5 分析结论与讨论 294
第14章 某汽车企业汽车年销量的
预测 296
14.1 案例背景 296
14.2 数据理解 297
14.3 变量变换后的线性回归 298
14.4 曲线拟合 305
14.5 利用非线性回归进行拟合 309
14.6 分析结论 313
第15章 中国消费者信心指数
影响因素分析 315
15.1 案例背景 315
15.2 数据理解 318
15.3 标准框架下的建模分析 323
15.4 多元方差分析模型的结果 326
15.5 最优尺度回归 334
15.6 多水平模型框架下的建模分析 338
15.7 项目总结与讨论 344
第16章 偏态分布的激素水平
影响因素分析 346
16.1 案例背景 346
16.2 数据理解 347
16.3 对因变量变换后的建模分析 353
16.4 秩变换分析 356
16.5 利用Cox模型进行分析 357
16.6 项目总结与讨论 360
思考与练习答案 362
|
內容試閱:
|
前 言
SPSS是一种集成化的计算机处理和统计分析通用软件,是世界公认的统计分析软件包之一,非常适合进行数据分析。在经济学、医学、教育学、管理学、心理学、广告学、统计学及商业、工业、林业、农业等各个领域都有广泛的应用。
本书从实用角度出发,以实例的形式详细介绍了SPSS常用的统计分析方法在相关行业领域的具体应用。书中通过大量的实例,将作者的经验和心得与软件的操作技巧紧密结合。在内容安排上也尽量做到科学合理,把篇幅放在重点内容的讲解上,让读者花最少的时间掌握最关键的技术,可大幅度提高学习效率。
本书内容
本书首先从SPSS软件的基本知识和基本操作开始介绍,详细讲解了SPSS软件的特点、环境要求及各种常用设置。然后介绍SPSS统计分析前的准备工作,包括数据文件的建立、数据文件的属性、数据文件的整理等内容,为后面介绍具体应用打好基础。从第3章开始依次介绍了描述统计分析,均值比较和T检验,SPSS的方差分析,非参数检验,SPSS的相关分析,SPSS的回归分析,SPSS的多元统计分析,SPSS在时间序列预测中的应用,SPSS在问卷缺失值、信度处理与多重响应分析中的应用,统计图形等内容。最后4章,通过酸奶饮料新产品口味测试研究案例、某汽车企业汽车年销量的预测、中国消费者信心指数影响因素分析、偏态分布的激素水平影响因素分析等综合案例,详细深入地讲解SPSS在不同行业中的具体应用。
本书特点
本书以"实用、够用、精用"为原则,以熟练掌握SPSS应用为目的,以"学中练、练中学"的形式来组织内容,其主要特点如下。
编排科学、易学易用:书中由易到难安排内容,适合初学者循序渐进地学习。书中对每种方法都是先介绍概念、原理、操作方法,然后给出实例讲解具体应用,这样安排内容符合学习规律,方便读者掌握所学知识。
内容全面、讲解细致:书中对所有常见的统计分析方法都图文并茂地进行了深入详细的介绍,读者只要按照书中介绍的步骤进行操作,就可以轻松掌握所学内容。
案例丰富、技术实用:书中对每种分析方法都安排了实例讲解其在行业中的具体应用,在讲解过程中穿插了作者的经验和心得,可帮助读者举一反三,深入掌握所学内容。
视频教学,学习高效:配备书中实例的语音视频教学文件,不仅可帮助读者解决学习中遇到的问题,还可引导读者快速掌握所学内容,并进行技术拓展。
资源配备
本书配备的具体内容如下。
"数据文件"目录:提供了书中实例所用到的数据文件。
"视频文件"目录:书中讲解实例统计分析的语音视频教学文件。
本书配备资源请到清华大学出版社官方网站下载,网址http:www.tup.com.cn。如在下载过程中遇到问题,可联系我们,联系电话:010-62792097-201,邮箱:2864186118@qq.com。
读者对象
本书内容编排科学,实例丰富,可操作性强,适合自然科学和社会科学各领域、各专业的研究人员多层次的需要,是相关专业本科生、研究生、专业统计分析人士及管理人员和决策者等理想的参考书,也可作为大中专院校和培训机构相关专业的教材。
本书由哈尔滨理工大学的刘江涛和黑龙江职业学院的刘立佳编著,其中刘江涛编写了第8~16章,刘立佳编写了第1~7章。其他参加编写的人员还有于香芝、杨旺功、江俊浩、王劲、田万勇、赵一飞、韩成斌、周艳山、田君、张博、吴艳臣、徐昱、王永忠、李明玉、武可元、于秀青等。由于作者水平有限,书中难免存在疏漏和错误之处,敬请读者批评指正。
编 者
第3章 描述统计分析
统计分析的目的是研究总体的数量特征。为了实现上述分析,往往采用两种方式实现:一是数值计算,即计算常用的基本统计量的值,通过数值来准确反映数据的基本统计特征;二是图形绘制,即绘制常见的基本统计图形,通过图形来直观展现数据的分布特点。通常,这两种方式都是混合使用的。
SPSS 的许多模块均可完成描述分析,但专门为该目的而设计的几个模块则集中在【分析】菜单中。最常用的是列在最前面的5个过程。
* 频数分析:产生频数表。
* 描述统计分析:进行基本的统计描述分析。
* 探索性分析:进行探索性分析。
* 列联表分析:进行列联表分析。
* 比率分析:描述两个数值变量间比率的摘要统计量的综合列表。
3.1 频 数 分 析
频数分析是把握数据分布特征的描述性统计中最常用的方法之一。SPSS的频数分析过程不但可以分析变量变化的基本趋势,还可以生成相应的统计图表。
3.1.1 频数分析概述
频数也称为次数,是指同一观测值在一组数据中出现的次数。而频率则是每个小组的频数与总数值的比值。另外,在变量分配数列中,频数表明对应组标志值的作用程度,其值越大表明该组标志值对于总体水平所起的作用越大;反之亦然。用户在使用频数分析数据之前,还需要先了解一下频数分析中的统计量、参数、频率分析图表等一些频数分析的基础内容。
1. 频数统计量
在 SPSS 中,频数分析是运用统计量和图形来描述多种类型的变量,并可以在其分析结果报告中运用升序和降序方法来排列不同的变量。另外,当变量具有多个值时,可以通过提取频率报告,或者使用默认值或百分比标记图表的方法来分析。在使用频数统计分析数据之前,还需要先了解一下频数的统计量。
1 百分位值:用于描述数值在一组数据中的相对位置,包括百分位数、Z分数等。
2 集中趋势:是描述分布位置的统计量,包括均值、中位数、众数等。
3 离散程度:是测量数据中变异和展开的统计量,包括标准方差、方差、最小值、最大值。
4 分布指标:是描述分布形状和对称性的统计量,包括偏度系数、峰度系数等,这些统计量与其标准差一起显示。
2. 频数分布表中的参数
在使用 SPSS 编制频数分布表时,还需要了解下列术语及参数。
1 频数:是指变量值在某个区间内出现的次数。
2 百分比:是指各频数值与总样本数的比率。
3 有效百分比:是指各频数与总体有效样本数的比值。
4 累积百分比:是指各百分比的累计值。
3. 频数分析中常用图表
在频数分析中,经常会使用图表功能,形象且直观地显示变量之间的取值情况。其中,最常用的统计图表有以下3种。
1 条形图。条形图是使用条形直观地显示频数分布变化的图形,包括单式和复式两种条形图,该图形适用于分析定序和定类变量。
2 饼图。饼图是使用圆形或扇形来显示频数百分比变化的一种图形,主要用于显示各部分对整体的贡献情况,该图形适用于数据的结构组成分析。
3 直方图。直方图是使用矩形的面积来显示频数分布变化的一种图形,此图仅适用于区间型数值变量。该图形适用于分析定距型变量。另外,还可以通过为直方图添加正态分布曲线的方法来比较正态分布结果。
3.1.2 频数分析的SPSS操作详解
打开主操作界面。选择菜单栏中的【分析】|【描述性统计】∣【频率】命令,弹出【频率】对话框,这是频数分析的主操作界面,如图3.1所示。
选择分析变量。在【频率】对话框左侧的候选变量列表框中,选取一个或多个待分析变量,将其移入右侧的【变量】列表框中。
输出频数分析表。在【频率】对话框的下方选中【显示频率表格】复选框,即可输出频数分析表。
其他基本统计分析。在【频率】对话框中还可以单击【图表】、【格式】等按钮,这些选项提供了丰富的统计输出结果。
单击【频率】对话框中的【统计】按钮,弹出如图3.2所示的【频率:统计】对话框,在该对话框中可以设置输出各类基本统计量结果。其中各选项的含义介绍如下。
1 【百分位值】选项组。该选项组主要用于设置输出的百分位数,包括3个复选框。
* 【四分位数】:表示将观察值分为4个大小相等的组,如25%、50%、75%这几个百分位数。
* 【分割点】:表示将数据平均分为所设定的相等等份,在其后的文本框中所设置的数值必须为2~100的整数。
* 【百分位数】:表示由用户随意指定单个百分位值。例如,指定95%个百分位数,表示将有95%的观察值大于该值。在该选项中,指定百分位值之后,可通过单击【添加】按钮,添加百分位值;单击【更改】按钮,更改百分位值;同样通过单击【删除】按钮,删除百分位值。
2 【集中趋势】选项组。该选项组主要用于设置输出表示数据集中趋势数据统计量,包括4个选项。
* 【平均值】:表示算术平均值,是总和除以个案的结果值,该方法是一种集中趋势的测量。
* 【中位数】:又称为中数,表示第 50 个百分位的数值。当个案个数为偶数时,则中位数是个案在升序或降序排列的情况下最中间两个个案的平均。另外,中位数是集中趋势的测量,对于远离中心的值并不敏感。
* 【众数】:众数是一组数组中最频繁出现的值,当数组中出现多个频繁出现的值时,则每一个数值都是一个众数,但频率分析过程中只会显示多个众数中最小的数值。
* 【合计】:表示所有带有非缺失值的个案值的合计值。
3 【离散】选项组。该选项组主要用于设置输出表示是测量数据中变异和展开的统计量,包括6个选项。
* 【标准偏差】:表示对围绕均值的离差的测量,其值越大表示数据的离散程度越大。
* 【方差】:该值等于与均值的差的平方和除以个案数量减去1,其度量方差的单位是变量本身的单位的平方。
* 【范围】:又称为全距,表示数值变量的最大值与最小值之间的差,即最大值减去最小值,是描述数据离散情况最简单的一种分析方法。
* 【最小值】:表示数值变量的最小值。
* 【最大值】:表示数值变量的最大值。
* 【平均值的标准误差】:表示取自同一分布的样本与样本之间均值差的测量。
4 【分布】选项组。该选项组主要用于设置输出表示数据分布的统计量,包括两个选项。
【偏度】:表示分布的不对称性度量,当偏度值为0时,表示正态分布;当偏度值超过标准误差的两倍时,表示不具有对称性。
* 【峰度】:用于观测值聚焦在中点周围的程度的一种测量,当峰度值为0时表示正态分布,其分布的峰度比较高而狭窄。
5 【值为组的中点】:表示当数据中的值为组中点时,应启用该复选框用来估计原始未分组数据的中位数和百分位数。
单击【频率】对话框中的【图表】按钮,弹出如图3.3所示的【频率:图表】对话框,在该对话框中可以设置输出图形结果。
在【频率:图表】对话框中,主要包括【图表类型】和【图表值】两个选项组。其中,在【图表类型】选项组中各选项的含义如下。
* 【无】:选中该单选按钮,表示在结果中将不显示图表。
* 【条形图】:选中该单选按钮,表示在结果中将以条形图的样式显示分析数据。
* 【饼图】:选中该单选按钮,表示在结果中将以饼图的样式显示分析数据。
* 【直方图】:选中该单选按钮,表示在结果中将以直方图的样式显示分析数据。
* 【在直方图上显示正态曲线】:该复选框只有在选中【直方图】单选按钮后才可用。启用该复选框,表示在直方图中显示正态分布曲线,用以判断分析结果数据是否接近于正态分布。
另外,在【图表类型】选项组中,选中【条形图】或【饼图】单选按钮时,【图表值】选项组中的选项才能显示为可用状态。而在【图表值】选项组中,主要包括【频率】和【百分比】单选按钮。其中,【频率】单选按钮表示所选择的图表将以频数为单位进行显示;而【百分比】单选按钮表示所选择的图表将以百分比为单位进行显示。
输出格式、样式选择。单击如图3.1所示的【频率】对话框中的【格式】按钮,弹出如图3.4所示的【频率:格式】对话框,在该对话框中可设置频数表输出的格式。
图3.4
在【频率:格式】对话框中,各选项的含义如下。
1 【排序方式】选项组。该选项组主要用于设置输出表格内容的排序方式,包括4个选项。
* 【按值的升序排序】:表示对频数分布按照数值的大小进行升序排列。
* 【按值的降序排序】:表示对频数分布按照数值的大小进行降序排列。
* 【按计数的升序排序】:表示对频数分布按照频数的大小进行升序排列。
* 【按计数的降序排序】:表示对频数分布按照频数的大小进行降序排列。
2 【多个变量】选项组。该选项组主要用于设置变量的输出方式,包括两个选项。
* 【比较变量】:表示在单个表中显示所有的变量。
* 【按变量组织输出】:表示显示每个变量的独立统计量表。
3 【排除具有多个类别的表】复选框。
选中此复选框时,可在下面的文本框中设置最大类别数。
单击如图3.1所示的【频率】对话框中的【样式】按钮,弹出如图3.5所示的【表样式】对话框,在该对话框中可以设置频数表输出的样式。
图3.5
相关统计量的自助抽样估计。
自助抽样是一种非参数统计方法,也是一种从样本计算得到的估计值来做出有关这些总体参数的推论。使用自助抽样方法可以导出稳健的标准误差值,并能为如均值、中位数、比例、相关系数或归回系数等估计值导出置信区间。另外,自助抽样方法还可以用于构建假设检验。
单击如图3.1所示的【频率】对话框中的Bootstrap按钮,弹出如图3.6所示的Bootstrap对话框,在该对话框中可以进行统计量的自助抽样估计。
在Bootstrap自助抽样对话框中,启用【执行bootstrap】复选框,使自助抽样各选项处于可用状态。其中,各选项的含义介绍如下。
* 【样本数】:可通过在文本框中指定一个正整数的方法,来设置自助抽样执行时所需要的样本个数。而当用户需要生成百分位数和偏差修正加速区间时,至少需要1000个自助抽样样本。其取值范围在0~21内。
* 【设置MersenneTwister种子】:启用该复选框,可以允许用户复制分析,另外所设置种子会保留随机数生成器的当前状态,并在分析完成后恢复该状态。其取值范围在1~2000000000内。
* 【置信区间】:指定一个大于50且小于100的置信水平。其中,【百分位】选项表示简单地使用对应于所需置信区间百分位数的有序自助抽样值。而【偏差修正加速B】选项表示该区间为调整区间,分析比较长。
* 【抽样】:在该选项组中主要包括【简单】与【分层】两个选项,其中,【简单】选项表示通过放回方式从原始数据集进行个案重新取样;而【分层】选项表示通过放回方式从原始数据集进行个案重新取样,但在层次变量的交叉分类定义的层内。如果层中的单元相对均一,且不同层间的单元相差较大,则分层自助抽样非常有用。
另外,用户在使用自助抽样方法进行频数分析时,还需要注意以下几点。
1 自助抽样不能用于多重插补数据集。如果数据集中存在Imputation_变量,Bootstrap自助抽样话框将被禁用。
2 自助抽样使用列表删除来确定个案基础,即在任何分析变量上具有取缺失值的个案将从分析中删除,因此当自助抽样生效时,不管分析过程中是否制订了其他处理缺失值的方法,该列表删除照样处于生效状态。
3 频率分析结果中的统计表支持均值、标准差、方差、中位数、偏度、峰度和百分位数的自助抽样估计。
4 统计分析结果中的频率表支持百分比的自助抽样估计。
完成操作。
单击图3.1所示的【频率】对话框中的【确定】按钮,结束操作,SPSS软件自动输出结果。
|
|