新闻资讯
看你所看,想你所想

SPSS统计分析与数据挖掘

《SPSS统计分析与数据挖掘》是2012年1月电子工业出版社出版的图书,作者是谢龙汉、尚涛。

  • 书名 SPSS统计分析与数据挖掘
  • 作者 谢龙汉、尚涛
  • 类别 图书>SPSS在财务智能、数据预测、股市分析、社会经济分析>金融数据分析>数据挖掘应用>《SPSS统计分析与数据挖掘》
  • 出版社 电子工业出版社
  • 出版时间 2012年01月

内容简介

  本书基于SPSS 19.0编写,结合大量的实例对SPSS各模块的统计分析功能及图形功能等进行了详细讲解。每章均给出大量分析案例,具体内容为SPSS简介、SPSS数据挖掘系统介绍、来自SPSS数据文件管理、SPSS数据预处理、SPSS基本统计分析、多重反应分析、均值比较与检验、统计图制作、参数检验、回归分析、方差分析、相关分析、聚数分析、局新查脱酸挥病喜判别分析、因子分析、对应分析与结合分析、信360百科度分析、生存分析、对数线性模型、时间序列分析、缺失值分析,以及SPSS在财务智能、数据预测、股市分析、社会经济分析、金融数据分析等方面的数据挖掘应用。

  本书最大特点是抛弃了其他同类书籍中只介绍理论用法、缺乏案例分析的弊病,全书给出许多数据挖掘分析案例,为读者展示SPSS在数据分析、信用风险管理、直销分析鱼创盾任眼战念觉沿思色、社会经济分析等实际项目中的应用技术。

图书特点

  (1)实例丰富,经典实用。本书作者为某跨国金融分析公司分析员,具有丰富的统计分析、数据挖掘方面研究经验。

  (2)本书实例全部配有操作视频,详细的讲解,此乃比同类SPSS图书一大优直刻再读合室沿点,帮助读者提高学习顶宣球特另力的帝对心影效率和工作效率。

图书目录

  第1章 SPSS软件概述 1

  1.1 SPSS简介 1

  1.2 SPSS操作入门 病混约整同题2

  1.2.1 软件安家验时问装、启动及退出 3

  1.2.2 来自操作环境 4

  1.2.3 系统参数的设置 7

  1.3 SPSS的帮助系统 15

  第2章 SPS360百科S数据挖掘系统 17

  2.1 数据挖掘概述 17

  2.1.1 数据挖掘的含义 17

  2.1.2 数停马源场建据挖掘与OLAP 18

  2.1.3 数据挖掘和统计学 18

  2.1.4 数据挖掘的目的 19

  2.1.5 数据挖掘应用 19

  2.1.6 数据挖掘流程 19

  2.2 成功的数据挖掘 20

  端封陈2.2.1 CRISP-DM方法论 21

  2.2.2 选择数据挖掘工具 25

  2.2.3 SPSS数据挖掘 26

  2.3 SPSS数据挖掘的过程 29

  2.3.1 商业敌语起冷算统香烈然理解 29

  2.3.2 数据理解 29

  2.3.3 数据准备 29

  2.3.4 数据模型 30

  2.3.5 评估 30

  2.3.6 部署 31

  第3章 数据文件、变量与函数 33

  3.1 SPSS的变量类型 33

  3.1.1 数据的输入 34

  3.1.2 变量的编辑 35

  3.2 数据文件的打开和保存 37

  3.2.1 打开SPSS数据文件 37

  3.2.2 打开其他格式的数据文件 38

  3.2.3 数据文件保存 38

  3.3 SPSS函数 39

  3.3.1 算术函数 39

  3.3.2 统计抗工助乡亚函数 40

  3.3.3 逻辑函数 41

  3.3.4 日期和时间函数 41

  3宪川里停前区怀原袁接阳.3.5 随机变量函数 42

  3.3.6 反分布函数 44

  3.3.7 累计分布函数 45

  3.3.8 缺失值函数 47

  3.3.9 字符串函数 48

  第4章 数据预处理 50

  4.1 数据文件的整理 50

  4.1.1 排序个案穿继益(Sort Cas浓便口e)过程 51

  4.1.2 转置(Transpose)过程 52

  4.1.3 合并文件(Merge File)过程 52

  4.1.4 分类汇总(Aggregate)过程 54

  4.1.5 拆分文件(Split File)过程 56

  4.1.6 选择个案(Select Cases)

  过程 57

  4.1.7 加权个案(Weight Cases)

  过程 58

  4.2 数据变量的变换和计算 58

  4.2.1 计算变量(Compute Variables)

  过程 59

 我频新百期苏风 4.2.2 计数(Count)过程 60

  4.2.3 重新编码(Recode)过程 62

  4.2.4 个案排秩(Rank Cases)

  过程 64

  4.2.5 自动重新编码(Automatic

  Recode)过程 65

半用冲六么玉预  第5章 基本统计分析 67

  5.1 基本概念 67

  5.1.1 基本的统计概念 6沿好率证7

  5.1.2 描述性统计分析 69

  5.2 频数分析 70

  5.2.1 Frequencies过程的操作界面 70

  5.2.2 实例分析 72

  5.3 描述性功云交顶杆帝答革境史统计分析过程 74

  5.3.1 Descriptive过程的参数设置 74

  5.3.2 实例分析 友刻他马推挥74

  5.4 数据探索性分析过程 76

  5.4.1 Explore过程的参数设置 76

  5.4.2 实例分析 77

  5.5 列联表分析过程 80

  5.5.1 Crosstabs过程的参数设置 80

  5.5.2 实导纸进呼就旧所过机年例分析 83

  第6章 参数检验 86

  6.1 参数估计和假设检验概述 86

  6.1.1 参数估计 86

  6.1.2 假设检验 89

  6.2 均值(Means)过程 94

  6.2.1 SPSS的Means过程参数

  设置 94

  6.2.2 Means过程实例 95

  6.3 单样本t检验 96

  6.3.1 One-Sample t Test过程的

  参数设置 96

  6.3.2 实例分析 97

  6.4 独立两样本t检验 99

  6.4.1 Independent-Sample t Test

  过程的参数设置 99

  6.4.2 实例分析 101

  6.5 配对两样本t检验 102

  6.5.1 Paired-Sample t Test过程的

  参数设置 102

  6.5.2 实例分析 103

  第7章 基本图形的绘制 105

  7.1 统计图概述 105

  7.2 条形图 106

  7.3 线图 110

  7.4 面积图 112

  7.5 饼图 114

  7.5.1 SPSS设置 114

  7.5.2 实例分析 114

  7.6 高低图 115

  7.7 质量控制图 118

  7.8 箱图 123

  7.8.1 SPSS参数设置 123

  7.8.2 实例分析 124

  7.9 散点图 125

  7.9.1 SPSS参数设置 126

  7.9.2 实例分析 127

  7.10 直方图 128

  7.10.1 P-P图和Q-Q图 129

  7.11 时间序列图 130

  7.11.1 SPSS参数设置 131

  7.11.2 实例分析 134

  第8章 非参数检验 137

  8.1 非参数检验概述 137

  8.2 检验 138

  8.2.1 检验的参数设置 139

  8.2.2 检验实例分析 141

  8.3 二项分布检验 143

  8.3.1 二项分布检验的参数设置 143

  8.3.2 实例分析 143

  8.4 游程检验 145

  8.4.1 游程检验的参数设置 146

  8.4.2 实例分析 146

  8.5 单样本K-S检验 148

  8.5.1 单样本K-S检验的参数

  设置 149

  8.5.2 实例分析 149

  8.6 两独立样本分布位置检验 152

  8.6.1 两独立样本分布位置检验的

  参数设置 152

  8.6.2 实例分析 153

  8.7 多个独立样本分布位置检验 154

  8.7.1 SPSS参数设置 155

  8.7.2 实例分析 155

  8.8 两相关样本分布位置检验 157

  8.8.1 SPSS参数设置 158

  8.8.2 实例分析 158

  8.9 多个配对样本分布位置检验 160

  8.9.1 SPSS参数设置 160

  8.9.2 实例分析 161

  第9章 方差分析 163

  9.1 方差分析的基本原理 163

  9.1.1 自由度与平方和分解 164

  9.1.2 F检验 166

  9.1.3 多重比较 167

  9.2 单因素方差分析 168

  9.2.1 单因素方差分析步骤 169

  9.2.2 判断与结论 170

  9.2.3 One-Way ANOVA过程的

  参数设置 170

  9.2.4 实例分析 173

  9.3 多因素方差分析 174

  9.3.1 只考虑主效应的多因素方差

  分析 174

  9.3.2 存在交互效应的多因素方差

  分析 176

  9.3.3 Univariate过程参数设置 178

  9.3.4 实例分析 183

  9.4 协方差分析 188

  9.4.1 协方差分析概述 188

  9.4.2 实例分析 189

  第10章 回归分析 192

  10.1 线性回归 192

  10.1.1 线性回归模型 193

  10.1.2 最小二乘估计 193

  10.1.3 回归方程的显著性检验 194

  10.1.4 预测问题 196

  10.1.5 SPSS线性回归分析设置 197

  10.1.6 回归分析模型的实例分析 201

  10.2 非线性回归 204

  10.2.1 非线性回归分析的基本

  原理 204

  10.2.2 非线性回归参数设置 205

  10.2.3 案例--销售数量和广告

  投入的非线性回归分析 208

  10.3 Logistic回归 210

  10.3.1 Logistic回归模型概述 210

  10.3.2 Binary Logistic回归模型

  参数设置 212

  10.3.3 案例--银行贷款的信用

  风险分析 214

  第11章 相关分析 219

  11.1 相关分析概述 219

  11.1.1 相关关系 219

  11.1.2 相关图形和相关系数 220

  11.1.3 SPSS的相关分析功能

  简介 222

  11.2 Bivariate过程 222

  11.2.1 两变量相关分析简介 222

  11.2.2 Bivariate过程的参数设置 224

  11.2.3 案例--汽车销售中各变量

  之间的相关分析 225

  11.3 Partial过程 228

  11.3.1 Partial过程的参数设置 228

  11.3.2 案例--医疗门诊病人的

  流动情况分析 229

  11.4 Distances(距离)过程 231

  11.4.1 距离分析参数设置 231

  11.4.2 案例--全国各个省市自

  治区直辖市的农民家庭收支

  的分布研究 234

  第12章 聚类分析 236

  12.1 聚类分析的原理 236

  12.1.1 一般原理 237

  12.1.2 聚类分析步骤 240

  12.1.3 系统聚类方法 241

  12.2 快速样本聚类过程 244

  12.2.1 快速聚类简介 244

  12.2.2 SPSS快速聚类的设置 244

  12.2.3 案例--2006年中国主要

  城市空气质量的比较分析 246

  12.3 分层聚类过程 250

  12.3.1 分层聚类简介 250

  12.3.2 SPSS分层聚类设置 250

  12.3.3 案例--中国经济地理区域

  的聚类分析 253

  12.4 两阶段聚类分析 256

  12.4.1 两阶段聚类简介 256

  12.4.2 SPSS两阶段聚类的设置 257

  12.4.3 案例--两阶段聚类分析

  应用于农村居民人均收入

  与生活消费支出研究 259

  第13章 判别分析 265

  13.1 判别分析的基本原理 265

  13.1.1 判别分析简介 265

  13.1.2 判别分析的数学模型与

  判别方法 266

  13.2 一般判别分析 272

  13.2.1 一般判别分析的参数设置 272

  13.2.2 案例--上市公司类型的

  比较分析 275

  13.3 逐步判别分析 280

  13.3.1 逐步判别的参数设置 280

  13.3.2 案例--全国各个省市地区

  的农民家庭收支的分布规律

  研究 281

  第14章 因子分析 287

  14.1 因子分析简介 287

  14.1.1 因子分析的基本原理 288

  14.1.2 因子分析的基本步骤和

  过程 290

  14.2 SPSS软件进行因子分析 290

  14.2.1 SPSS因子分析的参数

  设置 290

  14.2.2 案例--汽车销售的数据中

  各变量的因子分析 294

  第15章 对应分析 299

  15.1 对应分析的基本原理 299

  15.2 简单对应分析 301

  15.2.1 Correspondence Analysis

  过程 301

  15.2.2 案例--简单对应分析

  实例 304

  15.3 Optimal Scaling过程 307

  15.3.1 Optimal Scaling过程的

  SPSS参数设置 307

  15.3.2 案例--最优尺度分析

  实例 313

  第16章 可靠性和多维尺度分析 318

  16.1 可靠性分析 318

  16.1.1 可靠性分析的基本原理 318

  16.1.2 可靠性分析的参数设置 320

  16.1.3 案例--电视节目调查数据

  可靠性分析 322

  16.2 多维尺度分析 324

  16.2.1 多维尺度分析简介 324

  16.2.2 ALSCAL过程的参数

  设置 325

  16.2.3 案例--多维尺度实例

  分析 328

  第17章 生存分析 331

  17.1 生存分析简介 331

  17.1.1 生存分析的基本概念 331

  17.1.2 生存资料的特点 333

  17.1.3 生存分析方法 333

  17.1.4 SPSS中的生存分析过程 334

  17.2 Life Tables过程 335

  17.2.1 Life Tables过程的参数

  设置 335

  17.2.2 案例--电信公司客户流失

  分析 336

  17.3 Kaplan-Meier分析 340

  17.3.1 Kaplan-Meier分析的步骤 340

  17.3.2 案例--新药开发的数据

  分析 342

  17.4 Cox模型回归分析 345

  17.4.1 Cox回归模型 345

  17.4.2 Cox模型参数设置 347

  17.4.3 案例--电信公司的客户流失

  的Cox回归模型分析 351

  第18章 对数线性模型 357

  18.1 对数线性模型概述 357

  18.2 General过程 358

  18.2.1 General过程的参数设置 358

  18.2.2 实例分析 361

  18.3 Logit过程 363

  18.3.1 Logit过程的参数设置 363

  18.3.2 实例分析 366

  18.4 模型(Model)Selection过程 369

  18.4.1 模型(Model)Selection的

  参数设置 369

  18.4.2 实例分析 371

  第19章 时间序列分析 374

  19.1 时间序列概述 374

  19.1.1 时间序列的组成部分 374

  19.1.2 时间序列的数学模型 375

  19.1.3 时间序列的分析步骤 377

  19.1.4 SPSS时间序列分析功能 377

  19.2 时间序列数据的预处理 384

  19.2.1 缺失值替换 384

  19.2.2 定义时间变量 385

  19.2.3 时间序列的平稳化 385

  19.3 指数平滑模型过程 386

  19.3.1 指数平滑的基本原理 386

  19.3.2 指数平滑模型的参数设置 389

  19.3.3 案例--销售数据预测分析 390

  19.4 ARIMA模型 395

  19.4.1 ARIMA模型的基本原理 395

  19.4.2 ARIMA模型的参数设置 398

  19.4.3 案例--上海证券交易所

  综合指数收益率模拟预测

  分析 399

  19.5 季节分解模型过程 403

  19.5.1 季节分解模型的参数设置 403

  19.5.2 案例--具有季节因素的

  服装销售数据的预测分析 404

  第20章 缺失值分析 409

  20.1 缺失值理论概述 409

  20.1.1 数据缺失方式 410

  20.1.2 缺失值处理方法 410

  20.2 SPSS缺失值分析操作 414

  20.2.1 缺失值分析的参数设置 414

  20.2.2 案例--数据集中缺失值的

  实例分析 418

  第21章 决策树模型 424

  21.1 决策树模型概述 424

  21.1.1 CHAID算法 426

  21.1.2 Exhaustive CHAID算法 427

  21.1.3 CART算法 427

  21.1.4 QUEST算法 428

  21.2 决策树的参数设置 428

  21.2.1 变量设置 428

  21.2.2 类别(Categories)设置 429

  21.2.3 输出(Output)设置 430

  21.2.4 验证(Validation)设置 432

  21.2.5 保存(Save)设置 433

  21.2.6 条件(Criteria)设置 434

  21.2.7 CHAID算法设置 435

  21.2.8 CART算法设置 435

  21.2.9 QUEST算法设置 436

  21.2.10 修剪(Pruning)设置 436

  21.2.11 替代变量(Surrogates)

  设置 437

  21.2.12 选项(Options)设置 437

  21.2.13 误分类成本设置 438

  21.2.14 利润(Profits)设置 438

  21.2.15 先验概率(Prior

  Probabilities)设置 439

  21.2.16 实例分析 440

  21.2.17 模型建立 440

  21.2.18 模型评估 442

  第22章 神经网络 449

  22.1 神经网络概述 449

  22.1.1 历史及现状 450

  22.1.2 神经网络特点 451

  22.1.3 神经元模型 452

  22.1.4 神经网络模型 453

  22.1.5 神经网络的学习规则 453

  22.1.6 SPSS神经网络模型 454

  22.2 SPSS神经网络模型的设置 456

  22.2.1 多层感知器(MLP)的

  设置 456

  22.2.2 径向基函数(RBF)的

  设置 464

  22.3 实例分析 466

  22.3.1 参数设置 467

  22.3.2 结果分析 469

  第23章 信用风险分析 475

  23.1 信用风险概述 475

  23.1.1 信用风险基本概念 475

  23.1.2 信用风险度量方法 476

  23.2 案例分析 479

  23.1.3 SPSS中信用风险分析

  模块 479

  23.2.1 二元Logistic过程 479

  23.2.2 决策树(Tree)过程 484

  23.2.3 Discriminant过程 490

  第24章 SPSS在社会经济综合评价中

  的应用 495

  24.1 沿海省市经济综合指标的主成分

  分析 495

  24.2 中国城镇居民消费结构的聚类

  分析 499

  24.3 我国内地可支配收入和消费性支出

  之间的回归分析 503

转载请注明出处安可林文章网 » SPSS统计分析与数据挖掘

相关推荐

    声明:此文信息来源于网络,登载此文只为提供信息参考,并不用于任何商业目的。如有侵权,请及时联系我们:fendou3451@163.com