收藏 分享(赏)

应用多元统计分析基于R的实验_韩明编著.pdf

上传人:g****t 文档编号:2353058 上传时间:2023-05-08 格式:PDF 页数:264 大小:29.37MB
下载 相关 举报
应用多元统计分析基于R的实验_韩明编著.pdf_第1页
第1页 / 共264页
应用多元统计分析基于R的实验_韩明编著.pdf_第2页
第2页 / 共264页
应用多元统计分析基于R的实验_韩明编著.pdf_第3页
第3页 / 共264页
应用多元统计分析基于R的实验_韩明编著.pdf_第4页
第4页 / 共264页
应用多元统计分析基于R的实验_韩明编著.pdf_第5页
第5页 / 共264页
应用多元统计分析基于R的实验_韩明编著.pdf_第6页
第6页 / 共264页
亲,该文档总共264页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、应用多元统计分析 基于R的实验韩明编著内 容 提 要本书基于 应用多元统计分析(第版)(韩明,同济大学出版社)的内容,编写了基于R的实验在每一章(从第章开始)的前面,首先按照原教材简要介绍有关概念、理论和相关背景,然后是与本章内容对应的实验全书由 章组成,通过 个实验,着重培养学生的动手能力、应用R软件分析和解决多元统计问题的能力实验的内容与原教材的例题、应用案例不重复本书既可以与原教材配套使用,也可以单独使用本书注重可读性,图文并茂,可供高等院校有关专业本科生和研究生作为“多元统计分析”“多元统计实验”等课程的教材(或参考书),也可作为全国大学生(研究生)“数学建模竞赛”、全国大学生“统计建

2、模大赛”的培训教材(或参考书),还可供相关专业的教师和科技人员、广大自学者参考图书在版编目(C I P)数据应用多元统计分析:基于R的实验/韩明编著上海:同济大学出版社,I S B N 应 韩 多元分析统计分析高等学校教材 中国版本图书馆C I P数据核字()第 号应用多元统计分析 基于R的实验韩明编著责任编辑张莉 助理编辑任学敏 责任校对徐春莲 封面设计潘向蓁出版发行同济大学出版社w ww t o n g j i p r e s s c o m c n(地址:上海市四平路 号邮编:电话:)经销全国各地新华书店印刷大丰科星印刷有限责任公司排版南京月叶图文制作有限公司开本 mm mm/印张 .字

3、数 版次 年月第版 年月第次印刷书号 I S B N 定价 元本书若有印装质量问题,请向本社发行部调换版权所有侵权必究前言随着大数据、人工智能在日常生活中的渗透,学习多元统计分析的人越来越多“多元统计分析”课程已经被越来越多高校列为相关专业的必修课或选修课特别是随着相关软件的普及,人们不再只满足于学习一些理论知识,而是将多元统计分析作为工具,借助计算机和相关软件进行数据处理和分析多元统计分析是统计学中应用性很强的一个分支,它的应用范围十分广泛在“多元统计分析”“多元统计实验”课程的教与学过程中,主要难点是涉及的理论比较抽象、计算比较复杂(需要借助有关软件在计算机上实现)作者根据多年来的教学实践

4、,深感内容简练但又实用的“多元统计分析”“多元统计实验”教材的重要性作者认为,对于侧重于“应用”多元统计方法进行数据处理和分析的读者,重点不在于理解多元统计方法的理论证明和公式推导,而是要应用有关软件对数据进行分析,特别是要理解多元统计方法的目的、应用条件和结果的解释本书注重可读性,图文并茂(配图 幅);自第章开始,每一章首先按照原教材简要介绍本章的有关概念、理论和相关背景,然后是与本章内容对应的实验考虑到作为一款免费软件,R软件具有丰富的资源、良好的扩展性和完备的辅助系统,本书的实验采用R软件,并给出了相应的代码通过 个实验,突出R软件的应用;着重培养学生的动手能力、应用R软件分析和解决多元

5、统计问题的能力书名确定为 应用多元统计分析 基于R的实验,主要是突出R软件在多元统计分析中的作用感谢王家宝教授在作者写作本书过程中的指导和鼓励感谢使用 应用多元统计分析 第版、应用多元统计分析 基于R的实验 的读者愿本书的出版能对广大师生在“多元统计分析”“多元统计实验”课程的教与学的过程中有所帮助本书参考了一些国内外文献,在此向有关作者表示感谢虽然作者努力使本书写成一本既有特色又便于教学(或自学)的教材(或参考书),但由于水平所限,书中难免还存在一些疏漏甚至是错误,恳请专家和读者批评指正韩明 年月目录0 0 1目录前言1绪论 多元统计分析概述 多元统计分析的应用 本书的基本框架和内容安排 用

6、于实验的数据集 2多元数据的表示及可视化 多元数据的表示 多元数据的一般格式 多元数据的数字特征 多元数据的可视化 实验 实验 m t c a r s数据集的展示 实验 i r i s数据集的描述和展示 实验 m t c a r s数据集的可视化 实验 i r i s数据集的可视化 实验 四个城市销售数据的展示和可视化 附录:R C o l o r B r e w e r包的配色方案介绍 3线性回归分析 一元线性回归的回顾 数学模型 回归参数的估计 回归方程的显著性检验 预测 多元线性回归 0 0 2应用多元统计分析 基于R的实验 多元线性回归模型 回归参数的估计 回归方程的显著性检验 预测

7、实验 实验 w o m e n数据集的回归分析 实验 B o s t o n数据集的回归分析 实验 s t a t e x 数据集的回归分析 实验 m t c a r s数据集的回归分析 4逐步回归与回归诊断 逐步回归 变量的选择 逐步回归的计算 回归诊断 B o x-C o x变换 实验 实验 s t a c k l o s s数据集的逐步回归 实验 s t a c k l o s s数据集的回归诊断 实验 s t a t e x 数据集的逐步回归和回归诊断 实验 s t a c k l o s s数据集的B o x-C o x变换 5广义线性模型与非线性模型 广义线性模型 广义线性模型概述

8、 L o g i s t i c模型 对数线性模型 非线性模型 实验 实验 淋巴细胞白血病人生存数据的L o g i s t i c模型 实验 T h eC h i l d r e nE v e rB o r nD a t a的对数线性模型 实验 “挑战者号”航天飞机O形环失效的广义线性模型 实验 柑橘重量与直径的非线性模型 目录0 0 3 实验 U S P o p数据集的非线性模型 6方差分析 单因素方差分析 数学模型 方差分析 均值的多重比较 双因素方差分析 不考虑交互作用 考虑交互作用 多元方差分析 实验 实验 c h o l e s t e r o l数据集的方差分析 实验 果汁含铅比

9、实验数据的方差分析 实验 老鼠存活时间的方差分析 实验 U S c e r e a l数据集的方差分析 7聚类分析 聚类分析的基本思想与意义 Q型聚类分析 两点之间的距离 两类之间的距离 系统聚类法 k均值聚类 R型聚类分析 变量相似性度量 变量聚类法 实验 实验 i r i s数据集的聚类分析 实验 城镇居民消费性支出的聚类分析 实验 城镇居民消费性支出的k均值聚类 实验 城镇居民消费性支出中个变量的聚类分析 0 0 4应用多元统计分析 基于R的实验8判别分析 距离判别 马氏距离 判别准则与判别函数 多总体情形 F i s h e r判别 判别准则 判别函数中系数的确定 确定判别函数 B a

10、 y e s判别 误判概率与误判损失 两总体的B a y e s判别 实验 实验 i r i s数据集的判别分析 实验 心肌梗塞患者的判别分析 实验 根据人文发展指数的判别分析 9主成分分析 主成分分析的基本思想及方法 特征值因子的筛选 主成分回归分析 实验 实验 首批沿海开放城市的主成分分析 实验 U S J u d g e R a t i n g s数据集的主成分分析 1 0因子分析 因子分析模型 数学模型 因子分析模型的性质 因子载荷矩阵中的几个统计性质 因子载荷矩阵的估计方法 主成分分析法 主因子法 因子旋转 目录0 0 5 因子得分 因子得分的概念 加权最小二乘法 因子分析的步骤 实

11、验 实验 a b i l i t y c o v数据集的因子分析 实验 H a r m a n 数据集的因子分析 1 1对应分析 对应分析简介 对应分析的原理 对应分析的数据变换方法 对应分析的原理和依据 对应分析的计算步骤 实验 实验 美国授予哲学博士学位的对应分析 实验 汉字读写能力与数学成绩的对应分析 实验 收入与品牌的对应分析 实验 c a i t h数据集的对应分析 实验 s m o k e数据集的对应分析 1 2典型相关分析 典型相关分析的基本思想 典型相关的数学描述 原始变量与典型变量之间的相关性 典型相关系数的检验 实验 实验 投资性变量与国民经济变量的典型相关分析 实验 科学

12、研究、开发投入与产出的典型相关分析 参考文献 绪论 绪论多元统计分析(M u l t i v a r i a t eS t a t i s t i c a lA n a l y s i s)是应用统计方法来研究多变量(多指标)问题的理论和方法,它是统计学的一个重要分支在实际问题中,受多个变量共同作用和影响的现象大量存在当变量较多时,变量之间不可避免地存在相关性我们常需要处理多个变量的观测数据,那么如何对多个变量的观测数据进行有效的分析和研究呢?如果把多个变量分开处理不仅会丢失一些信息,往往也不容易取得好的研究结论多元统计分析,通过对多个变量的观测数据的分析,来研究这些变量之间的相互关系以及揭示

13、这些变量内在的变化规律 多元统计分析概述早在 世纪就出现了处理二维正态总体的一些方法,但系统地处理多维概率分布总体的统计分析问题则开始于 世纪多元统计分析起源于 世纪初,年W i s h a r t发表的论文 多元正态总体样本协方差阵的精确分布,可以说是多元统计分析的开端之后F i s h e r,H o t e l l i n g,R o y,许宝禄等人作出了一系列奠基性的工作,使多元统计分析在理论上得到迅速的发展 世纪 年代,多元统计分析在心理、教育、生物等方面有不少的应用,但由于计算量大,其发展受到影响 世纪 年代,随着计算机的出现和发展,多元统计分析在地质、医学、气象、社会学等方面得到

14、了广泛的应用 世纪 年代,通过应用和实践又完善和发展了理论,由于新理论和新方法的不断出现又促使它的应用范围更加扩大 世纪 年代,在我国才受到各个领域的极大关注,近 年来,我国在多元统计分析的理论和应用上取得了许多显著的成绩进入 世纪后,人们获得的数据正以前所未有的速度迅速增加,产生了海量数据、大数据、超大型数据库等,遍及超级市场销售、银行存款、天文学、粒子物理、化学、医学、生物学以及政府统计等领域,多元统计分析与人工智能、数据库技术等 应用多元统计分析 基于R的实验相结合,已经在经济、商业、金融、天文、地理、农业、工业等方面取得了成功的应用“多元统计分析”也称为“多元分析”(M u l t i

15、 v a r i a t eA n a l y s i s)例如M a r d i ae t a l()的书,书名为M u l t i v a r i a t eA n a l y s i s英国著名的统计学家K e n d a l l在 多元分析 一书中,把多元统计分析所研究的内容和方法概括为以下几个方面:()简化数据结构(降维问题)简化数据结构就是将某些复杂的数据结构通过变量变换等方法,使相互依赖的变量变成互不相关的,或把高维空间的数据投影到低维空间,使问题得到简化而损失的信息又不太多例如,主成分分析、因子分析、对应分析等就是这样的一类方法()分类与判别(归类问题)归类问题就是对所考察的观

16、测点(或变量)按照相近程度进行分类(或归类)例如,聚类分析、判别分析等就是解决这类问题的统计方法()变量间的相互联系相互依赖关系:分析一个或几个变量的变化是否依赖于另外一些变量的变化?如果是,建立变量之间的定量关系式,并用于预测或控制 回归分析变量之间的相互关系:分析两组变量之间的相互关系 典型相关分析()多元数据的统计推断这是关于参数估计和假设检验的问题特别是多元正态分布的均值向量和协方差矩阵的估计和假设检验等问题()多元统计分析的理论基础多元统计分析的理论基础包括多维随机向量(特别是多维正态随机向量),以及由此定义的各种多元统计量,推导它们的分布并研究其性质,研究它们的抽样分布理论 多元统计分析的应用多元统计分析是统计学中应用性很强的一个分支,它的应用范围十分广泛多元统计分析可以应用于几乎所有的领域,主要包括经济学、农业、地质学、医学、工业、气象学、金融、精算、物理学、地理学、军事科学、文学、法律、环境科学、考古学、体育科学、遗传学、教育学、生物学、管理科学、水文学等,还有一些交叉学科或方向等多元统计分析的应用实在是难以一一罗列,以下简要地介绍一下多元统计分析在文学、数据挖掘(作为

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 教育教学 > 其它

copyright@ 2008-2023 wnwk.com网站版权所有

经营许可证编号:浙ICP备2024059924号-2