收藏 分享(赏)

2023年多元统计分析东北大学秦皇岛分校.docx

上传人:sc****y 文档编号:652702 上传时间:2023-04-14 格式:DOCX 页数:11 大小:20.96KB
下载 相关 举报
2023年多元统计分析东北大学秦皇岛分校.docx_第1页
第1页 / 共11页
2023年多元统计分析东北大学秦皇岛分校.docx_第2页
第2页 / 共11页
2023年多元统计分析东北大学秦皇岛分校.docx_第3页
第3页 / 共11页
2023年多元统计分析东北大学秦皇岛分校.docx_第4页
第4页 / 共11页
2023年多元统计分析东北大学秦皇岛分校.docx_第5页
第5页 / 共11页
2023年多元统计分析东北大学秦皇岛分校.docx_第6页
第6页 / 共11页
亲,该文档总共11页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、多元统计分析东北大学秦皇岛分校 多元统计分析实验指导书 李喆编写 东北大学秦皇岛分校 二一六年五月 1 前言 本课程为金融学专业大二学生的专业平台课。通过本课程的学习,使学生掌握多元统计分析的根本概念、根本原理和根本结果及各种多元统计分析方法的背景、功能、作用、计算方法及实际应用,能够利用spss软件运行数据处理方法,从而为学会如何通过建立模型对现实的经济生活进行分析模拟,为实证分析打下一定的理论根底 2 目录 实验一熟悉spss软件.4实验二实验三实验四 假设检验、相关分析和回归分析.22聚类分析.36主成分分析和因子分析,对应分析.40 3 实验一熟悉spss软件 实验目的 1、利用sps

2、s软件建立数据文件; 2、利用spss软件进行根本的统计分析; 3、学会使用spss软件统计绘图;实验内容 一、熟悉spss界面 (一)启动方法 启动方法。开始程序spssincspss16.0。 (二)spss的主窗口 启动spss16.0后,弹出一个选择对话框,可以选择翻开已经存在的数据文件,也可以做出其他选择。 各选项分别对应。运行指南;数据录入;运行已存在的查询;使用数据库向导建立一个新的文件;翻开已存在的数据文件x.sav/x.sys;翻开其它类型的数据文件x.xls/x.txt/x.dat;运行spss时不显示该对话框。 (三)数据编辑窗口 4 菜单栏包括: file。文件操作。完

3、成文件的翻开、新建、保存、打印和关闭等操作 edit:文件编辑。完成文本或数据内容的选择、复制、剪贴、查找和替换等操作view:浏览编辑。完成文本或数据内容的状态栏、工具栏、字体、网格线和数值标签等功能的操作 data。数据管理。完成数据变量名称和格式的定义,数据资料的选择、排序、加权,数据文件的转换、连接和汇总等操作 transform。数据转换。完成数据的计算、重新编码和缺失值替代等操作 analyze。数据分析。完成根本统计分析、均值比较、相关分析、回归分析、聚类分析、因子分析、对应分析等一系列统计分析方法的选择与应用 graphs。制作统计图形。完成条形图、饼形图、直方图、散点图等统计

4、图形的制作与编辑。 utilities。实用程序。有关命令解释、字体选择、文件信息、定义输出标题和窗口设计等。 add-ons:附加 windows:窗口控制。可进行窗口的排列、选择和显示等help:帮助 二、利用spss软件建立数据文件 (一)变量的定义 窗口视图中有“variableview标签和“dataview标签。 单击“variableview标签,定义变量。每一个变量须定义如下属性:name;type;width;decimals;label;values;missing;columns;align;measure。 1、name: 变量名称,其总长度不能超过64个字符(32个汉

5、字)。定义变量名应注意: 5 以字母为首,后面跟az,09字符;不允许以数字、横线或下划线开头;“。、“。、“/等不能作为变量名。可以用汉字做变量名。 2、type 变量类型,单击变量类型,弹出variabletype对话框,有8种类型可供选择numeric;comma;dot;scientificnotation;date;dollar;customcurrency;string; 3、width 数据或字符串的宽度,默认的变量长度是8位。当变量为某些特定类型时,该设置无效,如日期型变量。 4、decimals 小数位数。默认的小数位数是2位5、label 变量标签。用来说明变量代表的实际意

6、义。建议使用中文。 6、values变量值标签。对变量可能取值附加的进一步说明。对分类变量往往要定义其取值的标签。 7、missing 缺失值,单击“missing按钮:nomissingvalues:没有缺失值。discretemissingvalues:离散缺失值。 rangeplusoneoptionaldiscretemiss:定义缺失值范围8、columns 显示数据的宽度。定义数据在屏幕上该变量对应列的显示列宽。默认值为8个字符,范围是1255。显示宽度不影响机内值和分析运算结果,只影响显示。 9、align 字符排列方向。 2023、measure 数据测量类型。是指变量是如何测

7、量的,可有3种选择 scale。尺度变量(连续变量)。是默认的类型,即使用距离或比率量尺测量的数据。scale可以是数值型、日期型和货币型变量,但不能是字符串型变量。例如,身高和体重。 ordinal。顺序变量。是指变量之间的顺序有实际意义,但没有距离关系。顺序变量可以用有序的数字作为代码,设置了值标签的变量被认为是有序的分类变量,可以作为分组变量,也可以参与某些分析过程的运算。ordinal可以是数值型和字符串型变量。 nominal。分类变量。分类变量值之间没有顺序关系,只能作为分组变量使用。nominal与ordinal一样,只是不要求变量有次序关系。 (二)数据的输入 单击“datav

8、iew标签,从数据编辑器中输入数据。 (三)数据的编辑1.修改数据: 找到想要修改的数据,双击,修改2.插入或删除一行数据 6 3.插入或删除一个变量(列) (四)数据文件的合并1.横向合并数据文件 (1)翻开第一个数据文件。 (2)单击datamergefileaddvariables(3)单击“ok按钮 7 本卷须知。两个文件中有重复的关键变量,要保证关键变量中间不要缺少数字,如果有缺乏的必修缺乏之后才能进行合并,否那么会出现错误结果。 8 2.纵向合并数据文件 纵向合并数据文件就是将一份数据按观测量分成几局部,然后分别输入数据并存储为几个较小的spss观测量数据文件,最后将这几个观测量数

9、据文件中的数据上下对接,进行纵向合并。 spss纵向合并数据文件的操作过程如下:(1)翻开第一个数据文件 (2)单击菜单datamergefileaddcases (3)假设要求合并后的数据能看出来自哪个数据文件,可以选indicatecasesourceas variable项,操作同横向合并数据文件。 (4)单击“ok按钮 9 三、用spss进行根本统计分析 (一)数据整理1.数据排序 (1)选择菜单datasortcases,弹出一个sortcases对话框。 (2)将主排序变量从左面的列表框中选到右侧的sortby框中,并在sortorder选项中 选择按该变量的升序(ascendin

10、g)还是降序(descending)排序。(3)单击“ok按钮 2023 2.分类汇总 选择菜单dataaggregate项,弹出一个aggregatedata对话框 3.数据变换 11 数据变换是在原有变量数据的根底上,计算产生一些含有更丰富信息的新数据。选择菜单transformcompute,弹出computevariable对话框。 (二)数据分组 数据分组就是根据统计研究的需要,将数据按某种标准重新划分为不同的组别。 1.单项式分组 (1)选择菜单transformautomaticrecode,弹出automaticrecode对话框。 12 (2)将对话框左侧列表框的分组变量选择

11、到右侧的variablenewname框中。 (3)在“newname按钮右侧的框内输入存放分组结果的新变量名,并单击“newname 按钮。 (4)在“recodestartingfrom选项中选择单项式分组按升序还是按降序)进行。(5)单击“ok按钮 2.组距式分组 组距式分组是将全部变量值依次划分为假设干个区间,并将这一区间的变量值作为一组。(1)确定分组: 首先将原始资料按升序进行排列并计算极差r;其次由斯特吉斯经验公式确定组数和组距,即组数k=1+3.322lgn,组距d=r/k; 13 最后确定组限。取第一组下限略高于最小变量值,那么该组上限=该组下限+组距。(2)选择菜单tran

12、sformvisualbinning 14 (三)计算根本描述统计量1、标准化: spss提供了计算描述统计量的功能,它可以将原始数据资料转换成标准化值并以变量 。x的形式存入数据编辑窗口中,公式:z_x。 s运行:analyzedescriptivestatisticsdescriptives 15 16 (四)频数分析 spss提供:频数分布表,根本描述统计量,统计图(条形图、饼形图和直方图) 17 四、统计绘图 (一)统计图的绘制1.条形图(bar)graphsbar 18 2.饼形图(pie)graphspies 19 3.线形图(line):graphsline 4.散点图(scat

13、ter):graphsscatter (二)统计图的编辑1.图形编辑窗口、设置图形中的数值标签 20 分别是未旋转和旋转之后的因子载荷矩阵,可以看出每个变量在某个公因子上有较高的载荷。gdp、工业总产值、固定资产投资和货物周转量在第一因子上有较高载荷,因此,第一因子命名为总量因子;职工平均工资、居民消费水平在第二因子上有较高载荷,因此,第二因子命名为收支因子;居民消费价格指数、商品零售价格指数在第三因子上有较高载荷,因此第三因子命名为价格因子 因子得分的系数矩阵,计算得到的因子得分作为新变量存放在数据文件中,可以进行后续的评价和分类 给出了因子得分的协方差矩阵,各因子之间是正交的,即彼此相互独立。 (三)根据因子得分进行综合评估 以提取的3个公因子的方差奉献率作为权重,结合各因子得分,建立综合评价模型: w。0.4020231fac1_1。0.27713fac2_1。0.21784fac3_1 46 47 三、学会使用spss进行对应分析; 同一直角坐

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 政务民生 > 其它

copyright@ 2008-2023 wnwk.com网站版权所有

经营许可证编号:浙ICP备2024059924号-2