1、iIBM SPSS Complex Samples 19Note:Before using this information and the product it supports,read the generalinformation under Notices第 259 页码.This document contains proprietary information of SPSS Inc,an IBM Company.Itis provided under a license agreement and is protected by copyright law.Theinformat
2、ion contained in this publication does not include any product warranties,and any statements provided in this manual should not be interpreted as such.When you send information to IBM or SPSS,you grant IBM and SPSS a nonexclusiveright to use or distribute the information in any way it believes appro
3、priatewithout incurring any obligation to you.Copyright SPSS Inc.1989,2010.Copyright SPSS Inc.1989,2010.前言前言IBM SPSS Statistics 是一种用于分析数据的综合系统。复杂抽样 可选附加模块提供本手册中描述的其他分析方法。此 复杂抽样 附加模块必须与 SPSS Statistics Core 系统一起使用,并已完全集成到了该系统中。关于 SPSS Inc.,IBM 下属公司关于 SPSS Inc.,IBM 下属公司SPSS Inc.是一家 IBM 下属公司,它也是全球领先的预测
4、分析软件和解决方案提供商。该公司拥有全面的产品系列,涵盖数据收集、统计量、建模和部署,通过在业务流程中嵌入分析技术,收集人们的态度与看法,预测未来客户交互结果,然后针对这些深入见解采取相应行动。SPSS Inc.解决方案着眼于整合分析技术、IT 基础设施和业务流程,以帮助达成整个企业内相互关联的业务目标。全球各地的众多企业、政府和学术机构客户依靠 SPSS Inc.技术在吸引、留住和发展客户方面取得竞争优势,同时减少欺诈并缓解风险。SPSS Inc.在 2009 年 10 月被 IBM 并购。有关更多信息,请访问http:/。技术支持技术支持我们提供有“技术支持”以维护客户。客户可就 SPSS
5、 Inc.产品使用或某一受支持硬件环境的安装帮助寻求技术支持。要获得“技术支持”,请访问 SPSS Inc.网站 http:/,或通过网站http:/ 找到当地办事处。在请求协助时,请准备好您和您组织的 ID 以及支持协议。客户服务客户服务如果对发货或帐户存在任何问题,请联系您当地的办事处,联系方式列在 Web 站点中,网址为 http:/ Inc.提供公开的以及现场的培训讲座。所有讲座都是以实践小组为特色的。讲座将定期在各大城市开展。关于这些讲座的更多信息,请联系您本地的办事处,联系方式列在 Web 站点上,网址为 http:/ SPSS Inc.1989,2010iii附加出版物附加出版物
6、SPSS Statistics:数据分析指南、SPSS Statistics:Statistical Procedures Companion和 SPSS Statistics:Advanced Statistical Procedures Companion(由 Marija Noruis编写,并已由 Prentice Hall 出版)作为建议的补充材料提供。这些出版物涵盖 SPSSStatistics Base 模块、Advanced Statistics 模块和 回归模块中的统计过程。无论您是刚开始从事数据分析工作,还是已准备好使用高级应用程序,这些书籍都将帮助您最有效地利用在 IBM
7、SPSS Statistics 产品中找到的功能。有关其他信息,包括出版物的内容和示例章节,请参阅作者的网站:http:/iv内容内容部分 I:用户指南1复杂样本过程简介1部分 I:用户指南1复杂样本过程简介1复杂样本的属性.1“复杂样本”过程的使用.2计划文件.2其他参考.22从复杂设计抽样32从复杂设计抽样3创建新样本计划.3抽样向导:设计变量.4浏览抽样向导的树控件.5抽样向导:抽样方法.6抽样向导:样本大小.7定义不等大小.8抽样向导:输出变量.9抽样向导:计划摘要.10抽样向导:抽取样本:选择选项.11抽样向导:抽取样本:输出文件.12抽样向导:完成.13修改现有样本计划.13抽样向
8、导:计划摘要.14运行现有样本计划.14CSPLAN 和 CSSELECT 命令附加功能.153准备复杂样本以进行分析163准备复杂样本以进行分析16创建新的分析计划.16分析准备向导:设计变量.17浏览分析向导的树控件.18 Copyright SPSS Inc.1989,2010v分析准备向导:估计方法.18分析准备向导:字体大小.19定义不等大小.20分析准备向导:计划摘要.21分析准备向导:完成.22修改现有分析计划.22分析准备向导:计划摘要.234复杂样本计划245复杂样本频率254复杂样本计划245复杂样本频率25复杂样本频率:统计量.26复杂样本:缺失值.27复杂样本:选项.2
9、76复杂样本描述296复杂样本描述29复杂样本描述:统计量.30复杂样本描述:缺失值.31复杂样本:选项.327复杂样本交叉表337复杂样本交叉表33复杂样本交叉表:统计量.35复杂样本:缺失值.36复杂样本:选项.368复杂样本比率378复杂样本比率37复杂样本比率:统计量.38复杂样本比率:缺失值.39复杂样本:选项.39vi9复杂样本一般线性模型409复杂样本一般线性模型40复杂样本一般线性模型:统计量.43复杂样本假设检验.44复杂样本一般线性模型:估算的均值.45复杂样本一般线性模型:保存.46复杂样本一般线性模型:选项.47CSGLM 命令附加功能.4710 复杂样本 Logist
10、ic 回归4810 复杂样本 Logistic 回归48复杂样本 Logistic 回归:参考类别.49复杂样本 Logistic 回归:模型.50复杂样本 Logistic 回归:统计量.51复杂样本假设检验.52复杂样本 Logistic 回归:几率比.53复杂样本 Logistic 回归:保存.54复杂样本 Logistic 回归:选项.55CSLOGISTIC 命令附加功能.5611 复杂样本序数回归5711 复杂样本序数回归57复杂样本序数回归:响应概率.59复杂样本序数回归:模型.59复杂样本序数回归:统计量.61复杂样本假设检验.62复杂样本序数回归:几率比.63复杂样本序数回归
11、:保存.64复杂样本序数回归:选项.65CSORDINAL 命令附加功能.6612 复杂样本 Cox 回归6712 复杂样本 Cox 回归67界定事件.70预测器.71界定依时预测器.72vii子组.73模型.74统计量.75图.77假设检验.78保存.79导出.81选项.83CSCOXREG 命令的附加功能.84部分 II:示例13 复杂样本抽样向导86部分 II:示例13 复杂样本抽样向导86从完整抽样框架获取样本.86使用向导.86计划摘要.96抽样摘要.96样本结果.97从部分抽样框架获取样本.98使用该向导从第一部分框架抽样.98样本结果.111使用该向导从第二部分框架抽样.111样
12、本结果.116以与大小成正比的概率抽样(PPS).116使用向导.116计划摘要.128抽样摘要.128样本结果.130相关过程.13214 复杂样本分析准备向导13314 复杂样本分析准备向导133使用复杂样本分析准备向导准备 NHIS 公共数据.133使用向导.133摘要.136抽样权重不在数据文件中时准备分析.136计算包含概率和抽样权重.136viii使用向导.139摘要.146相关过程.14715 复杂样本频率14815 复杂样本频率148使用复杂样本频率分析营养补充品的使用情况.148运行分析.148频率表.151基于子体的频率.151摘要.152相关过程.15216 复杂样本描述
13、15316 复杂样本描述153使用复杂样本描述分析活动水平.153运行分析.153单变量统计.156基于子体的单变量统计.156摘要.157相关过程.15717 复杂样本交叉表15817 复杂样本交叉表158使用复杂样本交叉表度量事件的相对风险.158运行分析.158交叉制表.161风险估计.162基于子体的风险估计.163摘要.163相关过程.16318 复杂样本比率16418 复杂样本比率164使用复杂样本比率辅助进行资产价值评估.164运行分析.164比率.167ix透视比率表.167摘要.168相关过程.16819 复杂样本一般线性模型16919 复杂样本一般线性模型169使用复杂样本
14、一般线性模型拟合双因子 ANOVA.169运行分析.169模型摘要.174模型效应检验.175参数估计值.175估算边际均值.176摘要.178相关过程.17820 复杂样本 Logistic 回归17920 复杂样本 Logistic 回归179使用复杂样本 Logistic 回归评估信用风险.179运行分析.179伪 R 平方.183Classification.184模型效应检验.184参数估计值.185几率比.185摘要.186相关过程.18721 复杂样本序数回归18821 复杂样本序数回归188使用复杂样本序数回归分析调查结果.188运行分析.188伪 R 平方.193模型效应检验
15、.193参数估计值.194Classification.195几率比.196一般化累积模型.197减少非显著性预测变量.198警告.200 x比较模型.201摘要.202相关过程.20222 复杂样本 Cox 回归20322 复杂样本 Cox 回归203在复杂样本 Cox 回归中使用依时预测器.203准备数据.203运行分析.209样本设计信息.214模型效应检验.215比例危险测试.215添加依时预测器.215“复杂样本 Cox 回归”中的每个主体多个个案.219准备数据以进行分析.219创建简单的随机抽样分析计划.235运行分析.239样本设计信息.247模型效应检验.248参数估计值.2
16、48模式值.249对数负对数图.250摘要.250附录A样本文件251BNotices259参考书目262索引264附录A样本文件251BNotices259参考书目262索引264xi部分 I:用户指南部分 I:用户指南章1 1复杂样本过程简介复杂样本过程简介在传统软件包中,一项对分析过程的固有假设是:数据文件中的观察数据代表从关注的群体选取的简单随机样本。这种假设对越来越多的公司不再适用,研究人员发现以更为结构化的方式获取样本既经济高效又很方便。使用“复杂样本”选项,可以根据一项复杂设计选择样本,并将设计指定项融入数据分析中,从而确保结果是有效的。复杂样本的属性复杂样本的属性复杂样本在很多
17、方面与简单随机样本不同。在简单随机样本中,各抽样单元是直接从整个总体中采用不放回方式以等概率(WOR)随机选择的。相比之下,给定的复杂样本具有以下部分或全部特征:层次。层次。分层抽样在总体的非重叠子组(即层次)中独立选择样本。例如,层次可以是社会经济组、工作类别、年龄组或种族组。通过分层,可以确保子组的样本大小足够大,提高整个估计值的精确度,并在不同层次使用不同抽样方法。聚类。聚类。聚类抽样需要选择抽样单元组(即聚类)。例如,聚类可以是学校、医院或地理区域,抽样单元可以是学生、病人或市民。聚类在多阶段设计和区域(地理)样本中很常见。多阶段。多阶段。在多阶段抽样中,应基于聚类选择第一阶段样本。然
18、后,通过从所选聚类抽取子样本创建第二阶段样本。如果第二阶段样本是基于子聚类的,则可以向样本添加第三阶段。例如,在调查的第一阶段,可以抽取城市样本。然后,从所选城市中,可以抽取家庭样本。最后,从所选家庭中,可以对个人进行民意调查。使用抽样和分析准备向导可以在一个设计中指定三个阶段。非随机抽样。非随机抽样。如果随机选择难以实现,则可以系统(以固定间隔)或顺序方式抽取单元。不等选择概率。不等选择概率。如果抽取的聚类包含的单元数不相等,可以使用与大小成正比(PPS)的概率进行抽样,以使聚类的选择概率与其所含单元的比例相等。PPS 抽样还可以使用更多一般加权设计来选择单元。无限制抽样。无限制抽样。无限制
19、抽样以放回方式(WR)选择单元。因此,单个单元可能多次选入样本中。抽样权重。抽样权重。抽样权重是在抽取复杂样本时自动计算的,与目标总体中每个抽样单元代表的“频率”十分一致。因此,根据样本的权重总和可以估计总体大小。复杂样本分析过程需要抽样权重以正确分析复杂样本。请注意:这些权重应该在“复杂样本”选项内使用,而不应通过“加权个案”过程用于其他分析过程,该过程将权重视为个案重复。Copyright SPSS Inc.1989,201012章 1“复杂样本”过程的使用“复杂样本”过程的使用“复杂样本”过程的使用取决于特定需要。用户主要类型为执行如下任务的人员:根据复杂设计计划和执行调查,可能以后再分
20、析样本。调查人员的主要工具是抽样向导。根据复杂设计分析以前获得的样本数据文件。在使用“复杂样本”分析过程之前,可能需要使用分析准备向导。无论是哪类用户,都需要向“复杂样本”过程提供设计信息。为便于重新使用,这一信息存储在计划文件计划文件中。计划文件计划文件规划文件包含复杂抽样规范。计划文件有两种类型:抽样计划。抽样计划。抽样向导中给定的指定项定义用于抽取复杂样本的样本设计。抽样计划文件包含这些指定项。抽样计划文件还包含一个缺省分析计划,该计划使用适合指定样本设计的估计方法。分析计划。分析计划。此计划文件包含“复杂样本”分析过程正确计算复杂样本的方差估计所需的信息。该计划包括样本结构、每个阶段的
21、估计方法和对所需变量(如样本权重)的引用。使用分析准备向导可以创建和编辑分析计划。在计划文件中保存指定项有几个好处,包括:调查人员可以指定多阶段抽样计划的第一阶段并立即抽取第一阶段单元,并为第二阶段收集抽样单元的信息,然后修改抽样计划以包括第二阶段。不能访问抽样计划文件的分析人员可以指定一个分析计划,然后从每个“复杂样本”分析过程引用该计划。大型公用样本的设计人员可以发布抽样计划文件,这样简化了分析人员指令,也使分析人员不再需要每人都指定自己的分析计划。其他参考其他参考有关抽样技术的更多信息,请参见以下内容:Cochran,W.G.1977.Sampling Techniques,3rd ed
22、.New York:John Wiley and Sons.Kish,L.1965.Survey Sampling.New York:John Wiley and Sons.Kish,L.1987.Statistical Design for Research.New York:John Wiley and Sons.Murthy,M.N.1967.Sampling Theory and Methods.Calcutta,India:StatisticalPublishing Society.Srndal,C.,B.Swensson,和 J.Wretman.1992.Model Assiste
23、d Survey Sampling.NewYork:Springer-Verlag.章2 2从复杂设计抽样从复杂设计抽样图片 2-1抽样向导,“欢迎”步骤该抽样向导将指导您完成创建、修改或执行抽样计划文件的步骤。在使用向导之前,应构思好定义明确的目标总体、抽样单元列表和适当的样本设计。创建新样本计划创建新样本计划E从菜单中选择:分析 复杂样本 选择样本.E选择设计样本并选择一个计划文件名来保存样本计划。E单击下一步使向导继续。Copyright SPSS Inc.1989,201034章 2E或者,在“设计变量”步骤中,可以定义层次、聚类和输入样本权重。定义这些内容之后,单击下一步。E或者,在
24、“抽样方法”步骤中,可以选择一个方法用于选择样本。如果选择PPS Brewer或PPS Murthy,可以单击完成抽取样本。否则,单击下一步,然后:E在“样本大小”步骤中,指定要抽样的单元数或单元比例。E现在,即可单击完成抽取样本。或者,可以进一步执行以下步骤:选择要保存的输出变量。向设计添加第二或第三阶段。设置各选择选项,包括抽取样本的阶段、随机数种子,以及是否将用户缺失值视为设计变量的有效值。选择输出数据的保存位置。将所选项粘贴为命令语法。抽样向导:设计变量抽样向导:设计变量图片 2-2抽样向导,“设计变量”步骤5从复杂设计抽样在这一步骤中,可以选择层次变量和聚类变量,可以定义输入样本权重
25、。还可指定阶段的标签。分层依据。分层依据。分层变量的交叉分类定义了不同的子体,即层次。分别为各层获取了不同的样本。要提高估计值的精确度,层中单元的特征应尽量均一。分群。分群。分群变量定义观察单元组,即分群。如果从总体直接抽取观察单元很昂贵,或者不可能实现,就可以使用分群;可以从总体抽取分群,然后从所选分群抽取观察单元。但是,使用分群会在抽样单元之间引入相关性,导致精度下降。要使这种影响减到最小,分群中的单元的特征应尽量均一。必须至少定义一个分群变量才能计划多阶段设计。在使用多个不同抽样方法时,分群也是必不可少的。有关详细信息,请参阅第 6 页码中的抽样向导:抽样方法.输入样本权重。输入样本权重
26、。如果当前样本设计是更大样本设计的一部分,则可以从更大样本设计的以前阶段获得样本权重。在当前设计的第一阶段,可以指定一个包含这些权重的数值型变量。对于当前设计的后续阶段,样本权重将自动计算。阶段标签。阶段标签。可为每个阶段指定一个可选的字符串标签。该标签用在输出中以帮助识别分阶段信息。注意:源变量列表的内容在所有向导步骤中都相同。换言之,在某个特定步骤中从源列表移去的变量将在所有步骤中从该列表移去。返回源列表的变量在所有步骤中都会显示在列表中。浏览抽样向导的树控件浏览抽样向导的树控件在抽样向导的每个步骤中,左侧都是所有步骤的概要。单击概要中已启用步骤的名称可浏览该向导。只要前面的所有步骤有效即
27、前面每个步骤都具有要求的最小指定项,则步骤为启用状态。有关给定步骤无效原因的更多信息,请参见各步骤的“帮助”。6章 2抽样向导:抽样方法抽样向导:抽样方法图片 2-3抽样向导,“样本方法”步骤在这一步骤中,可以指定从活动数据集中选择个案的方式。方法。方法。该组中的控件用于选择一种选择方法。某些抽样类型允许选择放回抽样(WR)或不放回抽样(WOR)。有关更多信息,请参见类型描述。请注意,某些与大小成正比的概率(PPS)类型只在定义聚类之后才可用,所有 PPS 类型只在设计的第一阶段才可用。此外,WR 方法只在设计的最后阶段才可用。简单随机抽样。简单随机抽样。以等概率选择单元。单元可以采用放回或不
28、放回方式进行选择。简单系统。简单系统。在整个抽样框架或层次(如果指定)中,采用不放回方式以固定间隔选择单元。在第一个区间内随机选择的单元即选作起始点。简单顺序。简单顺序。采用不放回方式以等概率顺序地选择单元。PPS。PPS。这是第一阶段方法,它以与大小成正比的概率随机选择单元。任何单元都可以采用放回方式选择;只有聚类可以采用不放回方式抽样。PPS 系统。PPS 系统。这是第一阶段方法,它以与大小成正比的概率系统地选择单元。并且单元是以不放回方式选择的。PPS 顺序。PPS 顺序。这是第一阶段方法,它以与聚类大小成正比的概率采用不放回方式顺序选择单元。7从复杂设计抽样PPS Brewer。PPS
29、 Brewer。这是第一阶段方法,它以与聚类大小成正比的概率采用不放回方式从每个层次选择两个聚类。要使用此方法,必须指定聚类变量。PPS Murthy。PPS Murthy。这是第一阶段方法,它以与聚类大小成正比的概率采用不放回方式从每个层次选择两个聚类。要使用此方法,必须指定聚类变量。PPS Sampford。PPS Sampford。这是第一阶段方法,它以与聚类大小成正比的概率从每个层次采用不放回方式选择两个以上聚类。它是 Brewer 方法的扩展。要使用此方法,必须指定聚类变量。在分析中使用 WR 估计。在分析中使用 WR 估计。缺省情况下,估计方法是在计划文件中指定的,与所选抽样方法一
30、致。这样,即使抽样方法意味着 WOR 估计,也可以使用放回方式估计。此选项只在阶段 1 可用。大小测量(MOS)。大小测量(MOS)。如果选择 PPS 方法,则必须指定定义每个单元大小的规模度量。这些规模可以在一个变量中显式定义,也可以根据数据计算。或者,可以设置 MOS 的上限和下限,覆盖所有 MOS 变量中的值或根据数据计算的值。这些选项只在阶段 1 可用。抽样向导:样本大小抽样向导:样本大小图片 2-4抽样向导,“样本大小”步骤在这一步骤中,可以指定当前阶段中要抽样的单元数或单元比例。样本大小可以是固定的,也可以各层不同。为了指定样本大小,前面阶段中选择的聚类可用于定义层次。8章 2单位
31、。单位。可以指定要抽样的单元的确切样本大小或比例。值。值。应用于所有层次的单个值。如果将计数选作单元度规,则应输入一个正整数。如果选择比例,则应输入一个非负值。除非是放回抽样,否则比例值也应不大于 1。各层不相等的值。各层不相等的值。允许您通过“定义不等大小”对话框逐层输入大小值。从变量中读取值。从变量中读取值。允许您选择包含层次大小值的数值变量。如果选择比例,则可以设置抽样单元数的下限和上限。定义不等大小定义不等大小图片 2-5“定义不等大小”对话框在“定义不等大小”对话框中,可以逐层输入大小值。“指定大小”网格。“指定大小”网格。该网格最多显示五个层次变量或聚类变量的交叉分类即每行一个层次
32、/聚类组合。符合的变量包括当前和以前阶段的所有分层变量,以及以前阶段的所有聚类变量。变量可在网格内重新排序,或者移到“排除”列表。在最右列中输入大小。单击标签或值,在网格单元格中分层变量和聚类变量的值标签和数据值的显示之间切换。包含未标注值的单元格始终显示值。单击刷新层,用网格中变量的标注数据值的每个组合重新填充网格。排除。排除。要指定层次/聚类组合子集的大小,请将一个或多个变量移到“排除”列表。这些变量不用于定义样本大小。9从复杂设计抽样抽样向导:输出变量抽样向导:输出变量图片 2-6抽样向导,“输出变量”步骤在这一步骤中,可以选择抽取样本时要保存的变量。群体大小。群体大小。给定阶段估计的总
33、体单元数。保存变量的根名为 PopulationSize_。样本比例。样本比例。给定阶段的抽样率。保存变量的根名为 SamplingRate_。样本大小。样本大小。给定阶段抽取的单元数。保存变量的根名为 SampleSize_。样本权重。样本权重。包含概率的逆。保存变量的根名为 SampleWeight_。某些分阶段变量是自动生成的。其中包括:包含概率。包含概率。给定阶段抽取的单元比例。保存变量的根名为 InclusionProbability_。累积权重。累积权重。当前阶段之前(包括当前阶段)的累积样本权重。保存变量的根名为SampleWeightCumulative_。指标。指标。标识给定
34、阶段中多次选择的单元。保存变量的根名为 Index_。注意:保存变量根名称包含一个整数后缀,它反映阶段号例如,PopulationSize_1_用于阶段 1 保存的总体大小。10章 2抽样向导:计划摘要抽样向导:计划摘要图片 2-7抽样向导,“计划摘要”步骤这是每个阶段的最后一步,提供整个当前阶段的样本设计指定项的摘要。在此,可以继续下一阶段(必要时创建阶段),也可以设置抽取样本的选项。11从复杂设计抽样抽样向导:抽取样本:选择选项抽样向导:抽取样本:选择选项图片 2-8抽样向导,“抽取样本选择选项”步骤在这一步骤中,可以选择是否抽取样本。还可以控制其他抽样选项,如随机种子和缺失值处理。抽取样
35、本。抽取样本。除了选择是否抽取样本之外,还可以选择执行部分抽样设计。必须按顺序抽取阶段即抽取阶段 1 之后才能抽取阶段 2。编辑或执行计划时,不能重新抽取锁定的阶段。种子。种子。它可用来选择生成随机数的种子值。包括用户缺失值。包括用户缺失值。可确定用户缺失值是否有效。如果有效,则将用户缺失值视为单独的类别。数据已排序。数据已排序。如果样本框架按照分层变量值预先排序,使用此选项可以加快选择过程。12章 2抽样向导:抽取样本:输出文件抽样向导:抽取样本:输出文件图片 2-9抽样向导,抽取样本,“输出文件”步骤在这一步骤中,可以选择抽样个案、权重变量、联合概率和个案选择规则的定向位置。样本数据。样本
36、数据。使用这些选项可以确定样本输出的写入位置。样本输出可以添加到活动数据集,也可以写入新数据集,还可以保存到外部 IBM SPSS Statistics 数据文件中。数据集在当前会话期间可用,但在后续会话期间不可用,除非显式将其保存为数据文件。数据集名称必须符合变量命名规则。如果指定外部文件或新数据集,则写入所选个案的抽样输出变量和活动数据集中的变量。联合概率。联合概率。使用这些选项可以确定联合概率的写入位置。联合概率保存到外部 SPSSStatistics 数据文件。如果选择 PPS WOR、PPS Brewer、PPS Sampford 或 PPS Murthy 方法,并且未指定 WR 估
37、计,则会生成联合概率。个案选择规则。个案选择规则。如果要一次在一个阶段构造样本,可能希望将个案选择规则保存到文本文件中。个案选择规则对于构造后续阶段的子框架非常有用。13从复杂设计抽样抽样向导:完成抽样向导:完成图片 2-10抽样向导,“完成”步骤这是最后一步。现在即可保存计划文件并抽取样本,或者将选择内容粘贴到语法窗口中。在对现有计划文件中的阶段进行更改时,可将已编辑的计划另存为新文件或覆盖现有文件。如果添加阶段而不更改现有阶段,则向导将自动覆盖现有计划文件。如果要将计划保存为新文件,请选择将向导生成的语法粘贴到语法窗口,并在语法命令中更改文件名。修改现有样本计划修改现有样本计划E从菜单中选
38、择:分析 复杂样本 选择样本.E选择编辑样本设计,并选择要编辑的计划文件。E单击下一步使向导继续。E在“计划摘要”步骤中复查抽样计划,然后单击下一步。后续步骤与新设计大体相同。有关更多信息,请参见各步骤的“帮助”。E浏览到“完成”步骤,为编辑过的计划文件指定新名称,或选择覆盖现有计划文件。14章 2根据需要,您可以:指定已进行抽样的阶段。从计划中移去阶段。抽样向导:计划摘要抽样向导:计划摘要图片 2-11抽样向导,“计划摘要”步骤在这一步骤中,可以复查抽样计划,确定已进行了抽样的阶段。如果编辑计划,还可以从计划中移去阶段。以前抽样的阶段。以前抽样的阶段。如果扩展抽样框架不可用,则必须一次在一个
39、阶段执行多阶段抽样设计。从下拉列表中选择哪些阶段已进行了抽样。所有执行过的阶段都是锁定的;它们在“抽取样本选择选项”步骤中不可用,并且不能在编辑计划时更改。移去阶段。移去阶段。可从多阶段设计中移去阶段 2 和 3。运行现有样本计划运行现有样本计划E从菜单中选择:分析 复杂样本 选择样本.15从复杂设计抽样E选择抽取样本,并选择要运行的计划文件。E单击下一步使向导继续。E在“计划摘要”步骤中复查抽样计划,然后单击下一步。E执行样本计划时,会跳过包含阶段信息的各步骤。现在,随时可以执行“完成”步骤。根据需要,您可以指定已进行抽样的阶段。CSPLAN 和 CSSELECT 命令附加功能CSPLAN
40、和 CSSELECT 命令附加功能使用命令语法语言还可以:为输出变量指定定制名称。在浏览器中控制输出。例如,如果设计或修改了样本,则可以取消显示所显示的分阶段计划摘要,如果执行了样本设计,则可以取消显示所显示的按层抽样个案的分布摘要,并请求显示个案处理摘要。在活动数据集中选择一个变量子集,以写入外部样本文件或其他数据集。请参见命令语法参考以获取完整的语法信息。章3 3准备复杂样本以进行分析准备复杂样本以进行分析图片 3-1分析准备向导,“欢迎”步骤分析准备向导将引导您完成创建或修改分析计划的各个步骤,以用于各种“复杂样本”分析过程。使用该向导之前,应先根据一项复杂设计完成样本抽取。如果不能访问
41、用于抽取样本的抽样计划文件(该抽样计划包含一个缺省分析计划),则创建一个新的计划非常有用。如果确实可以访问用于抽取样本的抽样计划文件,则可以使用抽样计划文件包含的缺省分析计划,也可以覆盖缺省分析指定项并将更改保存到新文件中。创建新的分析计划创建新的分析计划E从菜单中选择:分析 复杂样本 准备分析.Copyright SPSS Inc.1989,20101617准备复杂样本以进行分析E选择创建计划文件,然后选择一个计划文件名,用于保存分析计划。E单击下一步使向导继续。E在“设计变量”步骤中,指定包含样本权重的变量,定义层次和聚类(可选)。E现在,即可单击完成保存计划。或者,可以进一步执行以下步骤
42、:在“估计方法”步骤中,选择用于估计标准误的方法。在“大小”步骤中,指定抽取的单元数或每个单元的包含概率。向设计添加第二或第三阶段。将所选项粘贴为命令语法。分析准备向导:设计变量分析准备向导:设计变量图片 3-2分析准备向导,“设计变量”步骤在这一步骤中,可以确定层变量和分群变量并定义样本权重。还可指定阶段的标签。层。层。分层变量的交叉分类定义了不同的子体,即层次。总样本代表每层的独立样本的组合。18章 3分群。分群。分群变量定义观察单元组,即分群。多阶段抽取的样本首先在较早阶段中选择分群,然后从所选分群中抽取子样本单元。在分析通过放回方式分群抽样获得的数据文件时,应将重复指数包括为分群变量。
43、样本权重。样本权重。必须在第一阶段提供样本权重。对于当前设计的后续阶段,样本权重将自动计算。阶段标签。阶段标签。可为每个阶段指定一个可选的字符串标签。该标签用在输出中以帮助识别分阶段信息。注意:源变量列表的内容在该向导所有步骤中都相同。换言之,在某个特定步骤中从源列表移去的变量将在所有步骤中从该列表移去。会在所有步骤中显示返回源列表的变量。浏览分析向导的树控件浏览分析向导的树控件在每个分析向导步骤的左侧都是所有步骤的概要。单击概要中已启用步骤的名称可浏览该向导。只要前面所有步骤都有效即只要该步骤前面每个步骤都具有要求的最小指定项,则步骤为启用状态。有关给定步骤无效原因的更多信息,请参见各步骤的
44、“帮助”。分析准备向导:估计方法分析准备向导:估计方法图片 3-3分析准备向导,“估计方法”步骤在这一步骤中,可以指定阶段的估计方法。19准备复杂样本以进行分析WR(放回式抽样)。WR(放回式抽样)。在复杂抽样设计下估计方差时,WR 估计不包括对有限总体抽样的修正(FPC)。在简单随机抽样(SRS)下估计方差时,可以选择包括或排除 FPC。如果分析权重已进行标度,建议选择不包括用于 SRS 方差估计的 FPC,以免分析权重增加总体大小。SRS 方差估计用于计算类似于设计效果的统计量。只能在设计的最后阶段指定 WR 估计;如果选择 WR 估计,向导将不允许添加其他阶段。等概率 WOR(等概率不放
45、回式抽样)。等概率 WOR(等概率不放回式抽样)。等概率 WOR 估计包括有限总体修正,并假设单元是等概率抽取的。等概率 WOR 可在设计的任何阶段指定。不等概率 WOR(不等概率不放回式抽样)。不等概率 WOR(不等概率不放回式抽样)。除了使用有限总体修正之外,不等概率 WOR 还考虑以不等概率选择的抽样单元(通常为聚类)。此估计方法仅在第一阶段可用。分析准备向导:字体大小分析准备向导:字体大小图片 3-4分析准备向导,“大小”步骤这一步骤用于指定当前阶段的包含概率或总体大小。大小可以是固定的,也可以各层不同。为了指定大小,前面阶段中指定的聚类可用于定义层次。请注意:仅当选择等概率WOR 作
46、为估计方法时,这一步骤才是必需的。单位。单位。可以指定精确的总体大小或单元抽样概率。值。值。应用于所有层次的单个值。如果将总体大小选作单元度规,则应输入一个非负整数。如果选择包含概率,则应输入一个 0 到 1 之间(包括 0 和 1)的值。20章 3各层不相等的值。各层不相等的值。允许您通过“定义不等大小”对话框逐层输入大小值。从变量中读取值。从变量中读取值。允许您选择包含层次大小值的数值变量。定义不等大小定义不等大小图片 3-5“定义不等大小”对话框在“定义不等大小”对话框中,可以逐层输入大小值。“指定大小”网格。“指定大小”网格。该网格最多显示五个层次变量或聚类变量的交叉分类即每行一个层次
47、/聚类组合。符合的变量包括当前和以前阶段的所有分层变量,以及以前阶段的所有聚类变量。变量可在网格内重新排序,或者移到“排除”列表。在最右列中输入大小。单击标签或值,在网格单元格中分层变量和聚类变量的值标签和数据值的显示之间切换。包含未标注值的单元格始终显示值。单击刷新层,用网格中变量的标注数据值的每个组合重新填充网格。排除。排除。要指定层次/聚类组合子集的大小,请将一个或多个变量移到“排除”列表。这些变量不用于定义样本大小。21准备复杂样本以进行分析分析准备向导:计划摘要分析准备向导:计划摘要图片 3-6分析准备向导,“计划摘要”步骤这是每个阶段的最后一个步骤,提供整个当前阶段的分析设计指定项
48、的摘要。在此,可以继续下一阶段(必要时创建下一阶段),也可以保存分析指定项。如果不能添加其他阶段,可能的原因如下:在“设计变量”步骤中未指定任何聚类变量。在“估计方法”步骤中选择了 WR 估计。这是分析的第三阶段,而该向导最多支持三个阶段。22章 3分析准备向导:完成分析准备向导:完成图片 3-7分析准备向导,“完成”步骤这是最后一步。现在,可以保存计划文件,或将选择内容粘贴到语法窗口。在对现有计划文件中的阶段进行更改时,可将已编辑的计划另存为新文件或覆盖现有文件。如果添加阶段而不更改现有阶段,则向导将自动覆盖现有计划文件。如果要将计划保存为新文件,请选择将本向导生成的语法粘贴到语法窗口,并在
49、语法命令中更改文件名。修改现有分析计划修改现有分析计划E从菜单中选择:分析 复杂样本 准备分析.E选择编辑计划文件,然后选择一个计划文件名,用于保存分析计划。E单击下一步使向导继续。E在“计划摘要”步骤中复查分析计划,然后单击下一步。后续步骤与新设计大体相同。有关更多信息,请参见各步骤的“帮助”。E浏览到“完成”步骤,为编辑过的计划文件指定新名称,或选择覆盖现有计划文件。根据需要,您可以从计划中删除阶段。23准备复杂样本以进行分析分析准备向导:计划摘要分析准备向导:计划摘要图片 3-8分析准备向导,“计划摘要”步骤在这一步骤中,可以复查分析计划和从计划中移去阶段。移去阶段。移去阶段。可从多阶段
50、设计中移去阶段 2 和 3。计划必须至少有一个阶段,因此,可以编辑阶段 1,但不能将其从设计中移去。章4 4复杂样本计划复杂样本计划“复杂样本”分析过程从分析或样本计划文件中获得分析指定项,以便提供有效的结果。图片 4-1“复杂样本计划”对话框计划。计划。指定分析或样本计划文件的路径。联合概率。联合概率。要对用 PPS WOR 方法抽取的聚类使用不等概率 WOR 估计,需要指定包含联合概率的单独文件或打开的数据集。此文件或数据集由抽样向导在抽样过程中创建。Copyright SPSS Inc.1989,201024章5 5复杂样本频率复杂样本频率“复杂样本频率”过程可以为所选变量生成频率表并显