收藏 分享(赏)

具有复杂相关结构的几类统计模型的理论与应用研究.pdf

上传人:a****2 文档编号:3114025 上传时间:2024-01-20 格式:PDF 页数:25 大小:1MB
下载 相关 举报
具有复杂相关结构的几类统计模型的理论与应用研究.pdf_第1页
第1页 / 共25页
具有复杂相关结构的几类统计模型的理论与应用研究.pdf_第2页
第2页 / 共25页
具有复杂相关结构的几类统计模型的理论与应用研究.pdf_第3页
第3页 / 共25页
具有复杂相关结构的几类统计模型的理论与应用研究.pdf_第4页
第4页 / 共25页
具有复杂相关结构的几类统计模型的理论与应用研究.pdf_第5页
第5页 / 共25页
具有复杂相关结构的几类统计模型的理论与应用研究.pdf_第6页
第6页 / 共25页
亲,该文档总共25页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、 申请代码 A011102 受理部门 收件日期 受理编号 国家自然科学基金国家自然科学基金 申申 请请 书书 (2 0 1(2 0 1 1 1 版版)资助类别:面上项目 亚类说明:附注说明:项目名称:具有复杂相关结构的几类统计模型的理论与应用研究 申 请 人:林金官 电话:025-52090589 依托单位:东南大学 通讯地址:南京市四牌楼 2 号东南大学数学系 邮政编码:210096 单位电话:02583792628 电子邮箱: 申报日期:2011年3月1日 国家自然科学基金委员会 11171212NSFC 2011 国家自然科学基金申请书 2011 版 第 2 页 版本 1.008.903

2、 基本信息基本信息 1cDsO43n 申申 请请 人人 信信 息息 姓名 林金官 性别 男 出生 年月 1964 年 7 月 民 族 汉族 学位 博士 职称 教授 每年工作时间(月)10 电话 025-52090589 电子邮箱 传真 国别或地区 中国 个 人 通 讯 地 址 南京市四牌楼 2 号东南大学数学系 工作单位 东南大学/数学系 主 要 研 究 领 域 统计诊断;非线性回归;纵向数据分析;复杂相关分析 依托单位信息依托单位信息 名称 东南大学 联系人 毕建新 电子邮箱 电话 02583792628 网站地址 http:/ 单 位 名 称 项项 目目 基基 本本 信信 息息 项目名称

3、具有复杂相关结构的几类统计模型的理论与应用研究 资助类别 面上项目 亚 类 说 明 附注说明 申请代码 A011102:时间序列与多元分析 A011103:数据分析与统计计算 基地类别 研究期限 2012 年 1 月 2015 年 12 月 研究属性 基础研究 申请经费 64.0000 万元 摘摘 要要 (限限 400400 字字):在实际问题中,数据常常是相依的,具有潜在的相关结构.本课题研究具有复杂相关结构(如 NA 序列、鞅差序列、混合序列及它们的线性混合、Copula 结构等)的几种常见统计模型的相关理论和应用问题.首先研究具有复杂相关结构普通回归模型相关推断的理论及应用问题,并探索相

4、关结构的可识别性及统计检验问题;其次研究含有复杂相关结构及Copula 相关结构的纵向数据模型的统计推断,包括参数估计及其渐近性质、异方差和相关性检验等;第三研究基于参数、半参数和非参数方法建立具有 Copula 结构的多元极值模型及其统计分析方法;第四研究基于 Copula 相关结构的多元广义极值模型的统计计算方法;第五进行具有复杂相关结构的实际数据分析和算法研究。将复杂相关结构和 Copulas 相关结构应用于刻画常见的统计模型的相关性进而进行统计推断是一个研究内容丰富、很有挑战性的课题,它不但具有理论上的研究价值,也具有更直观的实际意义.关关 键键 词词(用分号分开,最多 5 个)复杂相

5、关结构;回归模型;广义极值模型;Copulas 相关结构;统计分析与诊断 NSFC 2011 国家自然科学基金申请书 2011 版 第 3 页 版本 1.008.903 项目组主要项目组主要参与者参与者(注:项目组主要参与者不包括项目申请人)编号 姓 名 出生年月 性别 职 称 学 位 单位名称 电话 电子邮箱 项目分工 每年工作时间(月)1 陈平 1960-7-24 男 教授 博士 东南大学 028-83792315 统计计算与数据分析 10 2 徐亮 1965-1-8 男 副教授 博士 东南大学 025-83792315 模型诊断与计算 10 3 江其保 1964-6-6 男 副教授 博士

6、 东南大学 025-83792315 应用研究 10 4 周兴才 1974-9-20 男 博士生 硕士 东南大学 025-83792315 复杂相关分析及应用 9 5 黄超 1985-10-13 男 博士生 硕士 东南大学 025-83792315 huangchao_ 多元极值模型分析 10 6 曹春正 1978-9-23 男 博士生 硕士 东南大学 025-83792315 复杂相关结构纵向数据 9 7 石爱菊 1971-10-14 女 博士生 硕士 东南大学 025-83792315 Copula 结构分析 9 8 言方荣 1978-12-25 男 博士生 硕士 东南大学 025-837

7、92315 统计计算与应用研究 9 9 徐伟娟 1977-11-28 女 博士生 硕士 东南大学 025-83792315 复杂相关结构模型分析 10 总人数 高级 中级 初级 博士后 博士生 硕士生 22 4 1 0 3 6 8 说明:高级、中级、初级、博士后、博士生、硕士生人员数由申请人负责填报(含申请人),总人数由各分项自动加和产生。NSFC 2011 国家自然科学基金申请书 2011 版 第 4 页 版本 1.008.903 经费申请表经费申请表 (金额单位:万元)科目 申请经费 备注(计算依据与说明)一一.研究经费研究经费 42.0000 1.科研业务费 36.0000 (1)测试/

8、计算/分析费 8.0000 用于统计计算、统计模拟及统计分析产生的费用,每年约 2 万元(2)能源/动力费 2.0000 用于支付学校收取的水、电、燃气等费用,每年约0.5 万元(3)会议费/差旅费 18.0000 用于每年4人次左右的国内学术交流及举办小型学术研讨会(3-4 场次)的费用(4)出版物/文献/信息传播费 5.0000 用于资料、论文版面费、印刷费、文献检索、入网等信息通讯费、学术刊物订阅费(5)其他 3.0000 用于购买办公用品及接待来访的国内专家交流等费用 2.实验材料费 0.0000 (1)原材料/试剂/药品购置费 0.0000 (2)其他 0.0000 3.仪器设备费

9、4.0000 (1)购置 4.0000 用于购置计算机设备及耗材(2)试制 0.0000 4.实验室改装费 2.0000 用于计算机房的改装费用 5.协作费 0.0000 二二.国际合作与交流费国际合作与交流费 9.2000 1.项目组成员出国合作交流 4.0000 用于项目组人员2-3人次参加境外学术交流及学术会议的费用 2.境外专家来华合作交流 5.2000 用于每年邀请 1-2 名境外专家来访 三三.劳务费劳务费 9.6000 用于参加该项目的博士后、研究生的劳务费 四四.管理费管理费 3.2000 学校管理费 合合 计计 64.0000 与本项目相关的 其他经费来源 国家其他计划资助经

10、费 其他经费资助(含部门匹配)其他经费来源合计其他经费来源合计 0.0000 NSFC 2011 国家自然科学基金申请书 2011 版 第 5 页 申请者在撰写报告正文时,请遵照以下要求:1、请先选定项目基本信息中的资助类别,再填写报告正文;2、在撰写过程中,不得删除系统已生成的撰写提纲(如误删可点击“查看报告正文撰写提纲”按钮,通过复制/粘贴恢复);3、请将每部分内容填写在提纲下留出的空白区域处;4、本要求将作为申请书正文撰写是否规范的评判依据,请遵照要求填写。报告正文报告正文面上项目申请书撰写提纲面上项目申请书撰写提纲 (一)立项依据与研究内容(一)立项依据与研究内容(4000-8000

11、字):1.项目的立项依据项目的立项依据(研究意义、国内外研究现状及发展动态分析,需结合科学研究发展趋势来论述科学意义;或结合国民经济和社会发展中迫切需要解决的关键科技问题来论述其应用前景。附主要参考文献目录)在经典的统计模型中,经常假定模型误差是独立的,这与实际情形未必是相符的,特别对于经济金融数据,它们经常表现为误差是相依的,具有一定的相关结构。自相关性和一致相关性等以其简单易于统计处理经常用于刻画误差的相关性。但实际问题中,严格满足自相关和一致相关性的误差结构是不多见的。因而有必要引入更复杂、条件更弱的相关结构来刻画统计模型的误差结构。实际上,NA序列、鞅差序列、混合序列(-mixing,

12、-mixing,-mixing)以及它们的线性过程等都可以用来刻画复杂相关结构。近年来,有关 NA 序列、鞅差序列和混合序列的概率结果非常多,也已经部分应用于模型研究,如1-10。文献1研究了复杂相关结构的非参数和参数模型;文献2-5研究了带有复杂相关结构半参数模型中渐近性质,是纯理论的,不便应用于统计分析;文献6-8研究了带有复杂相关结构半参数模型的经验似然方法推断,目前也仅仅局限于 NA、鞅差和鞅差线性误差结构。我们在此方向也进行了初步研究,见9-12。本课题拟将把一些估计方法(如局部线性、B-样条、经验似然和小波等)融入具有复杂相关结构回归模型,包括参数、非参数及半参数模型等,使之能应用

13、于统计分析,并重点研究具有复杂相关结构(特别是-mixing,-mixing,-mixing)的半参数模型,包括理论研究及应用研究。我们还拟将复杂相关结构引入到纵向数据分析中,从受试单元内和受试单元间的复杂相关结构来研究纵向数据的半参数模型的统计性质及应用。由于纵向数据的收集与时间有关,因而在数据分析时,需要考虑受试单元内部的序列相关,目前考虑较多的是统计处理方便的自相关误差,特别是一阶自相关误差,还有其他的一些有明确表达式的相关情形,如一致相关、指数相关等。本课题将更复杂的相关形式,如 NA序列、NA序列线性过程及鞅差序列线性过程和混合序列相关等其他相关类型引入到纵向数据的研究中,包括理论研

14、究及应用研究。另一方面,Copula也是刻画相关性的重要工具,它描述了多元随机变量间的相关性(见13)。它的实质是把多元联合分布分成两部分:一部分只刻画边缘分布,另一部分刻画各分量间的相关关系,即联合分布函数密度是 Copula密度与边缘分布密度之积的乘积。利用 Copula函数来建立多元随机变量的联合分布,优点是能够对边缘分布灵活选择,以找到拟合实际情况较好的边缘分布。另外,NSFC 2011 国家自然科学基金申请书 2011 版 第 6 页 Copula函数能够捕捉变量间的非线性相关关系,比线性相关系数的适用范围更宽了。由于 Copula方法在刻画多元分布方面的有效性和便捷性,以至于它被广

15、泛地应用于分析计量经济、金融、保险等领域的复杂数据(14-16)。我们知道,在纵向数据模型中,随机效应是刻画纵向数据的组间效应的重要工具,但是在确定观察似然的过程中,在许多模型(如广义回归模型,对称族模型等)中会碰到多元积分的问题,因此,在进行参数估计时只能采用近似的方法。而用 Copula刻画纵向数据(多元分布)时,可以克服上述问题,但需要确定不同情形下的 Copula 或给出它的估计形式。17、18应用 Copula初步探讨了经济、生物制药领域的实际数据的相关性。本课题拟将进行基于 Copula的相关结构的回归模型的研究,既要研究 Copula的统计处理,也要研究相关的统计分析与统计诊断等

16、。极值统计方法是一种刻画极值事件统计规律的方法。极值理论最早可以追溯到20世纪早期,但是直到20世纪50年代,才开始真正引起统计学家的关注。极值模型的应用始于工程设计,现已广泛应用于金融、保险、水利、气象等各个方面(19-26)。在过去的几十年里,众多学者对一元极值统计模型进行了深入而系统的研究(见27-33)。但是,在实际应用中,许多问题依赖于多个因素的影响,现实中的极值事件越来越倾向于同时或相继发生的重要特征。因此,发展多元极值理论,建立多元极值的参数、非参数模型以及描述极值的相互关系,正成为该领域近年来的理论前沿和研究热点。早期关于多元极值模型的研究都集中在概率理论方面,与一元极值理论不

17、同,多元情况下的极限分布并不存在有限的参数形式,仅给出极限表示并不能有效用于统计建模、并最终研究实际问题。作为一元极值理论直接的多元推广,多元极值理论的研究对象包括两个部分:一是边缘分布的形式,也就是随机向量分量最大值的统计性质;另一个是各个分量之间的相依关系,也就是极值随机向量的相关结构。对于边缘分布,当然可以用一元极值分布的方法进行统计分析。然而,不可回避的问题是多元随机向量分量之间的相关关系。通常情况下,多元变量之间的相关关系可以用Pearson线性相关系数描述,但是线性相关系数对变量间的非线性相关刻画不足。由此,相关结构函数Copula被引用来描述它们之间的相关关系。近10年许多学者将

18、研究重心转移到推导合适的极值Copula模型方面,并出现了大量颇具影响力的模型:基于logistic分布的参数模型、基于Dirichlet分布的参数模型和混合模型等(34-38)。在利用参数模型对实际数据建模时,关键的问题在于模型的统计推断问题。目前对于logistic型参数模型已有比较成熟和精确的算法(39-42)。但对Dirichlet型参数模型的统计推断方法却非常有限,有待进一步研究。同时,Copula函数以及边缘分布的选择对于算法的要求很高,在很多情况下,传统的统计推断方法的效率大大降低,有时甚至失效。因此,改进多元极值参数模型的统计推断方法是本课题的一个重要的研究动机。基于参数模型的

19、理论和方法在过去的若干年里得到了一些进展,在实际数据建模时,现有的文献大多将数据分别基于多个Copula函数和边缘分布函数进行拟合,之后通过一些检验和模型诊断方法,选择备选模型中的最优形式。该方法已被大多统计学家和经济学家接受,并成为当今解决多元极值参数模型建模的主流方法(43-45)。但是通过这种方法确定的参数模型只是次最优的或者局部最优的。由此一些半参数、非参数的方法应运而生(46-48),这些方法从一定意义上改进了上述方法的局限性,同时也减少了参数模型的误判。但相应的估计的收敛速度相对较慢,并且在实际问题中,可操作性不强。因此,本课题的另一个研究动机就是综合使用参数、半参数和非参数的模型

20、以及统计推断方法,对现有的一些模型进行改进,提出具有最优性广、误判率低、可操作性强的多元极值模型。总之,本课题拟将复杂相关结构应用于刻画几类常见的统计模型(如参数型、非参数型、半参数型的普通回归模型,纵向数据模型,广义极值模型等)的相关结构,进而研究这些模型的有关理论与应用问题,包括统计推断、统计诊断、数据分析及复杂相关结构的可识别性及统计检验问题等。本课题组多年来,一直从事非线性模型、统计诊断、纵向数据分析及结构方程模型分析等方面的研究,取得了一批有较高质量的研究成果,具有较好的研究基础。近两年来,开始着手研究复杂相关结构的统计性质、极值统计的推断问题,并取得了若干初步研究成果,见参考文献的

21、9-12、32、33等。本课题既是我们过去研究工作的继续与发展,也具有强烈的理论和实际意义。本课题组承担NSFC 2011 国家自然科学基金申请书 2011 版 第 7 页 过多项国家自然科学基金、国家社会科学基金和其他基金项目,积累了较丰富的科学研究经验,课题组由具有高级职称和博士学位的教师、博士后以及博士生主要参与,研究梯队结构比较合理,可以保证课题的顺利开展。参考文献 1 Fan,J.Q.and Yao,Q.W.,Nonlinear time series:nonparametric and parametric methodsM,Springer-Verlag,2003.2 Aneir

22、os,G.and Quintela,A.,Asymptotic properties in partial linear models under dependenceJ,Test,2001,10:333-555.3 Beak,J.and Liang,H.Y.,Asymptotics of estimators in semi-parametric model under NA samplesJ,Journal of Statistical Planning and Inference,2006,136:3362-3382.4 Liang,H.Y.,Mammitzsch,V.and Stein

23、ebach,J.,On a semiparametric regression model whose errors form a linear process with negatively associated innovationsJ,Statistics,2006,40:207-226.5 Liang,H.Y.and Jing,B.Y.,Asymptotic normality in partial linear models based on dependent errors,Journal of Statistical Planning and InferenceJ,2009,13

24、9:1357-1371.6 Chen,X.and Cui,H.J.,Empirical likelihood inference for partial linear models under martingale difference sequenceJ,Statistics and Probability Letters,2008,78:2895-2901.7 Fan,G.L.and Liang,H.Y.,Empirical likelihood inference for semiparametric model with linear process errors,Journal of

25、 the Korean Statistical SocietyJ,2010,39:55-65.8 Qin,Y.S.and Li,Y.H.,Empirical likelihood for linear models under negatively associated errors,Journal of Multivariate AnalysisJ,2011,102:153-163.9 Zhou X.C,Lin J.G.,On complete convergence for arrays of rowwise -mixing random variables and its applica

26、tions,Journal of Inequalities and applicationsJ,2010,ID 769201,12 pages.10 Zhou X.C.,Hu S.H.,Moment consistency of estimators in partially linear models under NA samplesJ,Metrika,2010,72:415-432.11 Zhou X.C.,Lin J.G.,On moments of the maximum of partial sums of moving average processes under depende

27、nce assumptionsJ,Acta Mathematicae Applicatae Sinica,English Series.(In press)12 Zhou,X.C.,Complete moment convergence of moving average processes under-mixing assumptionJ.Statistics&Probability Letters,2010,80,285-292.13 Nelsen,R.B.An Introduction to CopulasM.Second Edition.New York:Springer,2006.1

28、4 Sen,J.F.,Frees,E.W.&Rosenberg,M.A.Heavy-tailed longitudinal data modeling using copulasJ.Insurance:Mathematics and Economics,2008,42,817-830.15 Frees,E.W.&Wang,P.Credibility using copulasJ.North American Actuarial Journal,2005,2,1-25.16 Frees,E.W.&Wang,P.Copulas credibility for aggregate loss mode

29、lsJ.Insurance:Mathematics and Economics,2006,38,360-373.17.Beare,B.K.Copulas and temporal dependenceJ.Econometrica,2010,78(1),395410.18 Cook,R.J.,Lawless,J.F.&Lee,K.A.A.Copula-based mixed Poisson model for bivariate recurrent events under event-dependent censoringJ.Statistics in Medicine,2010,29,694

30、-707.19 Davison A C,Smith R L.Models for exceedances over high thresholdsJ.Journal of Royal Statistic Society Ser.B.1990.52(3):393-442.20 Embrechts P,Kluppclberg C,Mikosch C.Modeling Extremal Events for Insurance and Finance M.Berlin,Springer,1997.21 McNeil A J,Frey R.Estimation of tail-related risk

31、 measures for heteroscedastic financial time series:an NSFC 2011 国家自然科学基金申请书 2011 版 第 8 页 extreme value approach J.Journal of Empirical Finance.2000.7:271-300.22 Coles S G.An introduction to statistical modeling of extreme valuesM.London:Springer,2001.23 Katz R W,Parlange M B,Naveau P.Statistics of

32、extremes in hydrology J.Advances in Water Resources.2002.25:1287-1304.24 Gencay R,Selcuk F,Ulugulyagci A.High volatility,thick tails and extreme value theory in value-at-risk estimation J.Insurance:Mathematics and Economics.2003.33:337-356.25 Beirlant J,Goegebeur Y,Segers J.,et al.Statistics of extr

33、emes-theory and applicationsM.Chichester:Wiley Series in Probability and Statistics,Wiley,2004.26 de Haan L,Ferreira A.Extreme Value Theory:An Introduction M.Springer.New York,2006.27 Castillo E and Hadi A S.Fitting the generalized Pareto distribution to dataJ.Journal of the American Statistical Ass

34、ociation.1997.92:1609-1620.28 Hill B M.A simple general approach to inference about the tail of a distributionJ.Annals of Statistics.2000.3:11631174.29 Choulakian V,Stephens M A.Goodness-of-fit tests for the generalized Pareto distributionJ.Technometrics.2001.43:478-484.30 Castillo E,Hadi A S,Balakr

35、ishnan N,Sarabia J M.Extreme Value and Related Models with Applications in Engineering and ScienceM.Wiley,NewYork,2005.31 Zhang J.Likelihood moment estimation for the generalized Pareto distributionJ.Aust.N.Z.J.Stat.2007.49(1):69-77.32 Lin,J.G.,Huang,C.et al.Estimating generalized state density of n

36、ear-extreme events and its applications in analyzing stock dataJ.Insurance:Mathematics and Economics,2010,47,13-20.33 Huang,C.,Lin,J.G.Statistical inferences for generalized Pareto distribution based on interior penalty function algorithm and Bootstrap methods and applications in analyzing stock dat

37、aJ.Computational Economics,DOI 10.1007/s10614-011-9256-0.(In press)34 Ledford A W,Tawn J A.Modelling dependence within joint tail regionsJ.Journal of the Royal Statistical Society B.1997.59:475-499.35 Beirlant J,Vandewalle B.Some comments on the estimation of a dependence index in bivariate extreme

38、value statisticsJ.Statistics and Probability Letters.2002.60:265-278.36 Draisma G,Drees H,Ferreira A,et al.Bivariate tail estimation:dependence in asymptotic independenceJ.Bernoulli.2004.10:251-280.37 Ramos A,Ledford A.A new class of models for bivariate joint tailsJ.Journal of the Royal Statistical

39、 Society,Series B,2009.71:219-241.38 Coles S,Pauli P.Models and inference for uncertainty in extremal dependenceJ.Biometrika.2002.89:183-196.39 Song P X,Fan K Y,Kalbfleisch J D.Maximization by parts in likelihood inferenceJ.Journal of the American Statistical Association.2005.100:11451158.40 Wang W.

40、Estimating the association parameter for copula models under dependent censoringJ.Journal NSFC 2011 国家自然科学基金申请书 2011 版 第 9 页 of the Royal Statistical Society B.2003.65:257-273.41 Caperaa P,Fougeres A L,Genest C.A nonparametric estimation procedure for bivariate extreme value copulasJ.Biometrika.1997

41、.84:567-577.42 Pitt M,Chan D,Kohn R.Efficient Bayesian inference for Gaussian copula regressionJ.Biometrika.2006.93:537-554.43 Smith M.Modeling selectivity using archimedean copulasJ.Econometrics Journal.2003.6:99-123.44 Song P X.Multivariate dispersion models generated from Gaussian copulaJ.Scandin

42、avian Journal of Statistics.2000.27:305-320.45 Cherubini U,Luciano E,Vecchiato W.Copula Methods in FinanceM.New York:John Wiley.2004.46 Cameron A C,Li T,Trivedi P K,Zimmer D M.Modeling the differences in counted outcomes using bivariate copula models:With application to mismeasured countsJ.Econometr

43、ics Journal.2004.7:566-584.47 Junker M,May A.Measurement of aggregate risk with copulasJ.Econometrics Journal.2005.8:428-454.48 Liu Y,Luger R.Efficient estimation of copula-GARCH modelsJ.Computational Statistics and Data Analysis.2009.53:2284-2297.2.项目的研究内容、研究目标项目的研究内容、研究目标,以及拟解决的关键科学问题。以及拟解决的关键科学问题

44、。(此部分为重点阐述内容)本课题为一项基础性研究,既包含理论研究,也包含应用研究。本课题包括两个研究模块:具有复杂相关结构和 Copula相关结构的回归模型(包括普通回归模型和纵向数据模型等)相关理论和应用问题;基于 Copula 相关结构的多元广义极值模型的相关理论和应用问题.主要研究的内容,目标以及拟解决的关键问题为:(1)具有复杂相关结构的普通回归模型的相关推断的理论及应用问题.在分析经济等方面数据时,模型的误差一般不是独立的,经常具有一定的相关结构,如自相关和一致相关性等。在实际问题中,严格满足自相关和一致相关性的误差结构是不多见的,也不是很弱的结构。本课题拟将研究更复杂的并弱的相关结

45、构,如 NA序列、NA序列线性过程及鞅差序列线性过程和混合序列相关(-mixing,-mixing,-mixing)等,把这些复杂相关结构引入到普通回归模型(如线性回归模型、非线性回归模型、非参数回归模型、半参数回归模型等)进行研究,包括参数估计、大样本理论的建立、相关结构的可识别性及统计检验问题和模型应用分析。首先拟研究 NA序列、NA序列线性过程及鞅差序列线性过程和混合序列相关等复杂相关结构的性质,再应用于普通回归模型进行研究;其次结合一些估计方法(如局部线性、经验似然、B-样条和小波等),研究具有复杂相关结构的半参数回归模型(特别是-mixing,-mixing,-mixing 结构),

46、包括理论研究及应用研究。(2)含有复杂相关结构的纵向数据模型的统计推断,包括参数估计及其渐近性质、异方差和相关性检验等.由于纵向数据的收集与时间有关,因而在数据分析时,需要考虑受试单元内部的序列相关,目前考虑较多的是统计处理方便的自相关误差,特别是一阶自相关误差,还有其他的一些有明确表达式的相关情形,如一致相关、指数相关等。本课题首先将更复杂的相关形式,如 NA 序列、NA 序NSFC 2011 国家自然科学基金申请书 2011 版 第 10 页 列线性过程及鞅差序列线性过程和混合序列相关(-mixing和-mixing)等其他相关类型引入到纵向数据的研究中,从受试单元内和受试单元间的复杂相关

47、结构来研究纵向数据的半参数回归模型,包括理论研究及应用研究。其次研究基于 Copulas 相关结构的回归模型的统计分析,如参数估计、影响分析、统计模拟和统计计算的实现等.该部分研究内容包括:a.Copula 的选择问题,目前一些文献只讨论了简单的阿基米德型Copula的选择问题,对更加常用的椭圆型Copula、极值copula和Archimax copula等类型的选择问题研究很少,我们拟在现有文献的基础上,研究多种类型的Copula的选择方法,并讨论其假设检验问题;b.本课题在应用合理的 Copula刻画受试单元内部的相关性的基础上,对回归模型进行统计推断和统计诊断方法的研究。(3)基于参数

48、、半参数和非参数方法建立具有 Copula结构的多元极值模型及其统计推断方法。首先拟综合参数、半参数、非参数方法改进现有的多元极值模型,继而进一步基于实际数据建立新的合适的多元极值模型。目前关于多元极值模型的文献以介绍参数模型为主,半参数和非参数的模型也有一些,但是同时综合运用参数和非参数的办法来建立模型的文献甚少。同时在实际问题中,基于此种新模型的统计推断方法还没有相关研究。其次我们拟在现有文献的基础上,综合参数、半参数、非参数方法,对于建立的新的多元极值模型,讨论相应的统计推断方法。其中,本课题在推导统计推断的渐近性质时,需要深入研究极值分布的极限理论与统计大样本理论。(4)基于 Copu

49、las 相关结构的多元广义极值模型的统计计算方法研究.关于广义极值参数模型的统计推断方法的研究已有很多,包括全参数极大似然估计、分步极大似然估计和半参数分步估计等。但各种估计方法都存在其局限性:a.由于边缘分布为极值分布的特殊性(分布支撑与参数有关),使得可估的参数空间有限;b.半参数、非参数估计在大样本条件下的估计相对于参数化估计,其有效性大大降低;c.Copula 函数的选择不同,导致参数估计求解过程过于复杂繁琐。本课题拟通过运用最优化算法和 Bootstrap方法,改进多元极值参数模型的统计推断的方法,并基于统计诊断的思想,对估计进行灵敏度分析。其中包括理论研究及应用研究。(5)实际数据

50、分析和算法研究。在上述几项拟解决的关键问题中,均可能要涉及复杂计算问题,如在基于复杂相关结构的回归模型的研究中,目前只在理论上有所涉及,在模拟和计算中还需做进一步探索;在改进多元极值模型的统计推断方法时,最优化算法的设计与计算机编程实现既是重点也是难点;在基于多元极值的情形建立相应回归模型中,要用到核密度估计、样条估计以及局部多项式估计等方法理论,需要仔细查阅相关的文献。对于课题研究中的各种参数、非参数估计,我们都将利用 Bootstrap方法估计出它的偏差、标准差以及臵信区间等。针对这些极值分布参数估计方法的 Bootstrap方法是否可行,还需查阅相关文献,结论有待探讨。3.拟采取的研究方

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 实用范文 > 工作计划

copyright@ 2008-2023 wnwk.com网站版权所有

经营许可证编号:浙ICP备2024059924号-2