1、收稿日期 2021-02-01摇 修回日期 2021-12-31基金项目 苏州市科技计划项目(SS202081);苏州市卫生科技项目(GWZX202004);苏 州 市 医 学 重 点 学 科 项 目(SZXK202118)作者单位 江苏省苏州市中心血站,215000作者简介 谢淑红(1990-),女,助理研究员.通信作者 汤龙海,主任技师.E鄄mail:478562321 文章编号 1000鄄2200(2023)05鄄0633鄄04检验医学基于 ARIMA 模型的临床红细胞类血液需求预测研究谢淑红,张思静,严伟斌,王明元,汤龙海摘要目的:建立适用于苏州市区临床红细胞类血液需求预测的自回归移动
2、平均模型(autoregressive integrated moving averagemodel,ARIMA),从需求出发指导采供血机构对地区血液资源进行合理采集、科学调配。方法:收集区域临床用血历史数据,采用时间序列分析方法,选取苏州市区 2009-2019 年每月红细胞类成分血的临床使用数据,运用 SPSS 26 软件进行数据分析和ARIMA 模型构建,通过模型识别、参数估计及最优模型检验,确定临床红细胞类血液预测的最优模型。运用所得最优模型对2020 年 1-11 月红细胞类成分血临床用量进行预测,将预测值与实际数值对比,验证模型预测效果。结果:最优模型为ARIMA(0,1,1)(0
3、,1,1)12,残差的 ACF 自相关函数值和 PACF 偏自相关函数值均在 95%CI 内,同时杨-博克斯 Q 统计量值为17.992,P 0.05,残差序列不存在自相关,通过白噪声检验。对2020 年1-11 月苏州市区红细胞类成分血临床用量进行预测,预测值与实际值曲线趋势基本相同,且预测值均在 95%CI 内,平均相对误差较小,为 8.21%,模型预测效果较好。结论:苏州地区临床红细胞类血液需求预测研究的最优模型为 ARIMA(0,1,1)(0,1,1)12。关键词 输血;自回归移动平均模型;红细胞类血液;血液需求中图法分类号 R 197;R 457.12 摇 摇 摇 文献标志码 A摇
4、摇 摇 DOI:10.13898/ki.issn.1000鄄2200.2023.05.019Study on prediction of clinical erythrocyte blood demand based on ARIMA modelXIE Shu鄄hong,ZHANG Si鄄jing,YAN Wei鄄bin,WANG Ming鄄yuan,TANG Long鄄hai(Suzhou Blood Center,Suzhou Jiangsu 215000,China)Abstract Objective:To establish an autoregressive integrated
5、moving average(ARIMA)model for predicting the demand of clinicalerythrocyte blood in the urban area of Suzhou,and to guide the blood collection and supply institutions to reasonably collect andscientifically allocate blood resources in the region based on the demand.Methods:The historical data of re
6、gional clinical blood werecombed,and time series analysis method was adopted to select the monthly data of clinical use of erythrocyte blood in Suzhou urban areafrom 2009 to 2019 for modeling.SPSS 26 software was used for data analysis,and the ARIMA model was constructed.The optimal modelof clinical
7、 erythrocyte blood prediction was determined by model recognition,parameter estimation and optimal model test.The optimalmodel was used to predict the clinical consumption of erythrocyte blood from January to November 2020,and the predicted value wascompared with the actual value to verify the predi
8、ction effect of the model.Results:The optimal model was ARIMA(0,1,1)(0,1,1)12,and the values of ACF autocorrelation function and PACF partial autocorrelation function of residual were both within 95%CI.Meanwhile,the Yang Box Q statistic value was 17.992(P 0.05),indicating that there was no autocorre
9、lation of residual sequence,which passed the white noise test.The clinical consumption of erythrocyte blood in Suzhou urban area from January to November 2020was predicted,and the curve trend of the predicted value was basically the same as the actual value,and the predicted value was within95%CI,an
10、d the average relative error was small(8.21%),indicating that the prediction effect of the model was good.Conclusions:ARIMA(0,1,1)(0,1,1)12 is the optimal model for the prediction of clinical erythrocyte blood demand in Suzhou area.Key words transfuse blood;autoregressive integrated moving average m
11、odel;erythrocyte blood;blood demand摇 摇 输血是临床常见的辅助治疗手段,创伤、产后出血、手术、血液病治疗等都需要通过输血帮助病人恢复健康。血液资源目前仅可通过健康人体无偿捐献唯一途径获得,具有不可替代性。据国家卫健委统计1显示,2019 年全国献血率为 11.2译,虽已超过世界卫生组织推荐的标准 10译,但无偿献血相对于总人口基数来说,依然只是少部分人群的爱心行为,因此血液资源仍具有稀缺性。临床血液需求受手术开展情况、床位数、区域人口数量、突发事件等多种外在因素影响,且血液具有储存期短、存在分型等特征,所以采血量往往无法完全匹配临床血液的需求变化,血液整体或
12、某一类/型供给不足或供给过剩的现象时有发生。苏州地区临床常用的、采供血机构提供的血液主要包括红细胞类、血小板类、血浆类三大类,其中336蚌埠医学院学报 2023 年 5 月第 48 卷第 5 期红细胞类成分血临床用量占比最大,年供给量超 12万单位。随着“十四五冶期间本地区医疗卫生事业的发展,临床血液需求量还将继续上升。血液供需平衡的“理想状态冶是采供血机构和用血医疗机构的共同追求,仅凭主观经验估算临床用血需求已无法满足复杂多变的实际需求,因此,需要对区域临床血液需求进行科学测算,在此基础上有针对性地制定无偿献血招募计划和血液库存管理方法。本研究采用时间序列分析方法中的自回归移动平均模型(au
13、toregressiveintegratedmovingaveragemodel,ARIMA)建立苏州市区临床红细胞类血液需求预测模型,通过分析临床红细胞类成分血用量的历史数据规律对未来的临床需求值进行预测。现作报道。1摇 材料与方法1.1摇 数据来源摇 选取苏州市区 2009-2019 年红细胞类成分血的临床用量数据,红细胞类成分血根据制备方式及成分含量不同分为悬浮红细胞、洗涤红细胞、浓缩红细胞、去白红细胞、冰冻红细胞等种类。临床红细胞用量以单位 U 计算,1 U 红细胞类成分血由 200 mL 全血分离制备而成。1.2摇ARIMA 模型构建摇ARIMA 模型根据参数选择的不同,可分为 AR
14、IMA(p,d,q)(P,D,Q)s、ARIMA(p,d,q)、ARMA(p,q)、AR(p)和 MA(q)。ARIMA(p,d,q)模型是时间序列分析中最常用的方法,若时间序列包含了季节性特征,则需建立季节性ARIMA 模型,即 ARIMA(p,d,q)(P,D,Q)s,其中p、q 为自回归和移动平均阶数,P、Q 为季节性自回归和移动平均阶数,d、D 为非季节性和季节性差分次数,s 为季节周期2。建立 ARIMA 模型的基本步骤主要包括:(1)数据平稳化处理,通过绘制时序图初步判断序列是否平稳,若判断为不平稳序列,则针对序列不平稳的趋势性或周期性进行差分或季节性差分处理,实现序列平稳化;(2
15、)模型识别,对平稳序列进行自相关分析,根据所得的自相关函数(ACF)图和偏自相关函数(PACF)图的拖尾、截尾情况判断 p、d、q 值,建立可用的备选模型,根据贝叶斯准则(Bayesian information criterion,BIC)在备选模型中选择最优模型;(3)最优模型检验,根据残差ACF 图与 PACF 图以及杨-博克斯 Q(Ljung=BoxQ)统计量,判断残差序列是否为白噪声序列,若是,则所得模型可用于预测,若不是,则需重新对序列进行识别、选择和检验,以获得最优拟合模型;(4)预测并验证,运用选定的最优 ARIMA 模型预测需求值,计算 95%CI 以及相对误差,并与同期的实
16、际值比较,以验证模型的拟合效果4。2摇 结果2.1摇 数据平稳化处理摇 绘制 2009-2019 年红细胞类成分血的临床用量时间序列图(见图 1),可见红细胞类成分血临床用量存在一定波动幅度,呈整体上升趋势;同时,细胞类成分血临床用量存在较明显的季节周期性,以 12 个月为 1 个周期,每年 3、4、11、12 月的红细胞临床用量相对较高,1、2、6、7 月红细胞临床用量则相对较低,表明红细胞成分血临床用量具有长期趋势性和周期性。针对该时间序列的不平稳特征,对数据采取一次差分及一次季节性差分进行平稳性处理,数据处理后的时间序列图见图2,差分后所得的观测值均围绕 0 值上下随机波动,可认为处理后的序列为平稳序列。2.2摇 ARIMA 模型识别摇鉴于 2009 年 1-12 月红细胞临床用量时间序列存在明显的趋势性和季节性,故选用季节性 ARIMA(p,d,q)(P,D,Q)s 模型。根据实际情况,红细胞临床用量序列的季节周期为12 个月,故取 s=12;因在平稳性处理过程中,对原始序列进行了一阶差分和一阶季节差分,故取 d=1,D=1。绘制红细胞临床用量数据的一阶差分和一阶季节差分后 A