1、2023 年 3 月第 46 卷第 1 期成都中医药大学学报March 2023,Vol.46,No.1Journal of Chengdu University of TCM其它基于当前气候背景下我国桑的适宜性区划研究张瑾,王珑静,罗婕,李杨松,张桂荣,杨转珍,朱宝洁,龙飞,彭腾(成都中医药大学 药学院,四川成都611137)【摘要】目的:通过探讨影响桑分布的主要气候因子及对桑进行适生区预测,为桑的引种栽培及桑资源的合理开发应用提供参考。方法:收集全国范围内桑的样本地理分布信息,运用最大熵模型(Max-Ent 模型)分析出影响桑分布的主导气候因子,并结合 ArcGIS 软件对桑进行适生区分析
2、。结果:建立的模型精度高,预测效果可靠(AUC=0.977)。预测结果显示,影响桑分布的主导气候因子为 12 月太阳辐射量、最暖季降水量、2 月最高温;桑在全国范围内几乎都有分布,桑的适生区(中适宜生境、高适宜生境)主要集中在四川东南部、甘肃南部、云南东北部、宁夏南部、海南北部、新疆西部、西藏东南部、内蒙古东南部、吉林西南部、陕西、重庆、贵州、广西、广东、湖南、湖北、河南、辽宁、山西、河北、河南、北京、天津、山东、江苏、上海、安徽、浙江、福建、台湾等地。结论:本研究预测的桑分布区域与实际情况大致吻合,可为桑的引种栽培、全面调查桑资源的分布及桑资源的合理利用提供参考。【关键词】桑;最大熵模型;主
3、导气候因子;适生区;预测【中图分类号】282.71;S567【文献标识码】A【文章编号】1004-0668(2023)01-0075-06【DOI 编码】10.13593/ki.51-1501/r.2023.01.075【引文格式】张瑾,王珑静,罗婕,等.基于当前气候背景下我国桑的适宜性区划研究 J.成都中医药大学学报,2023,46(1):75-80.【开放科学(资源服务)标识码(OSID)】【基金项目】四川省科技计划项目(2022YFS0444);成都市科技项目(2021 YF05 02298 SN)【第一作者】张瑾,女,2000 年生;硕士研究生在读;E mail:1275879040
4、【通信作者】龙飞,男,1977 年生;博士,副教授;E mail:longfei 。彭腾,男,1973 年生;博士,教授;E mail:56649923 桑是一种重要的经济作物,是国内外发展蚕桑业的基石,在食品等行业中也被广泛使用,同时,桑也是中医临床常用中药。我国桑源中药使用历史悠久,早在 神农本草经1 就有对桑叶、桑白皮的相关记载,桑枝、桑椹也分别始载于近效方2 与 新修本草3。桑叶、桑枝、桑葚、桑白皮中富含黄酮类、生物碱类、花色素类、多糖类等化学成分,这些活性物质具有降血糖、抗炎、降血脂、抗肿瘤、肝脏保护、抗微生物、以及免疫调节等多种药理活性4。桑在我国的分布面积广,主要分布在四川、湖北
5、、安徽、湖南、浙江等地区5。不同产地的桑源中药的有效成分含量差别较大6 8,有关研究表明,药用植物的分布及其活性成分的形成会受到环境的影响9,气候因素会直接影响中药材的品质10。同时,气候环境的一致性是引种栽培成功的关键因素11,对桑进行生境适宜性分析,能为科学引种栽培提供重要参考价值。因此,运用物种分布模型来评估影响桑分布的主要气候因子及对桑进行适生区预测是十分有必要的。目前,3S(S、GPS、GIS)技术发展迅速,已经在中药资源研究领域得到了较好的应用12。GIS(地理信息系统)是能对空间位置数据进行收集、储存、处理、分析的空间信息系统,其在中药资源调查方面显现出了极大的优势,GIS 技术
6、为中药材适生区区划提供了更加直观与可靠的途径10。通过建模预测合适的种植区域已成为保护和利用药用植物资源的有用工具13。物种分布模型(Species Distribution Model,SDM)也称生态位模型(Ecological Niche Models,ENM)14,其在生境适宜区规划与分析领域得到了很好的应用,常用的物种分布模型有:生态位因子分析(EN-57成都中医药大学学报2023 年第 46 卷FA)15、规则集遗传算法(GAP)16、生物气候模型(BIOCLIM)17、和最大熵模型(MaxEnt)18 等。最大熵理论由 Jaynes 于 1957 年提出,MaxEnt模型是基于最
7、大熵理论提出的生态位模型,此模型将已知的物种分布点数据与其对应的环境因子数据相结合,将已知物种分布点的环境因子数据与研究区域的其他地区的环境因子数据进行相似度比较,从而预测研究区域内物种分布的适生度及范围19。MaxEnt 模型运行时间短,样本数需求少,模拟精度高,是目前常用的预测物种分布的模型20。本研究应用 MaxEnt 模型分析影响桑分布的主要气候因子并结合 ArcGIS 软件对桑的适生区进行预测,为桑的引种栽培、全面调查桑资源的分布及桑资源的合理利用提供一定的理论参考。1资料与方法1.1桑的分布点数据桑的分布点数据来源于全球生物多样性信息平台(GIBF,https:/www gbif
8、org/)、中国数字植物标本馆(CVH,http:/www cvh org cn)及实地考察。对于没有经纬度的样本信息,使用谷歌地图对其进行查询。去除重复的分布点数据,并通过 ArcGIS 软件设置 6 km 的缓冲区,使以6 km为半径的范围内只保留一个分布点,来避免过度拟合现象。最终收集到全国范围内桑经纬度分布点数据 290 个(图 1),将获得的桑分布点数据导入 EXCEL,列为 Species,longitude,latitude三列,保存为 CSV 格式。注:该图基于国家测绘地理信息局标准地图服务网站下载的审图号为 GS(2019)1823 号的标准地图制作,底图无修改图 1我国桑的
9、分布位点1.2气候因子的获取及筛选气候数据来源于 WorldClim 网站(http:/wwwworldclim org/),数据包括43 个气候变量(bio_1 bio_19、tmax_01 tmax12、srad_01 srad_12),所下载的数据空间分辨率为2.5 min(5 km 分辨率),格式为tiff 格式。将气候数据导入 ArcGIS 软件,用转换工具将 tiff 格式转换为 ASCII 格式。气候因子之间存在相关性,为了避免气候因子共线性而导致预测结果过度拟合,首先用 SPSS 26.0对其进行 Spearman 相关性分析,在相关系数大于0.9 的变量中保留其生态意义较为重
10、要的因子,再用 MaxEnt 模型进行分析,除去贡献率为 0 的因子,最终筛选得到9 个气候因子用于后续分析(表1)。表 1筛选后的气候因子变量具体描述bio_4温度季节性变化的标准差bio_11最冷季平均温bio_18最暖季降水量mmbio_19最冷季降水量mmtmax_022 月最高温 tmax_055 月最高温 srad_044 月太阳辐射 kJ/(m2d)srad_077 月太阳辐射 kJ/(m2d)srad_1212 月太阳辐射 kJ/(m2d)1.3模型的构建与评价在安装了 JAVA 的前提下,将桑的分布点数据和筛选出的气候因子数据导入 MaxEnt 软件中,设置分布点数据的 25
11、%为测试集,分布点数据的75%为训练集,在参数设置中选择刀切法(Jack-knife)来评价各气候因子的权重,重复运行10 次,建立桑分布与气候因子的直接联系。使用受试者工作特征(OC)曲线下面积(AUC)评价模型的精度:0.5AUC 0.6 为差,0.6AUC 0.7为较差,0.7AUC 0.8 为一般,0.8AUC 0.9为好,0.9AUC 1.0 为非常好20。利用运算结果中气候因子的贡献率及刀切法检验结果来判断主导气候因子。1.4生态适宜区分区在 ArcGIS 软件中导入 MaxEnt 的运算结果,得到桑在全国范围内的分布概率,采用重分类工具中的自然段点分级法进行适宜性分区,分为不适宜
12、生境、低适宜生境、中适宜性生境、高适宜性生境四个区域。2结果与分析2.1预测模型精度评价通过 MaxEnt 模型运算得到桑分布概率预测模型的 OC 曲线(图 2),经过十次运算的 AUC 均值为 0.977,表明该预测模型精度非常好,可以用于桑的气候适宜度分析。2.2主导气候因子通过参与建模的 9 个气候变量对模型的贡献率67第 1 期张瑾 等基于当前气候背景下我国桑的适宜性区划研究和刀切法(Jackknife)的检验结果来综合确立主导气候因子。图 2MaxEnt 模型预测桑的 OC 曲线从模型运行结束后输出的结果(表 2)可以看到气候变量对建模贡献率由高到低依次为:bio_ 18srad_
13、12 bio_ 4 tmax_ 02 srad_ 07 tmax_ 05srad_ 04 bio _ 19 bio _ 11。其 中 bio _ 18、srad_12、bio_4、tmax_02 这四个气候因子的贡献率总和占比达87.7%。表 2气候因子对模型构建的贡献率变量贡献率bio_1841 7srad_12204bio_412 9tmax_0212 7srad_0761tmax_052 3srad_0419bio_191 9bio_110 2运用刀切法来分析影响桑分布的气候因子时,可以评估气候变量对最大熵模型预测结果的重要程度。其原理是对气候变量依次进行省略,再用剩余的 8 个变量构建
14、模型,对省略的气候变量与遗漏误差之间的相关性进行分析,如果遗漏误差因为一个气候变量明显提高,则表明该气候变量显著影响模型的预测结果。刀切法的检验结果见图 3,从训练数据、测试数据、AUC 值三个刀切图中可以看出,仅使用单独变量时,重要性从大到小的前四位气候因子为:srad_ 12、tmax_ 02、tmax_05、bio_18,结果表明这四个气候变量与其他变量相比,在单独使用时,对 MaxEnt 模型的预测结果有更为重要的影响。根据模型运算得到的气候因子贡献率结果和刀切法检验结果选择 bio_18、srad_12、tmax_02 作为影响桑分布格局的主导气候因子。研究表明,当潜在分布概率大于
15、0.5 时,其对应的气候因子值比较适合桑的生长21。基于各气候响 应 曲 线(图 4)可 知,12 月 太 阳 辐 射 在6 755 10 168 kJ/(m2d),2 月最高温在 5 15,最暖季降水量在 374 1 506 mm 时,桑分布概率大于 0.5,较适宜桑的生长。2.3桑的适生区分析根据重分类工具中的自然间断点分级法将适宜区进行划分,按照适生指数 P 值从低到高划分为四个等级:不适宜生境(P 0.137 73)、低适宜生境(0.137 73 P 0.329 56)、中适宜生境(0.329 56 P 0.517 789)、高 适 宜 生 境(0.517 789 P 0.766 11
16、7 4),得到桑的适宜性区划图(图 5)。其中,黄色区域代表不适宜生境,绿色区域代表低适宜生境,蓝色区域代表中适宜生境,深蓝色区域代表高适宜生境。桑的适生区面积(中适宜生境和高适宜生境)为 3 606 242.54 km2,适生区主要分布在四川东南部、甘肃南部、云南注:图中红色的曲线表示经过 10 次运算的平均值,蓝色部分则表示 10 次重复运算产生的波动范围图 3各气候因子对桑生境分布的权重图 4主导气候因子响应曲线77成都中医药大学学报2023 年第 46 卷注:该图基于国家测绘地理信息局标准地图服务网站下载的审图号为 GS(2019)1823 号的标准地图制作,底图无修改图 5桑的适宜性区划东北部、宁夏南部、海南北部、新疆西部、西藏东南部、内蒙古东南部、吉林西南部、陕西、重庆、贵州、广西、广东、湖南、湖北、河南、辽宁、山西、河北、河南、北京、天津、山东、江苏、上海、安徽、浙江、福建、台湾等地。中国植物志22 中记载:“桑原产于我国中部和北部,现由东北至西南各省区,西北直至新疆均有栽培。”有文献记载桑主产于四川、湖北、安徽、湖南、浙江等地区5。综上,预测结果与 中国植物志和有关文献