1、第 卷第期 年月中 国 海 洋 大 学 学 报 ():,基于渔业捕捞产量的监测渔船数量优化*朱文斌,刘文博,戴乾,卢占晖,王晶*(浙江海洋大学海洋与渔业研究所,浙江 舟山 ;浙江省海洋水产研究所,浙江省海洋渔业资源可持续利用技术研究重点实验室,农业农村部重点渔场渔业资源科学观测实验站,浙江 舟山 ;浙江海洋大学水产学院,浙江 舟山 )摘要:海洋捕捞活动数据是渔业资源评估与管理的基础,监测渔船数量的设置需要兼顾保证数据质量和降低监测成本。本研究基于 年浙江省海洋捕捞抽样调查数据,采用分层随机采样和计算机模拟再抽样方法,以小黄鱼()、带鱼()、海鳗()等种经济种类的单船月捕捞产量以及所有种渔获总产
2、量作为渔业生产监测目标,以相对估计误差()、相对偏差()作为评价指标,分析了渔业生产监测船数量对渔业生产监测目标估计精度的影响。研究表明:各物种的单船月捕捞产量以及总产量估计值的 和 随着监测渔船数量的增加而下降,当渔船数量少于 时 值下降幅度较快,当渔船数量多于 时 值下降幅度减缓并趋于平稳。分析每增加 艘监测渔船时 的减少量,发现当渔船数量为 时,各研究目标产量估计值的 减少量均小于,此时监测渔船总数量减少了 ;当渔船数量为 时,各研究目标产量估计值的 减少量均小于,此时监测渔船渔船点数量减少了 。研究结果表明,在兼顾调查精度与准确度的前提下,可以将监测渔船数从 艘优化至 艘,同时发现对于
3、不同的优化目标,优化结果存在较大差异。本研究的优化过程具有操作性强的特点,可为全国或其他省份开展海洋捕捞抽样调查研究提供参考。关键词:数量优化;海洋捕捞;计算机模拟;相对估计误差;相对估计偏差中图法分类号:文献标志码:文章编号:():引用格式:朱文斌,刘文博,戴乾,等 基于渔业捕捞产量的监测渔船数量优化 中国海洋大学学报(自然科学版),():,():*基金项目:国家重点研究发展计划项目();浙江省重点研究发展计划项目()资助 ();()收稿日期:;修订日期:作者简介:朱文斌(),男,高级工程师,主要从事渔业资源研究。:*通讯作者:渔业捕捞生产监测数据和渔业科学调查数据是渔业资源评估与管理的两类
4、基础数据,其中生产监测数据伴随着渔业生产活动产生,是获得捕捞量、捕捞能力、最大日捕捞量等信息的关键来源,其数据的真实性与准确性至关重要。针对渔业生产活动开展全面调查,如强制使用捕捞日志,可对每艘渔船每次捕捞的产量进行统计,可以得到全面的监测数据,然而这种方式耗费大量人力物力,实际操作可行性低,尤其是在近海渔业生产中,捕捞类型多样,小规模渔船多,即使开展全面调查统计,其数据真实性与可靠性也有待商榷。在成本有限的情况下,抽样调查为获取相对真实有效的生产数据提供了可能。进行捕捞生产的渔船类型多样、功率组成复杂,为了得到更好的调查样本,通常采用分层随机抽样调查方案。分层随机抽样是按照规定的性质将总体划
5、分为多个异质层,层内同质性较高,在每层中进行随机取样。分层随机抽样具有样本代表性好、所需样本数较少、抽样误差小等优点,目前关于渔业生产抽样调查的研究,大都倾向于采用分层随机抽样方法,如王继隆等比较了分层随机抽样与简单随机抽样的误差,表明分层随机抽样误差小、精度高,袁兴伟等通过渔业信息数据进行渔获量统计,提出可利用分层随机抽样方法为中国渔业数据校正提供参考。在渔业生产监测中存在较多因素影响了分层抽随机样的准确性,如渔船作业类型、渔船功率、渔船作业时间等。因此,优化分层抽样方法对于提高渔业生产监测数据质量至关中国海洋大学学报 年重要。当前研究者主要从分层方案的设定 和样本量的分配角度 来提高数据精
6、度。如甘喜萍等比较了面积比例分配、最优分配和奈曼分配种样本分配方案,提出最优分配法可以满足抽样误差要求,同时还能降低调查过程中的经济成本。等 基于不同分层方案评估了缅因湾龙虾丰度指数,表明分层方案设计对调查采样精度有明显的影响,合理的分层方案可有效提高调查精度。为推动中国海洋捕捞统计调查方法的改革,探索渔业生产监测调查采样方法在我国海洋捕捞统计中的可行性,年农业部在浙江省开展了海洋捕捞生产调查采样试点工作。本文根据浙江省海洋捕捞渔船的生产数据,基于分层随机抽样方法,采用计算机模拟再抽样过程,对海洋渔业捕捞生产监测抽样进行优化,以期进一步改进调查采样方法,降低监测成本,兼顾数据质量,以求更为客观
7、、真实地反映海洋捕捞生产情况。数据与方法数据来源数据来源于 年 月浙江省 个重点海洋渔业县市,艘(对)样本船的渔业生产监测数据,涉及刺网、单拖、双拖、桁杆拖虾、围网、张网、钓具、笼壶和其它种作业方式,共获取样本船信息 条。各作业方式从月日起执行 个月的伏季休渔,钓具不休渔(见表)。其中,钓具和笼壶渔船数量少,一并归入其它作业方式(见表)。表 年浙江省渔业监测捕捞渔船各作业类型的休渔期 类型(方式)()休渔期 单拖网 月日月 日双拖网 张网 月日月 日月日月 日桁杆拖虾网 月日月日刺网 围网 笼壶 钓具 不休渔其他 月日月 日注:张网中,帆张网执行月日月 日休渔,其他张网执行月日月 日休渔。:,
8、表 年浙江省渔业监测捕捞信息渔船类型及数量构成 类型(方式)()数量 占比 刺网 单拖网 双拖网 桁杆拖虾网 围网 张网 其他 合计 目标物种选择本研究选取海洋捕捞生产过程中的主要经济种类作为研究目标物种,包括鲳鱼()、带鱼()、海鳗()、蓝点马鲛()、中国毛虾()、棘头梅童鱼()、三疣梭子蟹()、鲐 鲹 类()、小黄鱼()共个目标物种。上述物种除在伏季休渔期外各月份均有捕获,且占所选监测船总产量的 、占经济物种总产量的 。其中,带鱼和小黄鱼属于东海区传统的四大重要经济物种(大黄鱼、曼氏无针乌贼产量较低)。以各目标物种单位渔船每月的捕捞产量以及总产量作为估计目标,未对每一月份调查渔船数量进行优
9、化(月的伏季休渔期除外)。模拟流程本研究假设当前渔业捕捞生产监测渔船信息能够反映目前浙江省海洋捕捞生产情况,研究中将每一月份单位渔船各单一目标物种的总捕捞产量以及所有目标物种的总产量作为模拟抽样的对照“真值”。以渔船作业方式作为划分依据将渔船划分为个层,以各层信息渔船的构成比例作为重抽样过程中样本数量的基本分配准则。采用计算机模拟,进行不同渔船数量下的分层随机抽样。本研究中,渔船数量梯度设置为 ,间隔为。本研究中,基于四舍五入原则对各层渔船数量进行取整,同时为保证各层数据具有统计学意义,各层渔船数量少于时设置为;为避免取整原则对模拟再抽样过程参数估算的影响,以原监测渔船各类型的数量构成比例作为
10、计算估计值的权重依据。本研究基于分层随机采样方法,“真值”与模拟调查估计值的计算公式如下:期朱文斌,等:基于渔业捕捞产量的监测渔船数量优化();()();()。()式中:为各研究目标的估计值,也即各月份中目标物种单位渔船产量以及总产量;为渔船类型数量,本文中为;为第个渔船类型的单位渔船捕捞产量;为第个渔船作业类型的权重,等于第个渔船作业类型的渔船数量与本次模拟研究的总渔船数量的比值;为第次模拟再抽样过程中根据再抽样数据计算的各研究目标的“模拟估计值”。本文 选 择 相 对 估 计 误 差(,)来评估模拟估计值的精度和准确度:()。()选择相对估计偏差(,)来评价模拟估计值与真值的偏离情况:()
11、。()式中:为根据原始数据计算的各研究目标的“真值”;为第次模拟再抽样过程中根据再抽样数据计算的各研究目标的“模拟估计值”;为模拟次数,本文设为 次。根据计算公式可以得出:值越大,精度与准确度越低;的绝对值越大,“模拟估计值”与“真值”的偏离程度越大。图监测渔船样本量优化流程图 结果相对估计误差()变化在各月份的模拟调查研究中,各目标物种产量及总产量估计值的 值变化范围差异较大(见图),各目标物种捕捞产量估计值的 值均随渔船数量增加呈下降趋势,且渔船数量越多时下降趋势越缓(见图)。总渔获产量估计值的 值在每个调查月均是最低,不超过;除月外,小黄鱼产量估计值的 值在每个月均最高,带鱼产量估计值的
12、 值介于中间(见图)。通过方差分析得出随着样本船数量的增加,各目标物种产量及总产量估计值的 值显著减少。以月的带鱼、小黄鱼及总产量为例,其方差分析的结果如表所示。相对估计偏差()变化各研究目标估计值的 值均在上下波动(见图),这表明模拟调查采样得到的各研究目标物种的产量以及总产量的估计值结果均为无偏估计。且随着调查渔船数量的增加,的绝对值越来越小。中国海洋大学学报 年图目标物种捕捞产量及总产量估计值的 值随监测渔船数量的变化 表带鱼、小黄鱼和总产量的相对估计误差在不同样本量下均值表现 ,样本量带鱼小黄鱼总产量样本量带鱼小黄鱼总产量 注:同一列数据上标相同字母表示差异不显著(),不同字母表示差异
13、显著()。(),();期朱文斌,等:基于渔业捕捞产量的监测渔船数量优化图目标物种捕捞产量及总产量估计值的 值随渔船数量的变化 监测渔船数量优化效率为探究随着监测渔船数量的增加调查精度提高的效率,以 艘(对)为间隔,分析 值降低情况。随着渔船数量的增加,值不断下降,其下降幅度不断变小。可以看出,渔船数量增加至 时,每增加 艘(对)渔船,各月份中每一目标的估计值的 值下降量也即估计值精度的提高均不超过;当监测渔船数量大于 时,每增加 艘渔船提高的 差值的精度均不超过(见图,小黄鱼除外)。这表明随着监测渔船数量的增加,调查精度趋于稳定。讨论监测渔船的数量优化本文通过计算机模拟对浙江省渔业监测渔船的数
14、量进行优化,综合单物种产量及总产量的估计值优化结果,可将监测渔船数量从 艘优化至 艘,在兼顾了相对稳定的调查精度与准确度条件下,监测渔船数优化了 ,这可大幅度节约调查成本。抽样调查优化研究在渔业资源科学调查中应用广泛且效果显著,如孟新翔等、潘邵媛等、吴桢等、戴黎 斌等、等 均在保证调查数据精度满足需求的前提下,优化渔业资源调查方案,有效地减少调查成本的投入,实现了调查效益最大化。在渔业生产监测调查优化研究中,马亚宸等 通过计算机模拟技术优化了山东省海洋捕捞生产监测信息船数,优化过程中对全年数据进行了分析,按照全年数据分析可以得到较为宏观的结果,但是由于不同作业方式在不同季节的产量有差异,进行全
15、年数据分析产生的误差会影响优化结果。因此,本文按照个月的数据进行分析,降低了时间变化对优化结果的影响。分层抽样中在考虑各中国海洋大学学报 年(图中红色线为精度线,黑色线为精度线。,)图不同月份目标物种产量以及总产量估计值的 差值随着监测渔船数量的变化 层样本量分配问题时要兼顾抽样成本和抽样精度,目前有三种层样本量分配方法:比例分配法、最优分配法和内曼最优分配法,其中最优分配法和内曼最优分配法虽然在成本和精度上有优势,但在实际操作中较难满足各种因素;比例分配法在多阶段的抽样调查中精度会有所降低,但因其抽样形式较为简单,其仍具有普遍适用性与实用性。优化效率临界值选择在本研究中,综合考虑计算方便及经
16、济成本,选择和的精度线作为每减少 艘(对)监测渔船调查精度下降的临界值。如以作为临界值,监测渔船数量可优化为;以作为临界值则可优化至 。该结论可为其他省份,或全国开展海洋捕捞抽样调查的优化研究提供参考根据不同的精度要求及不同的经费支撑选择不同的临界标准。研究目标对优化结果的影响本研究中不同月份以及不同研究目标间同一模拟调查估计值的 值有不同的表现。如以带鱼及小黄鱼产量为优化目标,综合各月份 值的变化情况,监测渔船为 时即可获取稳定的精度,而以总产量为优化目标时,渔船数量为 时 即可达到稳定趋势。针对原始数据变异程度不同的调查目标,优化结果存在较大的差异,原始数据变异程度较低,使用较少的监测渔船即可获得相对高精度的估计;反之对于分布变异较高的物种,应提高监测渔船数才可获得相对高精度的估计。这表明在抽样调查项目开展之初需要明确所调查的物种,这样才能在不影响调查数据精度的同时有效节约调查成本。期朱文斌,等:基于渔业捕捞产量的监测渔船数量优化原始数据的真实可靠性对优化结果有较大影响。本文数据是根据 分层等距抽样的方法按浙江省所有海洋捕捞渔船的 进行抽取,研究的基础假设是原始监测渔船数据可以代表