收藏 分享(赏)

2023年外文老报纸篇名数字化项目外包后的数据质量监控.docx

上传人:g****t 文档编号:1751279 上传时间:2023-04-22 格式:DOCX 页数:6 大小:23.53KB
下载 相关 举报
2023年外文老报纸篇名数字化项目外包后的数据质量监控.docx_第1页
第1页 / 共6页
2023年外文老报纸篇名数字化项目外包后的数据质量监控.docx_第2页
第2页 / 共6页
2023年外文老报纸篇名数字化项目外包后的数据质量监控.docx_第3页
第3页 / 共6页
2023年外文老报纸篇名数字化项目外包后的数据质量监控.docx_第4页
第4页 / 共6页
2023年外文老报纸篇名数字化项目外包后的数据质量监控.docx_第5页
第5页 / 共6页
2023年外文老报纸篇名数字化项目外包后的数据质量监控.docx_第6页
第6页 / 共6页
亲,该文档总共6页,全部预览完了,如果喜欢就下载吧!
资源描述

1、外文老报纸篇名数字化工程外包后的数据质量监控刘洪梅梅颢郭薇:基于PDCA循环这一质量控制程序,文章结合外文老報纸篇名数字化工程外包后数据验收的实践,就外包后数据验收的标准流程和质量监控进行了探讨,以期对图书馆外文报纸数据库外包质量控制和管理提供参考和帮助。关键词:数字化工程外包;PDCA循环;标准验收流程;质量控制;外文老报纸篇名 文献标识码:A中图分类号:TP319 文章编号:1009-2374(2022)11-0119-03 DOI:10.13535/j ki.11-4406/n.2022.11.0611 概述受人力、物力和财力等因素的影响,为提高制作效率,不少图书馆在建设特色馆藏数据库时

2、,会采取外包的形式给专业的数字化生产制作商加工,再由图书馆进行数据接收和验收。由于外包方制作工艺的不完善和加工人员素养的参差不齐,导致在数字化工程制作过程中存在诸如漏著录、元数据与图像勾链错误、篇名类型判断错误、著录规那么错误率高、文字错误频出等问题。为了对外包后的数字化工程进行有效的质量管理和控制,就必须实施全面质量管理,按照PDCA循环这一根本管理程序进行质量控制。本文将PDCA循环的四个步骤应用于外文老报纸篇名数字化工程外包后数据验收的实践,就外包后数据验收的流程和质量监控问题进行探讨,以期对图书馆外文报纸数据库外包质量控制和管理提供参考和帮助。2 PDCA循环PDCA循环又叫戴明循环,

3、它最早的雏形是美国统计质量控制之父休哈特提出的“方案-执行-检查(Plan-Do-See),后由著名质量管理专家戴明博士进一步完善,开展成为“方案-执行-检查-处理(Plan-Do-Check/Study-Act),成为PDCA循环,它作为一套科学系统的思维方法和管理程序,被看作是全面质量管理的最根本的工作程序。PDCA的含义如下:P(Plan):筹划、方案;D(Do):执行、实施;C(Check/Study):检查、评价、诊断;A(Action):处理、总结、提高。详见图1。就应用而言,PDCA分别对应以下四个阶段:方案阶段:摸清用户对产品质量要求,确定质量目标和质量方案。执行阶段:实施方案

4、阶段所规定的内容,根据质量标准进行产品设计、试制、实施,包括进行人员培训。检查阶段:根据目标和产品要求,检查执行情况,对过程和产品进行监视和测量。处理阶段:对总结检查结果进行处理,采取措施稳固成绩,进行标准化,遗留问题和新问题那么转入下一个PDCA循环去改善和提高。PDCA循环是周而复始,螺旋上升,持续改进的动态过程,一个循环结束,解决一些问题,未解决的问题进入下一个循环。处理阶段是PDCA循环的关键。因为处理阶段就是标准化和问题总结,处理存在遗留问题。该阶段的重点又在于标准的修订和完善,包括技术标准和管理制度。标准化和制度化是推动PDCA循环转动向前的根本动力。3 基于PDCA循环的外文老报

5、纸篇名数字化工程验收流程3.1 方案阶段:制定验收方案,确定验收质量标准在工程启动初期,验收组需根据外包方提交的数据交付进度表和生产方案,制定相应的验收方案,确保工程能如期完工。同时验收组还需与元数据制作部门协同,制定数据制作标准及验收软件标准,主要包括以下三个方面:3.1.1 元数据著录质量标准。主要涉及图像处理过失率、元数据著录规那么过失率、著录文字过失率、元数据与图像的勾链无过失、标题中文翻译数据过失率及版面内容元数据无漏著等。3.1.2 数据标准格式。主要涉及单版PDF文件、单版JPG格式图像、著录广告JPG格式图像、元数据著录信息文件、版面分析信息文件等。交付时包含PIC、TIF、X

6、ML、OCR四个目录,交付数据结构样例如图2所示:3.1.3 验收软件标准。要求外包方开发的验收软件能按照批次进行图像和数据的验收,可在局域网内部署,多人在线分工进行验收。3.2 执行阶段:培训验收人员,按批次进行数据验收3.2.1 对验收人员进行培训。培训内容主要包括:熟知并掌握中外文老报纸篇名元数据(元数据:指报纸图像中有相对明显物理边界内的内容完整的正文、广告或图片)著录规那么、中外文老报纸篇名元数据著录细那么以及著录技术标准;学会熟练运用中英文老报纸验收软件进行验收;学会熟练运用上海图书馆文献数字化及知识制作元平台进行验收。3.2.2 按照批次进行工程验收。在进行数据验收时分批次进行,

7、首先数字化工程验收平台进行合法性过失校验。合法性校验的主要内容包括:(1)XML合法性:XML结构正确性、XML能否解析,XML是否存在勾连错误等;(2)XML版面信息著录与资源表、划到表核对;(3)非空字段核对;(4)XML中著录内容是否符合著录规那么;(5)元数据与图像对应关系核对。具体操作如图3所示:合法性校验之后会生成合法性过失列表反响给外包方进行修改。在通过合法性校验之后,该批次数据可以进入人工校验阶段。总校采取“等差抽样+随机抽检的方式进行抽样。校验人员在领取抽样分工单之后利用验收软件逐篇进行数据验收,验收界面展示如图4所示:在发现著录错误时,一校验收人员可在验收平台进行相应的错误

8、登记,错误登记界面如图5所示。进行错误登记会自动生成Excel格式的过失表,所有的过失表由总校进行汇总与整理,确保验收的一致性和统一,最终由工程主管将按批次整理的验收过失反响表发送给外包方进行数据修改。3.3 检查阶段:返工数据核验,实行技术合法性校验3.3.1 进行返工数据核验,确保过失已改。对于每批返工数据,验收组首先进行合法性校验,对于不通过合法性校验的数据直接退回外包方进行二次改错;对于通过合法性校验的数据采取“已抽样局部必检+未抽样局部随机抽检的方法进行验收,确保外包方百分之百完成已反响过失的修改,对于修改不合格的批次进行二次返工;对于修改合格的批次那么进入最终的成品标准合法性校验。

9、 3.3.2 对通过验收的数据进行成品标准技术合法性校验,切实检验验收成果。对于通过合法性校验和人工数据验收的数据,那么按批次交付验收组技术人员进行最终的成品标准技术合法性校验。校验内容主要包括勾连检查、非空校验、空版面检验、数量校验、数据库表验证、划到表比对、坐标检查等。对于未通过技术合法性校验的批次,那么返回外包方继续修改至合格为止。对于通过技术合法性校验的批次,那么填写成品数据交接单,随后进行拷贝存储,至此验收工作完成。3.4 处理阶段:建立标准验收流程,反响未解决问题3.4.1 建立标准验收流程。基于三年的外文老报纸篇名数字化工程验收实践,笔者将验收组形成的标准验收流程总结如图6所示:

10、3.4.2 总结反响未解决问题。第一,著录内容方面的问题。在数据验收过程中,经常会遇到全新的加工资源和各种各样的著录问题,此时验收组的成员不仅会和外包方及时沟通协调,遇到悬而未决的专业问题时,还会及时请教报纸元数据制作的专业人员,并形成了相关的著录细那么,达成新的著录规那么补充协议等,保障了各种外文报纸加工工程的顺利进行。第二,著录标准方面的问题。按照标准验收流程,数据验收的第一步和最后一步都要进行技术相关的合法性校验,验收组在实践中发现有以下三种错误是在数字化工程验收平台无法查明的:(1)数据提交数量核对;(2)篇坐标格式错误(坐标过长);(3)广告抠图命名错误。经反响给技术人员后,前两个问

11、题已经在数字化工程驗收平台得以查明和解决,最后一个问题目前还是只有最终合法性校验才能查验,这一技术问题有待在今后的工程中加以解决。第三,成品数据上线后的用户体验与反响。检验产品的效劳质量好坏最直接、最有效的标准就是用户体验与满意度。外文老报纸篇名数字化工程的成品是外文老报纸全文数据库,售后效劳部门应及时收集客户的使用反响和评价,以便在今后的工程制作和验收过程中实现进一步的改进和提高。4 结语PDCA循环为馆藏外文报纸篇名数字化工程验收和质量控制提供了理论支撑和方法步骤,根据PDCA循环结合验收实践形成的标准验收流程是对外包数字化工程进行质量控制的关键所在,同时我们也应当充分意识到人的主观能动性

12、对于实施效果的重大影响。一方面,图书馆工程负责人应加强与外包方制作人员的实时联系与沟通,确保制作过程中出现的任何问题都能在第一时间通过妥善的处理和协调得以解决,甚至可以通过不定期实地考察和现场监控,确保外包的生产制作过程和标准符合要求;另一方面,要加强验收组的团队管理,通过定期开展验收技能培训和专业知识讲座等形式,不断提高验收人员的专业技能和素养,同时也应注意培养验收人员的主人翁意识和责任意识,在单调繁琐的验收工作中增强员工为图情事业效劳的使命感和荣誉感,更好地揭示和保存珍贵的馆藏特色资源,为读者用户提供更优质的数字资源效劳。参考文献1 陈新洁.图书馆编目外包质量控制与绩效评价研究J.图书馆论

13、坛,2022,(4).2 韩春磊.图书馆馆藏特色文献资源的数字化深加工模式探析J.科技资讯,2022,(25).3 陆耘.外包数据质量控制初探以中国科学引文数据库为例J.河南图书馆学刊,2022,33(4).4 吴佩娟.期刊论文数据库外包过程中的质量控制J.图书馆杂志,2022,(6).5 邢秋霞.浅谈高校图书馆特色数据库的建设J.科技情报开发与经济,2022,(4).作者简介:刘洪梅(1990-),女,山东潍坊人,供职于上海图书馆上海科学技术情报研究所,研究方向:文献资源数字化工程审验与管理;梅颢(1989-),女,上海人,供职于上海图书馆上海科学技术情报研究所,研究方向:文献资源数字化加工与工程管理;郭薇(1971-),女,江苏太仓人,供职于上海图书馆上海科学技术情报研究所,研究方向:图书馆文献资源的数字化制作、数据标准化、数据加工内容分析与挖掘与工程管理。(责任编辑:蒋建华)

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 资格与职业考试 > 其它

copyright@ 2008-2023 wnwk.com网站版权所有

经营许可证编号:浙ICP备2024059924号-2