1、2022 年 第 6 期HEI LONG JIANGA R C H I V E S49兰台论坛Lantai BBS基于大数据环境下数字档案的分类管理与加密防护刘军(中山市人民医院,广东 中山 528400)摘要:大数据时代,数字档案逐步取代传统纸质档案,成为信息管理的主要方式,大数据的新思维、新方式、新资源、新基础设施、新能力和新权力为数字档案带来的新的发展机遇。本文重点分析了大数据时代数字档案管理的不足以及改进举措,发现大数据环境下数字档案管理在分类和加密方面的不足,提出:针对数字档案的分类管理问题,以元数据和标签的分类管理模式,提高分类管理效率;针对数字档案的加密防护方面,以私钥加密的防护
2、方式加强信息防护管理,提升隐私保护的安全等级。关键词:大数据;数字档案;分类管理;加密防护大数据时代,档案管理开始朝着数字化的方向不断发展,数字化管理所展现出来的优势成功让人们摒弃了原先的档案管理模式,是目前档案管理的主要内容。但是,在档案管理数字化特征越发明显的背景下,这一模式产生的问题也越发明显,需要制定具体的解决对策,帮助数字档案管理顺利推行,让管理效率能够不断提升。一、大数据的基本内涵与主要视角(一)基本内涵大数据主要是针对数据规模而言,但是只凭借数据量并没有办法辨别大数据和传统数据。另外,大数据不只是说数据的量,现如今业界学者并没有对大数据作出统一解释,国际标准化组织对大数据的理解有
3、两种。第一,站在信息技术的角度进行分析,把大数据理解成具备 5V 特征的数据集,即量大、高速、多样、多变、低价值密度,它可以在量的基础上实现高速管理,处理 1PB 的数据不到 1 秒钟;多样管理,通过音频、图片、视频等进行管理;多变管理,与现实世界发生的真实事件与时间数据息息相关,可以实现对网路数据解释和预测;低价值获取,能够用更低的成本获取数据。第二,站在信息资源管理的角度进行分析,将大数据视为具有4V 特征的数据集、数据汇集和关联数据,分别是规模性、多样性、快速性、价值性。这两种定义都反映出大数据资源无论是体量、价值还是管理、计算内容都非常复杂。此外,也有学者指出大数据主要是说大小在传统数
4、据库抓取、储存、管理和分析范围之外的数据群。还有一些学者认为大数据需要采取新型处理模式才能提升决策、观察、流程优化水平,进而才能让信息资产变得更加多样。结合以上观点总结出大数据其实是因为数据量和类型不断增加而产生的一种数据集,并且以一种更加快速的方式对数据及数据进行分析处理之后挑选有价值的数据的技术过程。可以从以下几个角度研究大数据的定义:第一,大数据的特点,因为数据量非常多并且发展速度非常快,数据种类非常多样,结构也相对复杂,在处理数据时对速度有比较严格的要求,价值密度并不高。第二,大数据的性质,大数据属于信息资产,为经济社会的发展作出了非常大的贡献。(二)大数据视角维度结合以上有关大数据的
5、内容了解到大数据具有多元属性的特征,从复杂性和不确定性特征中可以衍生出利达视角维度,即新思维、新方式、新资源、新基础设施、新能力和新权力。新思维枧角即大数据可以创造新价值、创造新价值过程、改变市场组织结构的方式和数据,推动了思维和文化的进步。新方式视角即大数据将形成一场管理革命,无论是企业界、学术界、还是政策界都将受到重 大影响;大数据非常复杂,需要利用经济高效和创新方法进行处理,而这也对人们的观察力、决策力、执行力、竞争力提出了更加严格的要求。新资源视角即大数据是国家战略资源,是以新技术为基础可以开发利用的一种可循环利用资源,可以扩展新市场和促进新应用的出现。新基础设施视角即大数据资源建设及
6、系统和平台建设是其信息化基础设施和智慧城市 基础设施建设的有机组成部分,包含了政府研发电子文件管理系统、创建数据开放平台、大数据应用平台。新能力视角即大数据具有融合、云计算、洞2022 年 第 6 期黑龙江档案50兰台论坛Lantai BBS察力与预见性四大能力。新权力视角即大数据会对国家数字主权造成影响,也会对群众的知情权等基础个人权益造成影响。二、大数环境下数字档案的发展机遇各行各业均要求应用大数据促进行业发展。以档案业为例,全国档案事业发展“十三五”规划纲要明确了国家大数据发展战略和互联网行动计划的推进将深刻影档案工作的理念、技术、方法及模式。全国档案事业发展“十四五”规划纲要进一步提出
7、充分有效融入和大数据促进档案事业的快速发展。着重开发档案大数据,远程共享有效信息,站在大数据的角度对档案工作进行详细分析。由此可见,大数据时代为数字档案带来了重大机遇。(一)带来新思维机遇通过数字凭证开展管理工作,能够及时提供证据,快速完成数据提供,在整合数字档案资源的过程中可以帮助政府创造更多的价值,提高政府的服务水平,在数字经济和社会治理创新过程中效果非常明显。(二)带来新方式机遇为数字信息的安全提供服务力保障,数据全要素、全面质量管理,控制数据链风险,推动电子文件档案向单轨制、单套制方向逐渐发展,并且结合大数据行动。(三)带来新能力机遇在社会和数字化转型的大环境下,增强了国家的组织信息能
8、力,提高了国家为民生服务的质量,扩大了档案的涉及范围,让档案的发展方向变得更加明确,成为了推动大数据持续发展的主要助推力,让数字化程度逐渐加深。(四)带来新权力机遇整合国家数字档案资源可以帮助人类从事当前的活动和维护、重构社会记忆存在着非常紧密的联系,利用档案资源可以识别公民身份、保护群众隐私、维护群众权益。其档案的利用情况也会直接影响到新时代信息组织能力和国家发展水平。三、大数据环境下数字档案管理存在的主要不足为了更好地了解大数据时代柱子档案管理存在的不足,梳理已有研究成果,结合数字档案管理实践,设计 5 个评价指标:管理意识、管理制度、分类管理、加密防护、技术应用。随机抽取 31 名数字档
9、案工作人员进行问卷调查,问卷采用李克特量表形式,依据好坏程度设置 1-9 级评分,分值越高,说明问题越大。统计问卷结果见表 1。表 1 调查问卷结果指标1 分2 分3 分4 分5 分6 分7 分8 分9 分 平均值3 人4 人2 人6 人5 人3 人4 人3 人1 人4.67744 人3 人5 人4 人3 人2 人3 人3 人4 人4.80651 人1 人2 人6 人6 人3 人3 人45 人5.77421 人3 人2 人5 人5 人2 人2 人3 人8 人5.80653 人5 人2 人8 人4 人4 人3 人2 人0 人4.2581管理意识、管理制度、技术应用等指标的平均值分别为 4.677
10、4、4.8065、4.2581,均小于 9 级李克特量表的中位数 5,说明样本对象认为管理意识、管理制度、技术应用等方面存在的问题较小,即大数据环境下数字档案管理基本上不存在管理意识低下,管理制度不完善、技术应用不足等方面的问题。而分类管理、加密防护等指标的平均值分别为 5.7742、5.8065,均大于 9 级李克特量表的中位数 5,说明样本对象对认为分类管理、加密防护等方面存在的问题较大,主要指大数据背景下数字档案管理基本上存在分类管理效率低、加密防护不够等方面的问题。四、大数据环境下数字档案的分类管理与加密防护(一)大数据环境下数字档案的分类管理数字档案在归档和存储前,需要一定的标准分类
11、。例如,可以按数字档案的年度分类或按数字档案的类型分类。其中,按照档案类型分类的方式更利于档案信息的查询和修改,特别是在大数据环境下,应当按照类型对数字档案进行分类管理。比如,按照数字相片、数字视频、数字音频、邮件、邮箱微博等进行分类。分类存储和管理是数字档案管理的核心,也是数字档案处理的首个步骤,大数据环境应当利用元数据和个性化标签对原始数字档案进行分类,并建立完善的查询索引和目录。以数字相片为例,数字相片是最基本的数字档案内容,在档案分类中为数字相片添加元数据和标签,可以增加与其他信息项的关联关系以便于查询,同时也起到防伪和避免个人数据丢失的作用。大数据环境下,要结合不同档案分类方式对档案
12、进行分类,做到高效储存和使用。元数据方面,Adobe-Lightroom 是针对数字档案元数据编辑和使用的一种高效信息管理软件,既可以在相片中添加不同类型的元数据,数字档案中的相片由数字照片、与之匹配的文字说明及 EXIF(可交互图像)信息等构成,相片中的元数2022 年 第 6 期HEI LONG JIANGA R C H I V E S51兰台论坛Lantai BBS据可通过 Adobe-Lightroom 计算机软件读取和编辑处理,携带元数据的数字档案在查询、调用和修正等方面具有良好的安全性和便捷性。标签方面,数字档案添加标签也是分类管理的重要措施之一。首先,可以为档案数字相片添加 PI
13、CASA 工具或 GPS LOGGER 工具,以上两种工具都具有 GPS 定位功能,且与主流的 IOS 系统、ANDROID 系统兼容,在移动网络环境下即可进行数据的导入、调取和导出。其次,数字档案管理系统中的个性化标签与 WE CHAT、MICROBLOG 等社交软件在网络环境下实现兼容,满足用户在档案处理中的社交需求。大数据环境下,随着数字档案资源的信息量不断增多和应用范围的不断拓展,数字档案的重要性逐渐被更多用户认可。在数字档案的分类管理中,按照档案的元数据和标签建立档案索引目录十分必要,根据档案的元数据、文件名、位置信息、用户名+密码等不同的方式能够检索出用户需要的档案信息。通过不同方
14、式的管理,让数字档案发挥更多的功能,应用于不同的行业,方便档案数据的开发和使用。(二)大数据环境下数字档案的加密防护数字档案的加密主要通过密钥实现,密钥作为一种从“明文密文明文”的计算机算法转换参数,更适合于海量大数据模式下的个人数字档案加密。密钥根据加密的方式又细分为私钥和公钥,私钥的加密过程运行速度快,但公钥的加密方式更加灵活,两种方式分别适用于不同的场景。在大数据环境下,数字档案的加密处理更适合于私钥加密和解密方式。密钥是数字档案信息加密和解密的唯一凭证,具有较高的安全性,但密钥的算法只能供数字档案的使用者单独使用,采用私钥加密能够有效保护个人隐私。在大数据网络环境下,面对规模不断膨胀的
15、数字档案,只有不断地提高技术水平和防御技术,通过加密保护,才能更好地保护数字档案管理和存储等方面的安全性。首先,就个人层面而言,亟需强化个人信息的自我保护意识,互联网环境下数字档案的重要性不断升级,不仅关系到个人隐私的泄露,还会影响到个人的经济安全、个人信用乃至职业生涯,个人在注册数字档案时应妥善管理自己的账户、密码、私钥等信息,不能够在任何情况下透露私密信息,禁止或减少在公共网络环境下或公共电脑终端登录个人档案信息,还要定期地验证自己的个人账户,发现异常及时联系系统管理员。其次,对企业而言,企业的重要文件和管理信息也需要安全密匙的保护,要注意私有云技术的网络安全,对所用户必须进行身份验证,建
16、立文件防护原则和管理制度,保证重要文件的保护和备份,保证在发生安全隐患事件后,可以快速恢复重要数据。最后,要注意数字档案的安全防护已经成为一个事关公众隐私保护的普遍性问题,从国家和相关信息安全管理部门的角度来看。一方面,应从立法的角度将打击网络攻击保护网络安全写入法律条例,提升法律对不法分子的震慑力。另一方面,加强对网络安全的宣传与推广工作,继续推进网络实名制和软件使用的实名制工作,有效缓解网络入侵和网络攻击,保护数字档案和隐私的安全性。大数据环境下,数字档案资源管理应当加强服务范围,提高安全防护。一方面,拓宽数字档案的服务范围,加强类型分类管理,提高管理效率,为使用数字档案进行管理的企业、个人、单位提供更便捷的服务。大数据时代背景下,数字档案服务会朝着个性化服务和智能化服务的方向发展。其中,个性化服务可以让消费者多样化需求得到满足,一切以消费者需求为目标,注重管理细节的提升和服务范围的拓展,对数字档案使用有不同要求的企业、单位,要有针对性地进行服务,提高企业、单位在使用中的效率和个性化需求,解决企业、单位在使用和发展中遇到的不同问题和安全威胁。只有从服务范围、服务质量和技术投入等层面