大数据时代档案部门建设应对策略

档案馆历来一直注重保护隐私和国家机密档案,在小数据时代面临的威胁较小,也较容易应对。但在大数据时代,虽然档案工作位势和声誉会得到提升,但一些隐私信息也将无处遁形,数据开放、数据共享是其应有之义,个人隐私保护数据安全问题成为大数据档案馆面临的紧迫而突出的挑战。

未来档案馆的核心竞争力很大程度上取决于将档案数据转化为信息和知识的速度与能力。档案部门作为存储信息、提供信息服务的信息中心,必须主动创新,推动档案工作向“知识化、信息化、技术化、市场化”变革,利用大数据技术实现战略发展以满足未来需求。

一、制度保障

标准与规范是大数据时代档案信息资源挖掘的重要依据。在大数据时代下,信息众多无法管理,严格把关档案的收集渠道和收集范围、规范网上数字档案信息资源挖掘流程、建立大数据时代数字档案信息资源收集原则及规范体系变得尤为重要。

因此,档案的收集工作要做到全流程控制。档案管理工作从前端进行控制,将档案管理融入到办公系统、科技创新管理、网络支撑等管理系统中,将文件、数据归档流程写入发文环节、验收环节等,抓好文档的前端控制。

二、人才保障

大数据时代的到来使得大数据技术与相关产业得到空前发展,也使得整个社会对掌握数学、统计学、数据分析、商业分析和自然语言处理等多学科知识背景的大数据人オ需求越来越旺盛。大数据时代的档案工作不再是装装订订,档案利用也不是简单查阅,档案人员应从数据的视角看待档案,以大数据的思维推动档案馆的管理和服务。

培养档案馆大数据人才关键在于培养和造就一支懂技术、懂管理的大数据档案从业人员。数据研究和管理将成为下一代档案从业人员的最重要的能力之一。大数据档案从业人员要有较高的综合素质和能力,既要了解馆藏档案信息,还要了解案馆的相关服务知识,更要了解大数据技术的各个层面,能够为用户提供与大数据时代技术条件相适应的创新性、个性化、移动化、智能化的服务。当前,档案馆大数据人才

还相当匮乏、短缺,为此,档案馆系统要跟上时代步伐,尽快更新理念、加大投入,加快培养与现代档案馆业务相适应的大数据技术人才和服务管理人才。可以借鉴一些高校与企业联合开展的大数据教育模式,如北京航空航天大学计算机学院、软件学院与百度、淘宝、腾讯等企业合作,联合创办了国内首个大数据专业工程硕士培养项目,档案馆系统也可以采用这种联合培养模式加快大数据人才培养。

三、技术保障

大数据时代,档案馆的核心竞争力取决于其占有数据的规模、活性及对数据分析挖掘、运用的能力。档案部门要紧跟大数据时代信息技术发展,密切关注流处理、并行性、摘要索引和可视化等大数据应用理论研究,在档案工作中研究引进并应用大数据数据库管理、数据模型构建、数据分析、数据挖掘、云计算等技术和计算机软硬件设备设施,构建档案工作的大数据管理技术能力进而推动档案工作向技术化进行转变。

在大数据档案馆建设进程中,大数据规模庞大、半结构化数据比重日益加大,传统的定性、定量分析已远远不能满足大数据分析的需求,这也对档案馆大数据技术应用水平提出了新的要求。目前,档案馆在数据采集、存储、分析及应用的各个层面,已有相对比较成熟的开源的大数据技术( Hadoop)可供选择。

一方面, Hadoop是大数据存储和管理中极具独特优势的大数据管理系统,可以为用户面临数据规模急剧膨胀、对系统可靠性和实用性要求极高的应用提供良好的解决方案。

另一方面,数据挖掘技术通过利用人工智能、机器学习、统计学、模式识别等技术,可以从大量的、还有噪声的、多元异构的实际数据中提取其中隐含的、潜在的价值信息。今后,在大数据档案馆建设中,要积极引进新兴大数据技术,借鉴各类开源的大数据技术,自主开发案馆大数据移动应用技术,破解大数据档案馆建设的技术瓶颈。

四、资金保障

自《全国档案信息化建设实施纲要》实施以来,柲案馆的信息资源总量增长迅速,已初具大数据特征。虽然目前单个档案馆数据资源总量达到PB级的还不多,但各档案馆档案资源总和则堪称海量。据统计,2008年,全国各级国家档案馆共保存档案1.93亿卷,较上年增加1709万卷,増幅达10%,而到2011年,各级国家档案馆馆藏已达3.3亿卷,到2020年,各级国家档案馆馆藏将达到6亿多卷。随着数字案馆建设的不断开展及资源整合的实现,这些海量资源将形成一个巨大的档案资源库。

面对如此巨量的档案信息资源,档案管理机构现有的存储设备不足以有效和完整地存储档案数据,即使使用云盘也无法解决这个难题。因为大数据系统需要分析所有的相关数据,然后根据相应的算法提取出重要的信息。把TB级的数据上传到云盘需要大量的时间,而且这些数据又是在快速的变化,所以无法保证上传到云盘数据的实时性。

因此,档案管理机构需要资金购买与大数据时代相适应并且安全的存储设备来保存这些档案信息资源。同时,云计算的分布式性质对于大数据的分析也存在问题。大数据在处理数据时需要把数据从存储点传输到处理点,如果数据流量大会造成数据堵塞影响处理速度。所以,购买具备高速信息传输及处理能力的档案存储设备也十分必要。

上面只简单列举了硬件方面的资金问题,还有诸如资源的建设、新技术的引进、人才的培养,个性化的服务等等问题,都需要大量可持续资金的支持。必须加大资金投入,通过引进现代化技术和相应设备来实现档案管理的信息化与现代化。

五、安全保障

档案馆历来一直注重保护隐私和国家机密档案,在小数据时代面临的威胁较小,也较容易应对。但在大数据时代,虽然档案工作位势和声誉会得到提升,但一些隐私信息也将无处遁形,数据开放、数据共享是其应有之义,个人隐私保护数据安全问题成为大数据档案馆面临的紧迫而突出的挑战。

大数据时代下档案部门除了建立传统的反黑客、反病毒、防盗窃等信息安全保护技术,抵御外来入侵者的威胁外,还需要特别加强数据信息安全管理,建立全面数据信息安全保障体系。

面对这一挑战,要做好以下工作切实保护数据安全。

一方面,档案馆作为数据的守护者,要提高专业素养和职业道德,保护国家机密和其他信息数据安全,严格控制其传播或开放范围,坚定地保护个人隐私、严守情报机密、维护国家信息安全,杜绝信息安全风险。

另一方面,要引进或研发大数据安全技术,防范他人恶意入侵盗取或破坏数据,规范数据开放流程和接口,保障档案馆大数据资源的安全使用。另一方面,政府部门要特别加强数据信息安全管理,研究建立数据信息安全保障体系,通过立法来保护大数据的信息安全,严厉惩罚数据的入侵者、滥用者和破坏者,造成危害后果严重的甚至可以追究刑事责任。

档案馆大数据安全保障本身也是一个系统工程,需要多方共同努力,不仅需要档案馆系统的努力,也需要数据安全技术供应商以及用户自身的支持,同时还需要政府在法律法规等制度建设上的支撑。

本文来自信息化观察者网,转载请注明出处。

 

注:本站文章除标明原创外,均未网友或机构投稿分享,如有宣发需求或侵权请联系dongxizhiku@163.com。