工业互联网标识数据管理及应用技术研究

工业互联网标识数据管理及应用技术研究



导语



工业互联网的数据价值发掘是工业互联网发展的核心方向,工业数据采集、存储、智能化应用对运营管理优化、生产协同组织与商业模式创新具有十分重要的意义。目前,工业互联网数据尚且面临信息孤岛、数据兼容、数据挖掘不足等众多问题,而工业互联网标识解析体系是解决上述问题的关键。本文面向工业互联网标识数据,从技术层面对标识数据的存储、管理、分析及信息挖掘等应用进行研究,为工业互联网的全面建设及价值发现提供思路。



 1  

发展状况


工业互联网是物联网产业未来发展的核心力量,随着世界经济格局的不断变化,各个国家均加强了工业互联网的建设,增加了其投入,以争取工业互联网建设的领先地位。为深入实施工业互联网创新发展战略,推动实体经济与数字经济深度融合,我国政府及相关部门相继出台了《关于深化“互联网+先进制造业”发展工业互联网的指导意见》《工业互联网发展行动计划(2018—2020 年)》等一系列引导政策,目的是推动制造服务体系智能化、制造业融通发展,实现制造业和服务业之间的跨越,使工业经济各种要素资源能够高效共享。


工业互联网标识是工业互联网发展的重要基础,能够将唯一可标识的工业系统对象(如生产设备、网络接口卡、智能仪表、传感设备、执行元件等)联通起来,借助标识中的IP地址、URI等属性信息实现标识对象的交互与协作,以便各类信息处理系统、资源管理系统、网络管理系统对目标对象进行相关管理和控制。因此,标识技术是物联网、工业互联网基础信息融合的支撑技术,是物联网、工业互联网大数据应用的基础。


工业大数据资源互通、共享和协作生产是工业互联网的主要诉求之一,而实现此目标的核心是数据的理解与分析。在企业生产经营过程中,由机器产生的海量数据经过解析后形成统一的标准、数据格式和表达方式,但是海量数据却面临着复杂的管理问题。同时,数据的使用者包括政府部门、不同行业不同领域的企业以及消费者,这些群体对于数据的需求、用途也大相径庭,海量数据所包含的信息具有极大的价值,如何实现工业互联网大数据的信息挖掘是互联网标识建设的重要内容。


互联网上具有大量的关于实体性质、特征、用户描述的成熟语言环境,还具有面向应用的开发及商业环境,采用人工智能、机器学习、自然语言处理等技术对信息的内在价值进行深层次挖掘,从宏观上对互联网信息进行融合,通过有效的权限管理,实现工业大数据的按需共享,支持数据合理流转,激发数据应用,进行具体的工业大数据应用,如质量管理、趋势分析等。实现互联网与工业企业的融合创新,需要强大的信息处理及支撑技术;同时,作为开发新应用、产生新业态的基础,针对工业互联网标识数据管理及应用研究具有十分重要的意义。


工业互联网标识数据管理及应用以标识数据为主线,研究标识数据的硬件存储技术、标识注册分配管理、标识数据查询与统计、标识数据智能分析等,从技术层面提出数据管理及应用的方向,为工业互联网标识数据解析及管理系统的建设提供意见和参考思路。


 2  

工业互联网标识数据中心硬件方案


工业互联网标识数据中心主要完成标识数据的存储功能,目的为安全可靠的支撑标识数据存储,包括数据库服务器集群、备份管理服务器、主存储集群、核心交换机、防火墙、维护终端等硬件设备,各设备相互配合关联共同完成标识数据的存储任务(见图1)。

工业互联网标识数据管理及应用技术研究

图1    标识数据中心系统硬件方案


数据库服务器集群是数据中心的核心部分,用来完成标识数据的数据库管理,实现数据资源的管理操作,如数据的输入、输出、增加、删除、浏览、查询、修改、统计、分类、关联等,同时还提供数据服务接口。备份管理服务器用于制定备份策略,定期将主存储集群中的数据同步到备份存储阵列中。存储集群将存储所有标识数据信息,可根据需要扩充存储容量。核心交换机配置于数据中心系统,用于构建系统之间相互连接的内部以太网络。此外,数据中心需要配置防火墙用于提供服务。


 3  

工业互联网标识数据的管理与应用技术


工业互联网标识数据的管理与应用主要包含标识注册分配管理、标识数据查询与统计、标识数据智能分析等几个方面。


3.1    标识注册分配管理

标识注册分配管理应按照自上而下的设计思路,首先是国家政府主管部门和国家注册管理机构对国家节点机构进行授权;其次再到二级注册管理机构,包括行业和企业两种情况;然后分别到达行业注册服务机构和企业注册服务机构;最后形成标识注册分配管理系统,其中注册操作由标识注册分配管理系统向行业注册服务机构或企业注册服务机构进行,分配操作是行业注册服务机构或企业注册服务机构向标识注册分配管理系统进行的操作。


标识注册分配管理用于实现统一物体标识的规划、申请与分配、使用情况反馈、生命周期管理、标识有效性管理、现有其他非统一标识的信息收集以及映射与关联信息收集。


(1)统一标识的规划

针对每一类标识,具有统一标识规划权限的管理人员可以对其新增、修改或查看规划。


(2)统一标识申请与分配

统一标识的授权机构可以向平台申请统一标识资源并向使用机构进行统一标识的二次分配。授权机构也可以直接通过本平台向使用机构进行二次分配。授权机构和使用机构申请标识时应提供相关申请材料。平台管理员负责受理标识使用申请,审核申请材料后,按需进行分配。


(3)统一标识使用情况反馈

授权机构需将标识的二次分配情况反馈到系统中,即具体分配到哪个企业或哪个行业;在可获得信息的情况下,授权机构还可将标识的具体使用情况反馈到系统中,使用情况应尽可能细化。


(4)统一标识生命周期管理

提供标识生命周期的管理功能。标识可分为非循环和可循环两种。非循环标识具有永久性,即可将标识永远地分配给某目标对象,不论该对象是否存活或存在;可循环标识具有一定时长的生命周期,超过生命周期后标识还可根据需要循环分配使用。对于统一标识,分配时管理员应对其生命周期进行标注;对于可循环的标识,平台应能自动收集为可回收标识,管理人员可以对回收的标识进行查看并进行回收。另外,对回收的标识设定冷冻期,管理人员具有设定和修改冷冻期的能力。在冷冻期结束后,系统应能自动提示是否可以将此号码解冻,经管理人员确认后,系统自动将此标识从回收标识中删除,并更新为未分配状态。对于未到期的可循环标识如果需要停止使用,管理员可以通过平台手动回收。


(5)统一标识有效性管理

统一标识有效性管理主要是指存储标识时,需要对标识格式的有效性以及权限进行判断。


(6)非统一标识信息收集

系统为现有其他标识的分配机构(如电信运营商、行业标识管理机构等)提供入口,用于分配机构向平台反馈本机构内标识的分配与使用情况。反馈标识使用情况的粒度应尽可能细化到具体物品,最粗粒度应细化到具体企业。


(7)映射与关联信息收集

企业与应用可以反馈物体标识与其应用相关的物体标识、通信标识和应用标识之间的映射与关联,包括标识与通信码号之间、标识与IP地址之间、标识与应用地址之间、标识与行业标识之间的映射关系。映射与关联关系的建立,除源自企业与应用的注册登记外,还可结合与已建设的IP地址规划及管理系统以及各行业内部标识管理系统的互通。


3.2    标识数据查询与统计

标识数据查询与统计主要用于对标识的分配信息和使用信息进行查询与检索,标识的统计与分析以及标识映射信息和关联信息的查询。


(1)标识查询与检索

用户可查询检索某具体标识的分配和使用等相关信息,对于统一标识的查询,应支持对标识的分配信息和使用信息的查询;对于现有的非统一标识的查询,应支持所收集到的非统一标识的分配和使用信息的查询;行业内管理系统应可接受访问,并将查询结果反馈给用户。查询功能支持多种接入方式,例如现有电信网、互联网等手段。查询结果的显示字段根据查询用户的权限进行限制,对于用户不具备查看权限的字段将在结果显示中进行隐藏。对于管理部门用户及授权用户,可对全部标识信息进行查询;对于分配或使用单位用户,则只能对本单位分配或使用的标识信息以及指定范围的标识进行查询;对于公众用户,可以对指定范围的标识信息进行查询。此外,该功能支持条件组合查询方式,用户可根据标识类型、标识分配者、使用者、标识段、标识值等条件任意组合进行检索,还可支持用户输入信息的模糊匹配查询操作,以及在查询结果的基础上进行二次查询。


(2)标识统计与分析

管理部门对标识信息进行统计分析,为未来标识的规划、分配、使用提供依据。该功能应支持多维度的标识统计功能,从标识类型、分配机构、使用部门、标识段、业务种类等角度进行统计。统计项目分为系统定时统计与定制统计。定时统计由系统设定时间定期自动进行统计,生成统计报表,定期自动保存,结果可以随时供检索和打印输出;定制统计则更为灵活,与定时统计的统计项目内容完全一样,不同的是,管理员可以根据需要,设置统计时间,进行数据统计。对于现有非统一的标识,应支持定制统计;对于统一标识,应支持定制统计和周期性定时统计功能。


(3)映射和关联信息查询

用户可以查询物体标识和与其应用相关的物体标识、通信标识和应用标识之间的映射与关联,包括标识与通信码号之间、标识与IP地址之间、标识与应用地址之间、标识与行业标识映射系统之间等关联信息。平台也可以自动关联不同行业的标识系统,以触发跨行业、跨平台互通的应用。


为实现标识数据查询与统计功能,需要各类计算机技术支持,包括Beats、ElasticSearch、Logstash等。其中,Beats是标识数据查询统计模块的底层核心部件,作为Elastic公司的一款开源采集系统监控数据代理Agent,在被监控服务器上以客户端形式运行的数据收集器的统称,可以直接把数据发送给核心存储检索引擎Elasticsearch,或者通过高吞吐量数据处理引擎Logstash解析/变换处理发送给Elasticsearch,然后进行后续的数据分析活动。


Beats由几部分组成:

● Packetbeat:一个网络数据包分析器,用于监控、收集网络流量信息。


● Filebeat:用于监控、收集服务器日志文件。


● Metricbeat:定期获取外部系统的监控指标信息。


● Winlogbeat:用于监控、收集Windows系统的日志信息。


● Heartbeat:是轻量型运行时间监控采集器,通过主动探测来监控服务可用性。


实现标识数据的检索与处理,需要ElasticSearch和Logstash 两项技术的配合。ElasticSearch是一个基于Lucene的搜索服务器,提供一个分布式多用户能力的全文搜索引擎,用Java开发,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎,能够达到实时搜索、稳定、可靠、快速、安装使用方便;Logstash是一个基于Java的开源工具,用于收集、分析和存储日志,具有实时管道功能的开源数据收集引擎,可以动态地将来自不同数据源的数据统一起来,用于各种高可视化用例。由ElasticSearch和Logstash等技术可支撑起事务日志分析、标识搜索定位、标识码分析、发码量查询和标识码查询等可视化应用的相关目标。


3.3    标识数据智能分析

标识数据智能分析使用工业智能技术,以标识数据元为输入,以数据服务和数据存储为中转站,以算法逻辑为理论支撑,通过标识应用形成面向标识数据的智能分析能力。采集的标识数据元包括工业设备数据(焊接机器人和传感器等)、企业内部非标标识数据和标准标识数据,采集的标识数据元用于数据服务,包括实时数据接入服务(Kafka)、数据库实时复制服务(Sqoop)、结构化数据接入服务(ETL)和文件数据接入服务(Flume)等,之后采用分布式并行历史数据库的数据存储,借助于标识数据智能分析模块的核心即算法逻辑实现标识数据的智能分析,最终为决策者提供参考。


采集的标识数据首先需要数据预处理,Pandas技术可实现数据标准化、数据整理和数据剔除等数据预处理操作。数据预处理结束后,利用先进的人工智能模型进行训练、分析,其中包括机器学习、深度学习算法等大数据基础理论,训练出的标识数据智能模型集成后根据需求进行调用。机器学习技术利用计算机模拟人类的学习行为,获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,可用于标识数据的智能分析,其算法主要有线性判别分析、二次判别分析、支持向量机、朴素贝叶斯、决策树、随机森林和长短期记忆网络等。相比机器学习算法,深度学习通过多层处理,逐渐将初始的“低层”特征表示转化为“高层”特征表示后,用“简单模型”完成复杂的分类、预测等学习任务,主要方法包括卷积神经网络和递归神经网络。


无论是传统的机器学习还是深度学习都需要经过模型训练过程才能形成可供调用的智能分析成品模型,训练模型框架可选用Sklearn、TensorFlow和Keras等。Sklearn是机器学习中常用的第三方模块,对常用的机器学习方法进行了封装,包括回归、降维、分类和聚类等方法;TensorFlow是一个基于数据流编程的符号数学系统,拥有包括TensorFlow Hub、TensorFlow Lite和TensorFlow Research Cloud在内的多个项目以及各类应用程序接口;Keras是基于Theano和TensorFlow的机器学习库,由纯Python编写而成并基于TensorFlow、Theano以及CNTK后端。在上述框架支撑下开始进行训练,按照层级思路建立待训练模型,并选择数据输入,设置训练所需的优化器、损失函数、学习率、迭代轮数和批次等参数,训练过程可采用有效的技术手段使模型达到更好的效果。


(1)合理引入Dropout层,以防止过拟合,提高模型的泛化能力。


(2)采取动态改变学习率策略,当发现模型的效果不再发生改善时,则减小学习率,以寻求后续训练过程的改善。


(3)加载已经训练的模型权重继续训练,提高模型的性能,令模型更快收敛。


模型训练完后,需进行模型存储的过程,根据所选用建模框架的不同,其模型格式也会有差异,经过以上技术操作后,可形成个性化的面向标识数据的智能分析应用,如实时监测、数据可视化和分析预测等。


 4  

结束语


工业互联网标识建设并不是我国工业互联网发展的终点,而是工业互联网发展的起点,工业互联网所产生的海量数据只有在科学管理、充分挖掘后,才能为我国工业产业的发展提供无可比拟的价值。因此,工业互联网标识数据的管理及应用在工业互联网建设中占有及其重要的地位,应进一步挖掘其价值,推进我国制造业结构性改革,构建新型制造体系,促进制造业向中高端迈进,实现制造强国。





论文引用格式:

池程, 柴森春, 谢滨. 工业互联网标识数据管理及应用技术研究[J]. 信息通信技术与政策, 2019(8):47-51.





作者简介

池程:中国信息通信研究院工业互联网与物联网研究所工程师

柴森春:北京理工大学自动化学院院长助理

谢滨:中国信息通信研究院工业互联网与物联网研究所工程师


本文刊于《信息通信技术与政策》2019年第8期


工业互联网标识数据管理及应用技术研究



《信息通信技术与政策》是工业和信息化部主管、中国信息通信研究院主办的专业学术期刊。本刊定位于“信息通信技术前沿的风向标,信息社会政策探究的思想库”,聚焦信息通信领域技术趋势、公共政策、 国家/产业/企业战略,发布前沿研究成果、焦点问题分析、热点政策解读等,推动5G、工业互联网、数字经济、人工智能、区块链、大数据、云计算等技术产业的创新与发展,引导国家技术战略选择与产业政策制定,搭建产、学、研、用 的高端学术交流平台。




您的关注是我们更新的动力

长按识别二维码关注我们


工业互联网标识数据管理及应用技术研究
工业互联网标识数据管理及应用技术研究


我知道你在看

工业互联网标识数据管理及应用技术研究

原文始发于微信公众号(信息通信技术与政策):工业互联网标识数据管理及应用技术研究


本站所有资料已分享至本站小密圈,微信扫码加入下载8000+最新行业报告及获取1年期更新(推荐)

发表评论