首页 > 工业4.0

拒绝过时和退出历史舞台——历史数据库的最新发展开辟新篇章

来源:控制工程网2020.06.28阅读 1924

  时序数据存储应用市场,无论其名称如何——是历史数据库、过程历史数据库还是企业历史数据库,似乎是都是听起来有点过时且枯燥的软件市场。但是,在大多数HMI、DCS和SCADA部署中,这个最不吸引人的组件却拒绝退出历史舞台。最近的市场趋势显示新一代产品可能会重新引起人们对历史数据库产品的兴趣。
  对于历史数据库而言,下一步是什么?对于特定时序数据的数据存储系统而言,是什么推动人们的兴趣和需求在不断增长?要找到这些以及其它相关问题的答案,让我们回顾一下历史数据库的发展历史。
  第一阶段
  如果想要寻找现有历史数据库应用市场的官方历史,可能还真的不容易。在1980年代中期,首先由Oil System公司的工厂信息系统(后来更名为OSIsoft PI System)拉开了为监管、汇报、资产可用性和诊断分析为目的而设计的数据存储系统的序幕。这些早期的历史数据库,运行在DEC VAX / VMS小型计算机上(这是1980年代制造业系统的选择)。
  巧合的是,历史数据库软件的引入和开发,与它在工厂分析领域的长期合作伙伴电子表格同时进行。到1980年代后期,电子表格和时间序列数据存储都分别建立了各自的软件类别,这种联系一直持续到今天,因为电子表格仍然是历史数据库用户最常用的分析工具。这一系列早期工作的基础,是为企业软件产品提供基本组件,因此对它们进行了可靠性、连接性、可扩展性、可压缩性或效率特征评估,和现在所做的如出一辙。
  第二阶段
  随着历史数据库在数据存储和分析方面的巨大价值得到验证,历史数据库市场的第二阶段见证了各家领先的自动化供应商对历史数据库产品的收购或开发。要对所有产品都做个总结是非常困难的,但可以举些例子:GE Fanuc于2003年收购了Mountain 系统公司(现为GE Proficy),成立于1987年的WonderWare被施耐德电气收入麾下(现归入AVEVA),被霍尼韦尔收购的InterPlant(现为专业的历史数据库)等等。
  实际上,当前历史数据库市场的挑战之一是很难确定其规模。西门子、ABB和AVEVA等行业领先的供应商通过一系列的收购活动,可以提供多种类产品。例如,仅AVEVA就拥有WonderWare、eDNA和Citec等历史数据库。有些供应商可能仅有某种特定功能的历史数据库产品,例如SCADA供应商Inductive Automation公司的Ignition系统。除此之外,一些公司还建立了自己的历史数据库,通常作为SQL服务器应用。
  那么,目前有多少历史数据库产品?仅将商业产品计算在内,保守估计至少超过30种。其中包括您可能不知道的产品,除非您去过挪威(Prediktor)或爱尔兰(AutomSoft),或者您使用的是Cygnet、Ellipse 和CopaDATA这样的SCADA系统。
  在第二阶段,产品的另一个特点是开发历史数据库更多应用,以便于趋势分析、报告、移动访问和其它用户体验。单纯的历史数据库产品已不能满足客户需求。为了提升用户体验,供应商添加了完整的平台功能,例如应用程序编程接口(API)、高价值组件(例如OSIsoft PI系统资产框架和通知)或历史应用程序组合(例如霍尼韦尔的 Uniformance套件)。

图1:由于可以有效地存储并提供对大数据的访问,时间序列数据库正经历爆炸性增长。

  第三阶段
  在这一阶段,越来越多的工业自动化供应商都提供历史数据库产品、功能应用堆栈和微软Windows服务器产品(VAX/VMS平台已经成为遥远的过去),市场长期处于平稳状态。如前所述,历史数据库是重要但波澜不惊的软件类别,对于大型自动化供应商而言,历史数据库只是大规模自动化系统业务的一小部分。
  那么,过去两年发生了哪些变化?正在向时间序列数据存储应用业务的第三阶段过渡。例如,硅谷两家领先的风险投资公司Benchmark Capital 和Battery Ventures,已向新的时间序列数据库公司InfluxDB和Timescale投资了超过1.25亿美元。这些公司认为时间序列存储市场足够大或足够重要,有着长远的发展潜力。
  此外,亚马逊在其AWS公共云平台上,宣布了一项新的时间序列数据库服务Timestream,该服务已于2019年晚些时候上市。西门子MindSphere和GE Predix也在其云平台上提供了类似的功能。

图2:高级分析软件为工程师提供自助服务功能,以创建各种数据视图。图片来源:Seeq

  爆炸的数据量
  许多工业自动化主管说:“工业物联网并不是什么新鲜事,我们已经使用了数十年。”如果您指的是自1980年代以来,一直是过程制造业支柱的传感器所生成、收集、存储和分析的数据,那么这种说法也是可以的。
  但是,在过去20年中,物联网带来的变化是如何利用数据生命周期的每个阶段,使成本降低一个数量级。这包括通过传感器生成数据、通过网络和连接性收集数据以及数据存储。
  因此,如果以前只有最关键的资产才值得监视,那么随着时间的推移,不太重要的资产,也将被包含在工厂网络中或作为IIoT平台的补充。这也包括断开连接或独立的资产。
  这种变化不是架构上的变化(无线连接代替有线除外),而是经济上的变化。从经济角度来讲发生了根本的变化,并且是许多行业(例如大数据、工业物联网、无线网络和云数据服务)发展的主要推动力。计算是如此便宜,用户可以证明生成、收集和存储更多数据是合理的。
  所有这些数据都必须存储在某个位置,并且无论存储系统是否被称为历史存储系统,时间序列数据存储都有了爆炸性的增长。开源时间序列数据库、基于云的服务(如前面提到的AWS产品)、数据库服务供应商和云平台初创公司,都争相成为新的时间序列数据存储业务供应商(图1)。 
  介入云端
  由于“数据引力”,庞大的数据量吸引了人们的注意,也带来了高价值的附加服务,例如管理、安全性、分析和咨询。制造业所产生的惊人数据量成功吸引了想要进入该行业公司的注意力。
  微软、亚马逊和谷歌公司专门将重点放在石油和天然气领域,作为它们介入该业务的起点。像Battery和Benchmark公司的投资一样,这显然是新市场热点的标志。
  这也是公共云市场成熟的标志。如果说历史数据库的“年龄”约为35岁,那么关注一下公共云产品的“年龄”是非常有意思的。例如,亚马逊在2002年推出了AWS,然后在2006年推出了S3(存储)和EC2(虚拟机)。接着,随着微软和谷歌公司在2008年推出云计算平台,云计算竞争变得非常有趣。
  多年积累起来的对云数据存储应用的经验,使得将数据迁移到云越来越成为一个“择时”而非“是否”的问题。因此,大型公共云平台越来越关注最大的数据源。
  如前所述,亚马逊公司具有AWS平台可提供Timestream数据库服务,谷歌公司为其BigTable数据存储服务提供时间序列存储文档。微软公司还拥有多种Azure服务,可以存储市场上已有的时间序列数据。
  除了GE和西门子公司外,三大公共云供应商还宣布提供时间序列存储服务。这是对PTC ThingWorx等众多IIoT平台产品、OSIsoft 云服务等工业供应商产品以及Cognite等用于情境化和聚合的工业数据平台的补充。与历史库供应商名单一样,在云端具有数据收集和存储服务的公司(尤其是初创公司)的名单也很长。
  当然,数据服务本身并不能使历史数据库或时间序列数据库产品成功。历史库应用程序、资产模型支持、数据连接器和其它功能,是解决方案的关键需求,而不是零碎的客户服务。不过,显而易见的是,数据量吸引了新的参与者,并且越来越多的传感器数据存储在云端而不是本地。
  高级分析功能
  正如前文所述,历史数据库和电子表格之间的并行发展关系,仍然共享并相互依存。每个历史库能提供什么产品和功能,都可以通过用于数据清理、情境化、计算和建模的电子表格了解清晰。
  但是,随着数据量的增长,对改进分析产品的需求不断增长:描述性、预测性、诊断性、交互性和规范性,远远超出了电子表格的范围。这些改进,可以通过很多现在被称为高级分析的方法来实现的。
  具体而言,高级分析意味着将认知计算技术纳入可视化和计算应用程序。麦肯锡对高级分析解决方案的定义是:“高级分析解决方案可以更轻松地从多个数据源访问数据,还提供高级建模算法和易于使用的可视化方法,最终可以为制造商提供新的方法以控制和优化整个运营过程中的所有流程。”
  机器学习和其它分析技术的引入,加快了工程师在寻找关联、聚类、或在过程数据中大海捞针的进程。利用这些基于多维模型的功能,并借助于组合来自不同来源的数据,使工程师在分析能力方面,获得了数量级程度的提升,不亚于从笔和纸到电子表格的迁移。例如,现在利用某些高级分析软件可以实现“像Google一样搜索”,在历史记录或其它大数据存储系统中搜索所有标签,而其它功能也能够以类似的方式提供。

  高级分析方法包括两个关键组成部分:
  首先,它应该是为拥有工厂和过程所需经验、专业知识和历史的工程师提供的自助服务。这使工程师能够在应用级别上工作,并具有生产力、授权、交互和易于使用的优势。
  其次,高级分析解决方案应包括所创建的分析与基础数据集之间的连接,以便用户可以简单地单击并访问基础数据。高级分析产品不仅应用于生成可视化数据的图片,还应提供对分析和数据来源的访问。因此,工程师、团队、经理和组织可以使用这些新功能来实现在整个工厂和公司中分配收益(图2)。
  在历史数据库的供应商和挑战者(包括开源和云服务)的支持下,时间序列数据存储市场已经向更有趣的方向转变,并开启了时间序列数据存储市场的第三阶段。具有使用历史数据库经验的工程师会发现,随着越来越多的公司生成、收集和分析传感器数据,他们的技能将更具有市场价值。从过去与电子表格的密切关系转向更具吸引力的软件产品的过程中,高级分析解决方案将成为其关键资源。(作者:Michael Risse)