评估 衡量您正在考虑的技术,产品和项目的优缺点。

在IoT数据湖泊中钓鱼

在红帽峰会之后,我和家人一起去缅因来度假。该地区很酷,安静而美丽。坚固耐用的海岸线是显着的。我发现自己被新英格兰的天然冰川湖泊所珍视,所以与我们在格鲁吉亚的人造创作不同。你看,这里的湖泊是设计的通过构造水坝和从池塘,河流和沼泽的水转移水。下游释放的水根据用水,包括发电,导航,娱乐和农业灌溉。它让我思考淤泥数据存储之间的区别 - 有时被称为数据沼泽 - 以及似乎更适合IOT实现的自然数据湖泊。

自然与设计

如果您想到它,数据仓库类似于格鲁吉亚的池塘,河流和沼泽。这些是分开的,但重要的,生态系统可以被归档为一个 - 如果您申请了一系列工程。他们很高兴为您提供业务状态的实时图片。但您必须记住,它们只提供数据子集。此数据可以根据搜索的选择标准偏置。像我们的南方水库一样,他们受到严格规定,如果你决定扔进一条线,你究竟知道你会得到什么样的鱼。

平静的夜晚

照片:老虎Tabbyface,CC by

数据湖泊是一个不同类型的数据存储有机种植。他们可以帮助您找到您之前可能没有看到的相关性和模式以协助决策过程。当你在这里钓鱼的信息时,你更有可能抓住守门员。在这些水域中铸造通常会透露您之前可能没有看到的相关性和模式。

数据仓库和数据湖之间的基本差异总结在下表中塔玛拉沉闷的博客,“数据湖与数据仓库:关键差异”。

数据湖

在充满数据的湖中找到您的奖品

在一个物联网架构中,我们面临着数千个传感器,从声音到视频收集非结构化数据的群众以点击。所有内容都将快速流入原始数据池。尚未使用此数据。2015年麦肯锡公司对能源产业的一项研究发现不到1%在海上石油钻机上由传感器收集的数据用于决策。最近调查思科进行表示,由于企业不足以准备好收获其数据的好处,高达60%的IOT项目将停滞或失败,以及缺乏所收集的数据质量缺乏。

在我看来,我们需要更好的钓鱼工具。如果我用合适的应用程序作为诱饵在这个数据湖中钓鱼怎么办?我可以开始看到我所拉的模式。想象一下我想识别的业务环境失败的条件在我的设备上。我可以看看条件并注意,当它击中特定温度时,湿度超过一定比例,机器已经用于特定的小时数,存在失败。一旦我识别了一种可复制的模式,我就可以采取适当的行动。我可以努力降低温度和湿度,并可能修改维护计划。这是我可以捕获的一种类型的鱼。

与此同时,我注意到2012年之前部署的机器正在重复与这些条件无关的重复失败。注意到机器来自不同的制造商,我可以告诉旧机器可能会被替换。再一次,我拖着另一个奖品。

使用右钓竿并避免沼泽

Georgia’s reservoirs remind me more of a data store where you are pulling together several swamps filled with databases, file systems and Hadoop clusters containing a bunch of siloed data with no efficient way to find, prepare and analyze it unless the engineers managed to build something connecting it all. It takes a whole lot of engineering to create those lakes.

与我们提供的分析应用程序开源合作伙伴,Cloudera,您可以使用它的Hadoop引擎和机器学习来筛选数据湖泊中的模式和相关性。它在IOT环境中的应用,具有其Hadoop平台的可扩展性,安全性和灵活性,是一种自然的契合;像我在缅因州发现的冰川湖一样自然。像这样的分析解决方案可以帮助您利用完整的数据湖泊来优化您的IOT实现。他们可以帮助您找到隐藏在内部的掘金。如果使用更适合IOT实现的数据存储体系结构,您可以在您的IOT投资上显示更大的投资回报率,并开始钓鱼在盗版的地方。

所有IOT议程网络贡献者负责其帖子的内容和准确性。意见是作者,不一定能够传达物联盟议程的思想。

搜索CIO.

搜索安全

搜索联网

搜索数据中心

搜索数据管理

关闭