开始 通过我们的介绍性内容提高自己的速度。

分析专业人士的最佳工作:数据科学家仍然列入清单

在过去的几年中Glassdoor报告发现数据科学领域不仅提供了良好的工作与生活平衡,而且还提供了巨额薪水和很多机会。在行业中,这并未引起人们的注意。年度开放数据科学会议最近举行了有关数据科学行业的前进方向的许多引人入胜的小组讨论。

数据科学都是炒作

数据科学之间的区别人工智能(AI),机器学习和深度学习已经变得模糊了。一个小组认识到,AI迅速成为当今受欢迎的流行语,这意味着组织正在重组其基础架构,以解释数据量AI设备和机器将产生的增加。

然而,所有炒作有时都让位于市场上有趣的变化。例如,像吸收在芝加哥,他们有能力提供“破坏性转型”,以帮助更知名的企业更好地处理大量的物联网数据。再加上高端数据科学能力的帮助,可以产生洞察力,从而对这些公司产生非常重要的影响。

但是,公司仍然需要考虑是否应该将产生这种见解的能力外包,或者是否应该自行开发这些能力,因为没有人知道自己的业务及其需求比自己更好。

应对变更

技术市场充满了一个例子的历史,说明市场如何应对创新带来的变化。随着关系数据库成为规范,对更高速度和灵活性的需求对程序员提出了更高的需求,动力机实际上,其他“第四代语言”通过抽象过程中的一些困难来使更多的人“程序员”。

这是我们在数据科学家中看到的进步,但这绝不会降低数据科学家的重要性。但是,它确实指出了许多技术创新,既可以减轻负载,又减少了某些人从事这项工作的入境点。

类似的工具logi Analytics’“盒子中的数据科学家”旨在使过程更轻松。此外,某些具有深远影响的住宿,例如使用统计模型来产生高价值的近似答案,可以帮助快速深入了解日益大而复杂的数据。大规模数据的时间和资源要求使这一问题变得越来越困难,因为答案在于许多问题不需要确切答案的概念。

因此,创新的公司寻求利用统计模型而不是数据来增强数据湖并提供高价值的近似值 - 这种方法可实现快速,高价值的答案,从而从数据中获得可行的见解,同时可以缓解对网络容量的需求。

平衡音量是关键

我们开始认为,更多的数据更好,在某些情况下是有道理的。但是,例如,简单的边缘处理过滤了那些相关的内容的无关紧要的消息,可能会减少每个房间中有八个传感器的1,000间客房建筑物中的每日消息数 - 从每秒读取24 kb16.58 TB降至100 GB(小于1%)。

但是并非所有数据都可以如此轻松地折叠。在某些情况下,有许多来自各种来源的数据,可以通过适当的探索和相关性获得洞察力。

例如,快餐店老板可能希望将来自所有不同来源的数据组合在一起,例如,IOT启用的炸薯条,冷却器,照明系统,HVAC系统和库存,以及城市支持的车辆交通数据等。- 为了了解如何根据某些条件优化其运营的见解。

利用统计模型进行高价值近似具有能够使用100个或更多节点向10秒钟的10秒钟,一个节点近似查询来转动这些多小时长时间的查询,以获得等效的见解。这种方法肯定不是所有用例,但特别是数据科学家将随着时间的流逝而受益于这种方法机器学习以及基本探索性分析。

从智能设备,传感器,显示器和仪表中流入的物联网,AI和机器生成的数据(仅举几例)的潮汐浪潮正在测试传统数据库技术的功能,因为大数据分析继续以巨大的速度增长感谢物联网爆炸。难怪数据科学家为什么继续成为最重要的工作之一,因为公司希望拥有开放的思想,创造性热情和使用不同技术来通过数据挖掘的高技能的人。

新兴技术不会使每个人成为数据科学家,但它们将帮助使数据科学家提高生产力,并为某些工作提供机会,从而在旁观者中分享这些工作。

所有的物联网议程网络贡献者都负责其帖子的内容和准确性。意见是作家的,不一定会传达物联网议程的思想。

搜索CIO

搜索安全

搜索联网

搜索数据中心

搜索数据管理