没有流处理,没有大数据,没有内容
最近,事情的互联网已经在每个人的嘴唇(和笔)上,作为最大的新资金来源,客户产品创新,投资机会和科幻故事(就像那些那些是机器人基金会的那些是那些,查找)。
事实是事物互联网的价值只来自令人震惊的数据量,它一定会产生生产,直到数据处理市场准备承担挑战,就没有赚钱。许多人相信,就像数据库管理所需的Oracle和大数据所需的Hadoop一样,事情(或真正的大数据)需要流处理。
流处理是一种技术,可以实时地实时收集,集成,分析,可视化和数据集成,因为正在生成数据,并且不扰乱现有来源,存储和企业系统的活动。
我们自己一直在谈论大数据的流处理的价值。在流处理中运营的其他公司是Cloudera,它正在使用开源Apache Spark项目; HortonWorks支持开源Apache Storm项目;和云提供商Amazon Web服务,带有Kinesis服务。我们知道其他一些举措,但它们尚未完整,生产持续的项目尚未结晶。
不管哪家供应商公司选择,事情互联网持有增长预测,让每个人的头部旋转:例如,Gartner预测,在2020年之前,物联网和个人计算将以1.9万亿美元的收入为止;思科认为,在同一日期将有5000亿连接的设备; IDC估计技术和服务收入将在2017年(2012年的4.8万亿美元起)至7.3万亿美元。对所有消费者,制造和政府行业来说,这听起来很棒 - 但这一切都是什么意思,为什么我们不能更早地发生?
答案很简单:数据处理市场还没有那里。要清除,所有这些连接设备将产生难以想象的数据量,所有这些数据都必须最终通过数据处理实体。任何计划互联网都需要定制的数据处理策略,这些策略余额平衡当前的需求,持续增长和未来的应用程序 - 这只能通过非常强大的处理器进行,使设备,设备,分析平台,客户和真实之间的协作能够协作-world系统。换句话说,让一切顺利地用相同的语言交谈,并实时编译和分析所有对话。
让我们谈谈这个例子。为一个,家庭自动化。在一个近在咫尺的水平,这不是一个大数据问题;它是关于最终用户应用程序的可用性。(你的冰箱真的是为您提供牛奶,以回应您的饮食应用程序吗?)但是,许多数百万的家庭连接到同一服务,有一个真正的机会,用于货币化 - 消费者行为,设备行为,实时/自定义的广告放置,以及数据处理实体的缩放问题。
此外,智能城市:停车场和交通应用程序已经存在;不是一个特别大的大数据问题。但是,连通公共汽车,火车,实时准确的道路信息;添加视频和天气数据;从昨天,上周,上个月连接信息;用实时人口统计数据交叉引用,并通过对业务和消费者(保持智能家庭的相同的人)提供的不同渠道提供此信息 - 让我们更接近Internet互联网的纯粹复杂性/大数据问题。
如果在它的顶部,我们添加了数据安全层,我们现在正在谈论真正的数据。今天的控制系统未设置更广泛的访问,SCADA具有局限性,无线访问需要SIM卡。但智力越大,袭击越复杂。警报需要实时对系统的所有数据的使用和模式分析。
只有流处理可以处理这项工作,这就是为什么:
与各种技术一样,流处理也将有一天需要重新思考和更新。然而,直到那时,事物互联网的演变和其赚钱的能力将与流程处理技术的采用率密切相关。
Dana Sandu是SQLSTREAM的市场Evangelista。