IBM今天宣布了与Apache Spark开源软件相关的多个举措,用于存储,处理和分析大量不同类型的数据。

IBM正在将Spark作为Bluemix云平台上的云服务提供。该公司正在为Spark社区的机器学习许可下发布其系统MAL软件。IBM将在旧金山开设一家火花科技中心。IBM表示,它将推出超过100万数据科学家和数据工程师,并指导超过3,500多名研究人员和开发人员来涉及涉及火花的项目。

遗留技术供应商慢慢拥抱Spark - 许多人认为作为Hadoop开源大数据软件的继任者 - 但这只是IBM今天的移动组的一个原因是重要的。

数据一直是IBM感兴趣的领域,该公司已搬到Hadoop的产品化,但直到现在才一直是优先事项。IBM近年来在像物联网,软件定义的存储和Watson等领域下投注了大量资金。现在大数据再次焦点,即使在今天的新闻稿顶部没有美元金额。

IBM的努力代表了对旧金山启动DataMricks的潜在竞争威胁,声称致力于在过去一年中增加了75%的代码。来自Venture Lacked DataMroks的主要商业产品是云服务,在亚马逊Web服务公共云之上运行。IBM在Bluemix上引发Spark等同于DataBricks的直接攻击。如果IBM可以让其所人民提交大量的代码来激发,也可以挑战DataBricks。

IBM的Spark公告可以改进初创公司的初创公司的事项,这些启动在火花上构建了软件,包括Adatao,Alpine数据实验室和Clearstory数据。

但也许这里的最大影响是一般的火花的增加。大蓝提供火花可以帮助项目看起来适合大型企业,而不仅仅是为了启动。

“在企业中,我看到几乎没有火花收养,”Gartner分析师尼克·赫德克特(Gartner Analyst)在上个月在采访中告诉Vidturebeat。展望,应该改变。