Big Data Company Cloudera正在准备推出专业的新开源软件,用于存储和服务许多不同类型的非结构化数据,有目的是在数据库业务中挑战重量级,Venturebeat已经学会了。

kudu存储引擎是替代广泛使用的Hadoop分布式文件系统和Hadoop导向的HBase NoSQL数据库,根据Kudu的设计目标的副本,借用来自Kudu的设计目标的副本。该技术将作为Apache许可的开源软件发布,幻灯片显示。

Cloudera在过去的两年里,它的早期员工领导着一支小组致力于Kudu,而该公司在本月底的开放源发布之前已经开始向客户推销软件,这是一个熟悉的据说Venturebeat。

这个来源和其他人认为kudu可能对来自Teradata和IBM的Puredata(以前Netezza)和其他供应商的数据仓库提供了新的威胁。据源代理说,它也可以用作可以处理大量并行处理(MPP)工作负载的高度可扩展的内存数据库,而不是与HP的Vertica和VoltDB不同。有一天的kudu - 跨越多个数据中心的用RAM和快速固态驱动器(SSD) - 甚至可以在备份和灾难恢复中发挥作用。

(于9月28日更新:Cloudera今天正式宣布Kudu,几天拒绝评论这个故事。完整的新闻稿在这里。kudu上的博客帖子在这里。专门的kudu网站在这里。这是一个学术论文。最后,kudu的公共测试版现在在github上生活。)

然而,Cloudera选择了kudu,很明显,该软件对公司来说是一大速度,而不仅仅是公司努力超越其他Hadoop供应商,而且还在其追求中成为企业软件的着名球员。

不是那个Cloudera是没有人。根据最近的估计,它的价值近50亿美元,它从英特尔相当备份,它已经将自己作为一个竞争对手定位在更大的数据库公司,如IBM和Oracle。但事实是,Hadoop供应商Hortonworks去年公开后,Hadoop供应商Hortonworks也获得了信誉,而Hadoop公司Mapr也仍然存在。

Cloudera最近对崛起的Apache Spark开源大数据处理框架翻了一番,但Spark是Cloudera多年来一直在努力的。几个月前,Cloudera在去年收购Datapad之后将新的Python能力带来了Hadoop。那些是重要的努力,但Kudu是一个完全是新的东西,可以让公司新鲜度的新鲜感,因为它发展到首次公开发售。

那么kudu是什么?

这是“差距为扫描的原始HDFS”,同时“几乎与HBase一样快速访问”,根据kudu的设计目标的演示。但是Kudu并不意味着替代HDFS或HBase。“仍然存在这些系统将是最佳的,并且Cloudera将继续支持和投资它们,”幻灯片说。

根据另一个幻灯片,kudu可用于时序数据或实时报告或模型建筑物。

值得注意的是,Kudu不是用于拉动特定数据的SQL查询引擎。Cloudera为此有了巨大的影响力,其他人为此而兴奋地蜂拥而至。根据幻灯片,Kudu与Impala有“早期融合”,火花支撑即将来临。

Kudu应用程序编程接口(API)与Java合作 - Hadoop的公共语言 - 以及C ++。kudu的架构允许根据一个幻灯片进行站点的操作。这使得它与谷歌的扳手和扳手鼓励的蟑螂相当。这可能使kudu成为希望在世界各地储存大数据的大公司的最佳选择。

虽然是kudu良好的,但是吗?还没有。

幻灯片说:“寻找贝加客户”。