消息人士称，Cloudera正在建立一个名为Kudu的新开源存储引擎

Big Data Company Cloudera正在准备推出专业的新开源软件，用于存储和服务许多不同类型的非结构化数据，有目的是在数据库业务中挑战重量级，Venturebeat已经学会了。

kudu存储引擎是替代广泛使用的Hadoop分布式文件系统和Hadoop导向的HBase NoSQL数据库，根据Kudu的设计目标的副本，借用来自Kudu的设计目标的副本。该技术将作为Apache许可的开源软件发布，幻灯片显示。

Cloudera在过去的两年里，它的早期员工领导着一支小组致力于Kudu，而该公司在本月底的开放源发布之前已经开始向客户推销软件，这是一个熟悉的据说Venturebeat。

这个来源和其他人认为kudu可能对来自Teradata和IBM的Puredata（以前Netezza）和其他供应商的数据仓库提供了新的威胁。据源代理说，它也可以用作可以处理大量并行处理（MPP）工作负载的高度可扩展的内存数据库，而不是与HP的Vertica和VoltDB不同。有一天的kudu - 跨越多个数据中心的用RAM和快速固态驱动器（SSD） - 甚至可以在备份和灾难恢复中发挥作用。

（于9月28日更新：Cloudera今天正式宣布Kudu，几天拒绝评论这个故事。完整的新闻稿在这里。kudu上的博客帖子在这里。专门的kudu网站在这里。这是一个学术论文。最后，kudu的公共测试版现在在github上生活。）

然而，Cloudera选择了kudu，很明显，该软件对公司来说是一大速度，而不仅仅是公司努力超越其他Hadoop供应商，而且还在其追求中成为企业软件的着名球员。

不是那个Cloudera是没有人。根据最近的估计，它的价值近50亿美元，它从英特尔相当备份，它已经将自己作为一个竞争对手定位在更大的数据库公司，如IBM和Oracle。但事实是，Hadoop供应商Hortonworks去年公开后，Hadoop供应商Hortonworks也获得了信誉，而Hadoop公司Mapr也仍然存在。

Cloudera最近对崛起的Apache Spark开源大数据处理框架翻了一番，但Spark是Cloudera多年来一直在努力的。几个月前，Cloudera在去年收购Datapad之后将新的Python能力带来了Hadoop。那些是重要的努力，但Kudu是一个完全是新的东西，可以让公司新鲜度的新鲜感，因为它发展到首次公开发售。

那么kudu是什么？

这是“差距为扫描的原始HDFS”，同时“几乎与HBase一样快速访问”，根据kudu的设计目标的演示。但是Kudu并不意味着替代HDFS或HBase。“仍然存在这些系统将是最佳的，并且Cloudera将继续支持和投资它们，”幻灯片说。

根据另一个幻灯片，kudu可用于时序数据或实时报告或模型建筑物。

值得注意的是，Kudu不是用于拉动特定数据的SQL查询引擎。Cloudera为此有了巨大的影响力，其他人为此而兴奋地蜂拥而至。根据幻灯片，Kudu与Impala有“早期融合”，火花支撑即将来临。

Kudu应用程序编程接口（API）与Java合作 - Hadoop的公共语言 - 以及C ++。kudu的架构允许根据一个幻灯片进行站点的操作。这使得它与谷歌的扳手和扳手鼓励的蟑螂相当。这可能使kudu成为希望在世界各地储存大数据的大公司的最佳选择。

虽然是kudu良好的，但是吗？还没有。

幻灯片说：“寻找贝加客户”。