数据科学家不必花费大部分时间做咕噜声的工作:让数据准备好对雇主产生差异的分析。他们应该能够提出酷的新想法值得评估。难怪投资者正在跳过全部跳过自动化数据清洁工作流程的部分。

今天,这一市场的最热门初创公司Trifacta宣布了2500万美元的资金,继其仅仅六个月前揭示了1200万美元。

Trifacta希望在许多业务上成长并获得其软件,因此在一个大量的投资者中占据投资者,Cofounder和首席执行官Joe Hellerstein在接受Ventbeat采访时表示。

“这是一个有吸引力的报价,”Hellersein说。“只要走开,因为我们可能会少于说的是肯定的,因为我们可以。”

资金新闻在TAMR之后抵达一个星期,这是一个结合自动化和人类智能的创业,以加速整合不同类型的数据的过程,超过1600万美元的风险支持。

Trifacta坐在Hadoop开源软件的顶端,而不是专注于许多大公司使用的数据仓库,而不是专注于许多大公司使用的数据库,而是坐在Hadoop开源软件的顶部。它提供了一种可视界面,用于显示在数据实际处理之前在Hadoop中执行的数据转换脚本的预览。Trifacta根据以前的交互和摘要摘掉写脚本的艰巨任务来记住用户偏好。

以上:Trifacta的用户界面。

图像

这是公司内部许多人可以使用的软件,如果他们想要分析坐在Hadoop中的数据,通常会太复杂,无法与之合作。

而不是与遗留供应商的软件竞争,以提取,转换和装载软件 - 甚至Tamr - Hellertein相信Trifacta反对维护人团队的实践来清理数据。Hellersein说,仍然启动Paxata展示了竞争风景。

Trifacta的客户包括洛克希德马丁和累积的健康。

基于旧金山的三乳酸开始于2012年,现在有35名员工。迄今为止,启动已达到4130万美元的资金。点火合作伙伴带领新一轮。Accel Partners和Greylock Partners也参加了。英特尔支持的Hadoop分销供应商Cloudera于3月宣布与Trifacta合作。

Trifacta的软件没有令人眼花缭乱的可视化,而是选择可以给人们对数据列内部的基本直方图的基本直方图,如果一个人执行某种柱子的调整,则会发生什么。这可能会让人们令人惊讶的是,他们期望很多数据可视化着想要的杰夫赫尔作为一个Cofounder。

Heer是华盛顿大学计算机科学教授,指导大学的互动数据实验室,该数据实验室开发了D3.JS JavaScript库,用于数据可视化。

Trifacta一直“试图确保我们非常适合任务的可视化,”Hellersein说。但是,在未来,更多的视觉刺激可视化可能会在路上。

“我认为随着产品的发展,正如我们正在进行更多功能,我认为,最肯定的是,最肯定的是,与他们一起,”Hellersein说。

Trifacta还可以扩展其超越Hadoop的焦点,并为处理大量数据的其他平台添加支持。也许它将支持数据仓库内的数据转换。或者它可以与开放源流程处理软件风暴集成,因为靠近上周在VentureBeat的Datapeat会议期间暗示了。

“它真的是一个企业问题,而不是技术问题,”海尔斯坦说。