2014年大数据的状态(图表)
在图表蓬勃发展的大数据生态系统中,我已经追求了近两年了,这是该空间中令人难以置信的活动。更新的图表很长期逾期,在这里(单击全屏选项放大):
编辑注意:Venturebeat在今年5月18日至19日在旧金山的即将到来的Databeat会议上举行了这些公司的最佳佳肴。
大数据景观V 3.0 - Matt Turck(Firtmark)来自Matt Turck关于此修订图表的一些想法,以及一般的大数据市场,主要来自VC视角:
变得拥挤:企业家已经涌向了空间,VCS已经将钱倒入有前途的初创公司,因此,市场开始变得拥挤。某些类别如数据库(nosql或newsql)或社交媒体分析是否会陷入整合或某种抖动(可能已经在社会分析中启动了Twitter的Bluefin和Gnip)。
虽然将始终出现巨大的新初创公司的空间,但似乎在这个阶段已经在更广泛的基础设施和分析段中进行了许多早期投注,并且成功的酒吧变得更高 - 这并不意味着VC金钱将停止涌入。就这个特定的行业图表而言,我们显然达到了我们如何融合一页的公司的限制。我相信有许多伟大的公司,我们要么错过或没有足够的空间来包括 - 提前道歉,我很乐意听到人们的思想和建议关于其他人应该是谁的意见部分包括。
还早:总的来说,我们还在这个市场的早期局。在过去的几年里,一些有前途的公司失败了(例如:绘制的规模),一个数字看到早期出口(例如:Provog,先前知识,幸运的排序,Rapraeaf,Nodable,Karmasphere)和一个少数意义更有意义的结果(例如:Infochimps,Causata,Streambase,Paraccel,Aspera,Gnip,Bluefin Labs,Bluekai)。
与此同时,一些公司似乎达到了重大规模,并提高了壮观的金钱(例如,MongoDB现在筹集了超过$ 230M,Palantir近900米,Cloudera $ 1b)。但总的来说,我们仍然在成功的IPO(偶然的Splunk或Tableau)和大的出口方面仍然在曲线上,尽管大公司在空间中获得了更多收获(Oracle Bluekai,IBM,带有阴伞的IBM)。在许多细分市场中,初创公司和大公司都是争吵的位置,没有出现明显的领导者。
炒作,满足现实:几年陷入了一个令人难以置信的炒作,是大数据还是一件事吗?虽然大数据变得越来越缺乏值得的,但接下来的几年对于这个市场来说将是非常重要的,因为公司开始从实验到全部生产的项目。虽然这些部署将导致一些大数据供应商的收入迅速增加,但他们还将测试大数据是否可以真正提供其承诺。同时,随着数据的洪水不断加速,部分地通过快速新兴的互联网行业供电,大数据技术的基本需求不断增加。
基础设施:Hadoop似乎已经巩固了它作为整个生态系统的基石的地位,但仍有许多竞争分布 - 这可能需要进化。Spark,一个在Hadoop分布式文件系统顶部构建的开源框架,现在正在逐渐嗡嗡作响,因为它承诺填写Hadoop弱,即交互式速度和良好的编程接口(以及早期符号的地方似乎要履行这一承诺)。一些主题(例如,在内存或实时)继续成为头脑;其他人出现(例如,有全面新一代的数据转换/颈枪,包括Trifacta,Paxata和Dataatamer)。
另一个关键讨论是企业数据是否真正移动到云(公共或私人),如果是的话,多快。许多人会争辩说财富500强公司将在未来几年内保留其数据(以及软件)的数据;一代Hadoop-in-in-in-cloud-in-cloud-in-cloud-in-in-cloud-in-thegbole等)将争辩说所有数据都会长期移动到云。
分析:在启动和VC活动方面,这是大数据生态系统的特别活跃的段。从电子表格型接口到时间轴动画和3D可视化,启动提供各种不同的分析工具和接口,而现实是不同的客户将具有不同类型的偏好,因此可能有许多供应商的空间。上市战略也有所不同。一些初创公司专注于向数据科学家销售工具,这是一个仍然很小但在数量和预算中增长的小组。其他人采用相反的方法并出售自动化解决方案,目标是企业用户,完全绕过数据科学家。
应用程序:正如预测的那样,该动作一直缓慢但肯定地移动到大数据的应用层。该图表突出了许多由大数据工具和技术(肯定不是详尽的列表)的令人兴奋的启动。一些提供水平应用 - 例如,大数据供电营销,CRM工具或欺诈检测解决方案。其他人使用垂直特定应用中的大数据。财务和广告技术始终是采用大数据的早期领导者,甚至叫做大数据。渐渐地,使用大数据正在向更多的行业传播,例如医疗保健和生物技术(特别是基因组学)或教育。这仅仅是个开始。
[许多人感谢我的Firstmark同事德安董,在这个图表上做了很多繁重的举重。我的前同事Shivon Zilis of Bloomberg Beta贡献了此图表的先前版本。]
Matt Turck是Firstmark Capital的合作伙伴。他也是数据驱动NYC的组织者,是该国主要的大数据每月活动之一。在@mattturck的推特上跟着他。