你可能没有意识到它,但Twitter的数据的原始Firehose是一个非结构化的乱七章,转发,哈希特,Snark混淆为机智,遵循活动等等。幸运的是,社交数据处理启动数据速度可以完全访问Twitter的管道,以及新的4200万美元的资金,以将所有数据整理为更美丽和高效的东西。

如今,DataSift推出了一个用于实现自定义参数的系统,以在推文中查找。(想想推文的高级Gmail邮件过滤器,除了这些过滤器可以接受培训,以便在推文中培训和识别每一块唯一数据。)该技术称为VEDO,负责从非结构化格式转换数据的大量提升到结构化。从那里,业务分析师可以创建可视化或将清理的推文与内部公司数据对齐,以获得新的见解。

该想法是帮助客户更快地在大量非结构化数据中应用机器学习,该数据在与Venturebeat采访采访时,Datasift创始人和CTEN Nick Halstead表示。

并不认为新功能不是新技术的新技术。客户一直在要求他们,Halstead补充道。

为帮助公司开始,数据播放正在提供一个可以帮助制作推文的示例分类器库。例如,在演示中,Halstead显示了一个分类器如何在一组车型上绘制到P OUT授权的推文。

“很多企业肯定没有这种知识,”他说。“他们可以利用我们的预先构建的分类器图书馆。”

事实上,公司拥有现有的企业客户服务,包括CBS互动,戴尔和百胜品牌。

数据幅度已经走了很长的路,因为它开始使用Twitter来销售2011年推荐的Firehose的访问。它已成为公司希望分析以了解客户,竞争对手和评论员在思考的思考的众所周知的数据供应商。但该公司对该地位不满意。

DataSift现在正在超越它只是社交网络数据,它是关键提供商。

“你可以想象这个平台是不可知论的,我们将很快开放,能够通过数据播放的任何一个非结构化数据的能力,”Halstead说。换句话说,DataSift打算成为解释各种杂乱数据的服务提供商,而不仅仅是一个智能分层的数据供应商。

用户界面不花哨。响应用户查询,数据在命令行中送达数据,然后它可以被推入数据库。Halstead表示,该公司正在努力使工具以更具视觉格式访问。随着公司转向接受更多数据输入,升级应该是对话的更大部分。

Halstead说,该技术归结为新的编程语言。他说,它是处理和理解数据的“一个重要的起始块”。与此同时,更大的图景显示了一家公司开始整个新方向的公司。