是时候照顾我们堵塞的数据管道了
我一直在研究大十年内的大数据和分析,我的重点一般一直是这个惊人资源提供的商机。如何大数据和分析转换营销,金融,人力资源,产品开发等?公司如何与这些工具更有效地竞争?
这种对机会的关注令人诱惑,但每一个所以通常你必须在封面下看看使这些激动的成就成为可能。这就是我们今天在今天的情况。
从各种大数据源中提取和集成数据的难度已成为组织无法忽视的问题。
这是业务分析的肮脏小秘诀 - 它通常需要更多的能量来提取,清洁和整合数据(最近纽约时报文章称为“Janitor Work”的一项精细类比,但我更喜欢“管道”整体)除了分析它。
看起来,即使是小数据,也不容易将必要的数据环境放在一起。但是具有大数据 - 涉及来自多个来源的数据,每个数据都有问题属性 - 这个问题已成为房间里的大象。
事实上,我认为所有这些数据准备管道活动是缺乏对大数据缺乏复杂分析的主要原因,“大数据=小数学”现象,我和他人已经观察过。在进行所有选手工作后,仍然没有足够的时间或能量来分析通过高级分析的数据。
有时这样,组织需要不仅投入能源不仅要大量的数据机会,而且还要改善管道。我们的数据管被堵塞,他们阻止了商业机会的水流动。数据科学家可能有助于治疗癌症,或至少交通堵塞,他们正在消费所有时间去除异常值,匹配钥匙,并处理缺失的数据。
好消息是,越来越多的新工具来加快数据管道的生产力和有效性。强大的方法,如机器学习,加速分析也可以加快数据准备和策策。就像任何水管工一样,你不想把一个单一的工具带到工作站上。相反,数据科学家应该可以访问各种工具,并准备好将正确的工具用于手头的任务。
我将在10月1日晚上12:30讨论对Ventbeat网络研讨会中的解决方案和一些可用工具的需求。美东时间。网络研讨会由Tamr赞助,我建议的一个大数据“管道工助手”。我希望你能加入我讨论这个重要的话题为大数据的未来。
我们没有什么可失去但我们的堵塞。
汤姆达文波特在巴佛松学院和哈佛大学,哈佛商学院,芝加哥大学,德克萨斯州德克萨斯大学奥斯汀大学,哈佛商学院和哈佛大学商学院和哈佛大学的杰出商学院教授了业务管理。他还在埃森哲,麦肯锡和公司,安永竞技场和CSC方向进行了研究中心。他的最新书籍大数据在工作中,今年早些时候发布。