大数据中的3个大问题(提示:他们都涉及人)
Gurjeet Singh是帕洛阿尔托大型数据分析公司Ayasdi的联合国。
分析师估计,在2013年的大数据投资将花费340亿美元。显然,我们认为数据持有巨大的潜力。不幸的是,随着大多数企业在较新的套餐中申请解决问题时,我们无处就可以解锁其潜力。我们肯定有利于储存和处理数据的能力。抱着我们回来的是人们的问题。
我们必须解决三个文化问题,以解锁数据的潜在潜力:数据孤岛,缺乏数据科学家和数据科学家和商业用户之间的障碍通信渠道。
1.数据筒仓
在大多数企业中,功能区域生成的数据最终是该组的属性。这导致了两个问题。首先,难以获得数据的“完整”视图。考虑保存数据的所有孤岛和系统:CRM,票务,错误跟踪,履行等获取所有相关系统甚至互相交谈是一个巨大的挑战。其次,组织内有重大的文化解剖。通常,控制数据筒仓的每个组最终有关他们的权力和在部门的位置,而不是整个组织的成功。组织需要汇集他们的数据以查找答案并获得其数据的完整视图。
2.数据科学家
典型的企业通常比分析师或数据科学家更多的IT员工。分析过程从一系列业务请求开始。它收集来自各种数据库的数据并将其传送给数据科学家。大量的数据科学家部署了几个月(或有时年)查询数据的人。招聘数据科学家(统计数据,计算机科学和一些功能专长)加速过程很难,因为这些技能的人非常稀缺。数据科学家的需求和兴趣是暴涨,因为谷歌趋势可以证明,而我们正在制作更少的趋势。我们需要的是一类新的技术,扩大了影响数据科学家,并允许更多人成为数据科学家。
3.沟通
最后,充分实现数据科学潜力的最大障碍是数据科学家和商业用户之间缺乏沟通。换句话说,数据科学家和商业用户之间的分析差距如此之大,即使传达见解也造成问题。任何没有意识到的任何事情都经常被持怀疑态度,或者不完全理解,商业用户可以导致错过机会。数据科学家和企业用户需要对齐,更紧密地工作,并建立信任来解决业务问题。
结论
我们必须解决这三个问题。我们需要:
向每个人开放数据并分解数据孤岛,放大数据科学家的生产力,通过自动化进行更多,做出更多协作文化,允许商业用户和数据科学家更有效地沟通。结果是值得的。
[编者注:Gurjeet Singh今天在Redwood City的VidtureBeat的Datapeat会议上发表演讲。Databeat今天和明天;赶上会议其他会议还为时不晚。]