未来的大数据分析师将知道您今天所做的一切
辩论正在肆虐大数据是否仍然拥有预期的承诺或是否只是一个大萧条。自2011年8月以来,巨额估计的谷歌流感趋势的失败预测了峰流感水平,提高了这一问题。
在我的脑海中,毫无疑问,数据分析将有一天会有助于改善医疗保健和犯罪检测,设计更好的产品,提高交通模式和农业收益率。我的担忧是关于我们有一天如何使用我们收集的所有数据 - 以及它将揭露的骷髅。想想DNA技术如何用于释放几十年前被错误监禁的人。想象一下,未来的超级计算机将能够与当天数据收集者尚未学习使用的数据来做什么。
在几个世纪上,我们收集了气候,人口统计学和商业和政府交易等事物的数据。我们的农民一直追踪天气,以便他们知道何时种植庄稼;我们有土地记录,以便我们拥有财产;我们开发了电话簿,以便我们能找到人们。大约15年前,我们开始在互联网上创建网页。有兴趣的各方开始收集关于我们阅读的新闻的数据,我们购物的地方,我们冲浪的哪些网站,我们听到的音乐,我们观看了什么电影,以及我们旅行的地方。随着LinkedIn,MySpace,Facebook,Twitter和许多其他社交媒体工具的出现,我们开始志愿私人信息有关我们的工作历史和社会和业务联系以及我们喜欢的东西 - 我们的食物,娱乐,甚至是我们的性偏好和精神价值观。
如今,数据以指数增加的速率累积。每分钟上传到YouTube有超过100小时的视频,甚至更多视频正在全球范围内通过您在各处看到的监控摄像机收集。手机应用程序正在跟踪我们的每一个运动:到处都是;我们动的速度有多快;什么时候醒来。很快,我们佩戴或内置于我们的智能手机的设备将监控我们的身体的功能;我们的测序DNA将显示您的身体的软件配方。
NSA一直在挖掘我们的电话元数据和偶尔倾听;营销人员正在关联有关我们性别,年龄,教育,地点和社会经济地位的信息,并使用这促销更多信息;政治家和政治家正在微调他们的竞选活动。
这是婴儿的东西,相比前方的东西。用于分析数据的可用工具仍然是原油;有很少的数据科学家;谷歌等公司仍然没有PD,以什么是要分析的最佳数据。随着人工智能技术的发展和计算机变得更加强大和连接,这肯定会迅速变化。我们将能够分析我们从一开始就收集的所有数据 - 好像我们进入数据时机。
我们将重新审核过去,重新审计纳税申报表,追踪腐败,以及学习谁是真正的英雄和恶棍。一个人工智能的Cybercop扫描收集的所有相机数据,以及城市或一个国家的电话记录,电子邮件,银行账户和信用卡数据以及医疗数据,将立即解决犯罪比Sherlock Holmes可以。我们的孙子们会知道我们犯下的罪;初级可能会想知道为什么爷爷对奶奶不忠。
什么是可怕的是,我们将失去我们的隐私,为新型犯罪和欺诈开辟大门。各国政府和雇主将更多地控制我们,并将公司从我们无辜地移交给他们的信息中获得更大的利润。更多数据和更多的计算意味着更多的金钱和权力。看看华尔街的银行家已经获得了高频交易以及他们如何从金融体系中掠过数十亿美元的优势。
我们肯定需要更强的法律和技术保护。我们需要意识到危险。我们还必须认识到,通过我们的错误,既不是隐藏 - 甚至过去都没有。
这个新的数据中有很多机会。
如果我们将关于一个人的基因组,生活方式习惯和位置与他们的病史和他们所采取的药物相关联的信息,请考虑可能的可能性。我们可以理解药物的真正有效性及其副作用。这将改变药物测试和规定的方式。然后,当基因组数据变为数亿人时,我们可以发现疾病和DNA之间的联系,以使个性化药物开放到辛酸的DNA。我们正在谈论健康和医学的革命。
在学校,课程通常是如此之大,老师不了解学生 - 特别是孩子的其他课程,习惯和发展。如果数字导师可以跟踪孩子的进步,并学习他或她的喜欢和不喜欢,教学风格的偏好以及智力的偏好以及弱点怎么办?使用数字学习设备收集的数据,考试成绩,出勤和习惯,可以了解学生专注于哪些学生,并如何最好地教育逗留孩子。这可以改变教育系统本身。
结合人们在一个人的购物习惯上提供的数据,了解他们的社交偏好,健康和地点。我们可以拥有购物助理和个人设计师,创造新产品,包括衣服,这些产品是用于近三种印刷或定制的。基于人工智能的数字助理可以预测一个人想要穿什么或吃东西,并为他们做好准备。
所有这些方案都将成为可能,而其他数千人在农业,制造,运输和其他领域中的其他数据应用。我们唯一的问题是我们能够快速到达 - 我们将创建新的噩梦。
Vivek Wadhwa是斯坦福大学的公司治理岩石中心的研究员,该公司在Duke的工程学校和杰出学者的尊敬和埃默型大学的创业和研究商业化中心研究总监。他过去的约会包括哈佛法学院和加州大学伯克利。