米歇尔周最近,当她向我展示了我的个性图,基于我的推文的抽样。IBM研究人员可以根据那个人的观看200所推文来教育猜测任何人的个性。

加利福尼亚州圣何塞的IBM Almaden研究中心研究,来自一个新的加速发现实验室,旨在获得大数据的见解。周可以以纪律和自动化的方式进行这个个性分析,为每个主题测量52种不同的个性性状。这种“心理语言学”分析可以证明希望以更亲密的方式理解客户的公司。但它也提高了隐私问题和其他问题。

我们与周完全谈话谈过那些结束。这是我们对该谈话的编辑成绩单。

VidtureBeat:你是如何首先开始用这个的?

米歇尔周:我一直在这个普遍的领域工作。之前,我正在处理智能用户互动 - 如何更好地了解用户的行为和用户的意图,因此您可以调整计算机以适应该计算机。现在,我们认为通过用户行为建模 - 点击,菜单移动,窗口交互。我在想,“我们不能比这一点更好?”我遇到了这个精神语言学分析的想法,我看到我们可以扩展到发展自己的技术,并获得对辛辛利的更深入了解。

三四年前,我们在许多以人为本的运营中开始了一个系列,从营销到客户服务到产品开发到人力资源。无处不在的挑战,他们希望了解辛勤人的理解。了解唯一的行为分析。Amazon.com是一个典型的行为分析示例。你读了什么或买东西。

许多人类在心理学,社会科学和行为经济学中的研究表明,人们的行为及其在现实世界中的决策过程受到称为其内在特征的严重影响。这些内在的特质包括什么激励您,您认为的,您的基本需求。思考它,非常难以想象 - 以传统的方式 - 如何学习某人的内在特征,除了标准的心理测量测试。你不能问一个客户的东西,“欢迎我的商店,你想参加个性测试吗?'更不用说展示了现实世界中数百万美元的客户。

VidtureBeat:我们在这一点上谈论公司或辛勤消费者的个性吗?

周:就像我说的那样,它是任何以人为本的操作。你想了解参与进程的人。它可能是公司的员工。例如,有人想要推进或发展他们的才能。你想了解这个人可以做些什么。此外,对于消费者公司 - 零售,消费品,服务等服务,如航空公司或酒店,他们希望将客户理解为傲慢,以便它们为辛辛格服务。

这里的挑战是,我们如何在规模上获得对辛辛利的理解及其内在特征?然后我们发现了两件事可以致力于我们的优势。部分是精神语言学分析。计算机可以从语言学脚印中获得人们的特征。这之前没有广泛适用,因为你在哪里得到那些语言脚印?现在,您可以通过社交媒体和数字通信来实现这一点。那些很容易获得,所以我们在那里看到了一个机会。

之前,精神语言学只应用于大五种人格类型 - 并不是基本人类价值观的其他特征,描述你的信仰和动机和需求。营销研究和行为经济学表明了有证据表明,有不同需求的人们会购买完全不同的东西。理想主义人们经常去有机食品,有机护肤。他们为他们的宠物买衣服。他们去寻求支持这一点的品牌。

该研究已经在科罗拉多大学和UT奥斯汀进行了完成。心理学家开发了一个类别词典,以预测人们对某些事情使用的话。幸福或沮丧的人使用不同的单词类别。您可以使用更广泛的单词类别来尝试预测某人坐在大五处。但是,这是不够的。例如,没有存在单词类别来预测值或信念。

VidtureBeat:例如,它似乎将相对容易地检测关键字和P兴趣 - 例如对游戏的兴趣。但人格部分似乎很难。

周:正确的。我们的方法来自心理测量研究。您设计了基于项目的心理测量研究,您可以获得很多人带走它们。与此同时,您还收集了他们的语言脚印。您可能会说,“描述您的需求”,然后我们使用统计建模与他们的语言学脚印中的单词与他们的心理学分数相关联。统计模型可以成为预测模型,用我们已经的字典,我们可以将它应用于其他没有考验的人。

我们想要做的另一件事,企业可以要求他们的客户选择in。用自己作为一个例子-maybe这是一个极限 - 我订阅了电子邮件列表。有时我会得到一些我真正想到的东西,但99%的时间我得到了与我想要的东西无关的垃圾邮件。在这种情况下,我可能愿意告诉一家关于我的公司 - 这就是我是谁,这就是我想要的 - 这可以帮助他们更多地向我发送更多关于我真正想要的东西。或者当我预订旅行和退房酒店时,我可能想知道更多关于我喜欢我的酒店。我可以看着yelp,但谁是那些人?他们还喜欢我吗?他们喜欢我喜欢的东西吗?有了这个,你可以根据像你那样的人的行为来了解更多信息。这是我们正在努力的本质。

我们仍然在研究阶段。我们正在使用我们的一些客户来验证我们在他们的领域的工作。我们非常兴奋的原因是,首先,IBM为我们提供了与许多客户合作的环境,其他公司可能无法访问。其次,这是一项广泛的工作,从心理学到社会科学到计算机科学。我们需要跨学科背景将此放在一起。拥有真正的世界验证将是伟大的。

VidtureBeat:这是一种大数据努力吗?你必须看几千人,数千条消息吗?

周:我们实际上并不需要大量的消息。我们已经完成了广泛的实验,发现来自给定人的大约200所推文 - 大约2500或3000字 - 是一个很好的代表性样本。这让我们在使用数千名推文中的约10百分位数内。这样做很好估计。但是,大数据方面是你必须看几百万人以使这个有价值的人。你有这么多的人,这么多的数据,你不能逐一去。

我抓住了在Twitter上搜索你的自由,并创造了一个你的个人资料 -

1 2 3 4查看全部