LDV Vision峰会在几周前举行的纽约,专注于计算机愿景的高潜力区域。它从3D成像和VR到深入学习和Facebook Live涵盖了所有内容(我甚至给了增强现实广告的演示文稿),我走到了深信,这是我们所有人 - 创造者,工程师,营销人员和投资者的领域应该留注意。以下是以下原因:

就像有东西的互联网一样,我们将有一个眼睛互联网

随着几周前LDV Vision峰会的LDV峰会创始人Evan Nissels在LDV Vision峰会的介绍性讲话中,越来越多地,连接的摄像头和视觉传感器越来越多地。无处不在的视觉记录和与实时大数据的连接的组合已经导致更智能的建筑物,可以根据人们的运动调整能量设置。它也将导致更智能的家园,说,如果您的镜子将能够分别为您提供重量或喝多少酒精,并且由于内置的​​3D扫描仪和气体传感器,您可以告诉您。

当然,一旦发生这种情况,上下文“镜面”广告将让您从浴室中购买低卡路里的食物和阿司匹林,并在几分钟内送货。

电脑愿景不只是看看我们所看到的

我们在这一领域的人知道图像识别 - 计算机将图像分解为像素的过程并识别模式,以便“看到”它们中的内容 - 不是计算机视觉中唯一的东西。计算机愿景依赖于实时访问大数据,地理位置,传感器,超声和其他类型的视野,如热成像,这让计算机“看到”人类看不到的东西:天然气和热量,例如。

计算机愿景的承诺是超越加工大量图像,以快速识别人类已经看到的东西:这真的是人类看不到的。通过增强记忆(一旦通过下一个Google Google玻璃型器件留下了关于一个人的名称和其他相关信息,通过下一个Google Google玻璃型器件,“看到”气体泄漏,计算机愿景将使超人从多个渠道实时感知。

我们还没有那里。作为Serge Ipplie,Cornell Tech的计算机愿景教授,“如果你看看电脑愿景的最先进,我们并没有告诉人们他们不了解图像的东西。我们告诉人们在一张照片中有一个香蕉和自行车。“是的,这是进步,但是计算机愿景可以在未来的照片中提取更多。

如果我们无法获得足够的培训数据,我们将摊位

图像识别的进展和能力现在可以感谢深度学习神经网络和更便宜的计算能力改变了游戏,但除非他们可以访问训练的阵容和图片数据的射程和射程,否则这些辉煌的算法都没有任何东西。从医学图像面临拥抱,绝大多数可用于培训数据的图片是专有的,并在两个庞然大物手中:谷歌和Facebook。考虑到在这些公司的消费平台上进行的共享和上传量,这种趋势显示出没有减速的迹象。正如Greylock Partners'Josh Elman在舞台上的采访中提醒我们,如果两个大公司持有所有培训数据,那么计算机愿景是计算机愿景的潜在障碍。

VR和AR需要计算机愿景

有些人认为虚拟现实(VR)和增强现实(AR)目前已经过度炒作,电脑视觉努力投入这些技术是浪费能量。但是,我与我谈过的大多数人都相信VR和AR都在这里长期,而且为了推进,他们需要高质量的计算机视觉功能(例如使用图像识别来提高“互动”形式VR)。

许多人在今天的互联网在90年代中互联网上的地方比较:也许尚未成为一个主流和可批准的现象,而是将被广泛采用的主要现象。计算机愿景越多,其能力就越越多,将人们吸引到VR和AR,使货币化更加实用。毕竟,宜家书架的逐步指示手册有多好,没有准确的计算机愿景告诉你你在错误的地方使用错误的螺钉?

计算机愿景已经增加了人性化的安全性

除了深度学习和艾,其他大型技术潮流这些日子是机器人。并且,是的,大多数机器人需要(并且需要)计算机愿景从拒绝到装配线检查 - 例如,使用图像识别以比人类更快,更精确的方式在计算机存储器晶片中寻找不完美的方式能够。

但即使对于小企业和消费者而言,机器人帮助是以碳机器人的katia形式的方式,一个5,000美元的机器人手臂,使用计算机愿景来确保它不会杀死人(机器人手臂事故没有笑声)。根据碳机器人,5,000美元或更少是制造机器人臂主流的门槛,这可能是为什么碳机器人在LDV赢得第2天的商业挑战。

LDV Vision峰会证实,这些仍然是计算机愿景的早期几天,但目前的创新在商业水平和更广泛的社会层面上都有光明的未来。它还证实,对于年轻工程师来说,还有更多的机会,成为一个令人兴奋的,更改的剧本行业的一部分。

Ken Weiner在In-Im-Im-In Ad Platform Gumgum中是CTO。