目前的“大数据”和“API-IFICACE”趋势可以将其根部追溯到18世纪第一次创造的定义康德。在他对纯粹原因的批评中,康德在分析和合成真理之间制作了一种二分法。

考虑到声明所提到的对象的潜在模型或公务化,分析真理是可以从逻辑参数派生的。鉴于算术规则,我们可以说“2 + 2 = 4”而不将两个东西旁边放在其他内容旁边,并计算共有四个。

另一方面,一个合成真理是一个声明,其在没有获得经验证据或外部数据的情况下无法确定无法确定的声明。没有经验数据,我不能让我的网页添加五个入站链接将增加唯一访问者的数量32%。

在这静脉中,大数据的兴起和对新领域和行业的程序界面的扩散已经改变了我们解决问题的方式。从根本上,我们从创建新的分析模型并推出新发现,以创造通过合成方式解决同样问题的基础设施和能力。

直到最近,我们使用分析推理来推动科学和技术进步。我们的重点是1)创建新的公理和模型,或2)使用预先存在的模型来派生新陈述和结果。

在数学中,当数学家有“AHA”时,我们的最大成就是制造的。导致新的公理或从预先存在的规则派生的新证据的瞬间。在物理学中,我们专注于寻找新的法律,我们从中衍生出新的知识和知识。在计算科学中,我们开发了新型号,用于计算我们能够从中获得关于可计算的本质的新陈述。

计算机系统和网络的相对近期发展诱导了从分析到合成创新的转变。

例如,我们如何寻求了解网络的“物理”与我们如何寻求了解夸克或琴弦的物理学意义。在Web排名中,科学家不试图发现关于链接和页面的连接的公理,然后导出定理以获得更好的搜索。相反,他们采用合成方法,收集和合成上一下“单击”流“并链接数据以预测未来用户将需要看到的。

同样在亚马逊,没有“电子商务法则”管理,他们购买了消费者的行为。相反,我们从根本发出的负担中删除了自己的负担,并了解结构(甚至对这些结构的存在),并使用先前事件的数据来优化未来事件。

谷歌和亚马逊作为从分析转移到合成问题的早期例子,因为它们的产品存在于数字介质中存在的数据之上。从创建数据的一切,到存储数据,最后到接口科学家用来与数据进行交互,都是数字化和自动化。

数据科学和基础设施的早期先驱开发出高吞吐量和低延迟架构,从艰难地“阶段功能”驱动的分析见解,而是产生逐步,但可预测的合成创新和洞察力。

在我们可以将综合方法应用于新字段之前,必须发生两个基础设施步骤:

1)底层数据必须以数字形式存在

2)从数据到科学家的堆栈必须自动化。

也就是说,我们必须自动化输入和输出过程。

关于第一个,我们目前正在看到对数字化新数据集进行积极的追求。创新努力的公司,EngloTe,举例说明了这一趋势。使用蓝牙4.0,EnglictoTe现在在明确定义的微环境中收集用户特定的物理数据。将此应用于商务,他们正在为砖和砂浆零售商建立亚马逊的数据。

有变形的,我们远离一天我们的智能手机自动指示我们,在商店,我们之前查看的项目。

同样,NBA中的每个团队都采用了运动潜行的摄像机,以跟踪每个玩家(和球)微秒的位置。通过这一点,我们已经看到了先前的分析模型的崩溃。当他质疑和解构我们在阳性五种不同位置类型的假设时,最近收到了新闻报道的朋友Muthu Alapagan。我们必须备份我们的假设,即篮球本质上有五位玩家类型的结构?这些假设来自哪里?他们有多正确?同样,休斯顿火箭队使传统的球控制意识形态将成功地推出三分试图的记录数。

最后,在经济学中,我们不再依赖于缺陷的传统微观经济公理,从而推翻宏观经济理论和预测。相反,我们看到了经济学,在经济学的实践和研究中发挥了一切越来越越来越大的作用。

切向来,最近数字货币的激增可以被视为这种趋势的必然结果。实际上,比特币可能代表完全数字化金融体系的早期局,我们基本的金融掘金,我们与数字形式根本上存在。

我们不仅在收集新数据时看到非常重视,而且很重要,而且很重要,而且在存储和自动化这种数据的可行性方面。在山谷中,我们开玩笑了如何术语“大数据”是松散抛出的。在数据大小或数据库类型方面,观看“大数据”可能更有意义,而是因为我们从分析转向综合问题解决时,这可能是必要的基础设施演进。

大数据单独无意义;相反,随着我们改变我们解决问题的方式,它是一个副产品和一个结束的手段。

生物技术的重新出现,或生物科技2.0,是新采购数据集顶部自动化程序的创新的一个很好的典范。像转录人这样的公司正在制作机器人全自动潮湿的实验室,而Teselagen和Genome编译器正在为生物学家提供CAD和CAM工具。当生物学家完全从移液器和传统实验室工作中除去生物学家和传统的实验室工作时,我们不远。下一代生物学家可能会很好地使用编程界面和抽象的模型,因为计算生物学包围的全部化生物学 - 驾驶传统上是一种对高吞吐量低延迟合成数据科学的分析真理寻求探险。

从根本上说,我们看到我们如何接近问题的转变。通过从知识分子中移除自己,也许是积极结构和公理的哲学负担,我们不再依赖于阶段功能驱动的分析洞察。相反,我们看到广泛的基础设施采用,以加速综合问题解决的采用。

传统上,这些技术被限制为计算机科学的子域 - 人工智能和信息检索被视为有形的例子 - 但随着我们将新的数据集和构建必要的自动化,我们可以在完全新的领域使用合成应用程序。

Marc Andreessen在2011年文章中争论了“软件正在兴趣”。但是,随着我们更深入并更好地了解软件,API和大数据的性质,它不是单独的软件,而是软件与数字数据集和自动输入和输出机制相结合,将全球作为数据科学,自动化和自动化输入和输出机制。软件加入转换我们的问题解决能力 - 从分析到合成。

Zavain Dar是Eric Sc​​hmidt的创新努力的风险资本家。在加入创新之前,他是在Discovery Engine的早期员工,由Twitter获取的下一代关键字搜索引擎。在那里,他在专有的分布式系统框架上设计了机器学习和数据科学算法,以构建Web比例排名算法。他也是Fountainhop的创始人,是第一个超地社交网络之一。在那里,他在2010年开发产品和监督全国大学发布的产品。把你的想法送给他@zavaindar。