长石分享 | 构建出起作用的人工智能系统仍然很困难
长石资本    日期:2018-2-1    浏览:641

即使有像TensorFlow(TensorFlow,谷歌基于DistBelief进行研发的第二代人工智能学习系统,其命名来源于本身的运行原理。)或OpenAI (OpenAI, 2015年马斯克与其他硅谷科技大亨创造出的一个希望能够预防人工智能的灾害影响并推动人工智能发挥积极作用的非营利组织)一样的人工智能框架的支持, 与主流的网页开发相比,

在Kaggle(Kaggle主要是为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台)平台上,你可以通过解决现有的项目来赚一大笔钱。所以说对许多人而言,这是个非常好的切入点,但是仅仅这样并不足够来建立一项业务,因为你始终不能改变整个市场的机制。从商业角度来看, 人工智能只是对现有问题的另一种执行方式。可是客户并不关心这种执行方式, 他们只关心结果。这也就意味着在只使用人工智能的情况下你并没有真正地解决问题。当人工智能的热潮过去之后, 你必须清楚地向顾客传递并让他们真正了解人工智能的价值和意义。

虽然你的客户可能不关心人工智能,但风投会关心,而且新闻界也会关心的更多。这些注意力的不同可能会给创业公司带来比较危险的现实失真现象。但是不要被这种现象所愚弄,除非你创建出了通用的多用途人工智能,否则天下是没有免费的午餐的。即使你是风投的宠儿,你也必须帮助你的客户走到最后一步。所以现在就让我们踏上这个旅程,看看我们会如何为未来的发展做准备。

主流人工智能的列车

人工智能似乎不同于其他大趋势如区块链、物联网、金融科技等。当然, 它的未来是高度不可预知的,但几乎所有的技术都是这样。不同的是我们自我的价值主张似乎处于一种不稳定的状态。我们一直在审视我们所作出的决策和创意带来的价值,这个过程会唤起一种情绪反应,但我们其实并不清楚应该如何定位自己。

基础技术的数量是非常有限的,其中大部分可以归入“深度学习”这个总括术语的范围内,这些概念构成了几乎所有应用的基础,其中包括卷积和循环神经网络,长短期记忆网络(LSTM),自动编码器,随机森林,梯度提升等。
 
人工智能提供了许多其他的方法, 而这些核心机制最近已经显示出了压倒性的成功。大多数研究人员认为人工智能的进步是来自于这些技术的改进 (而不是来自于一些根本不同的方法)。因此我们称之为'主流人工智能研究'。
 
任何一个现实生活中的解决 方案都是由这些核心算法和非人工智能外壳来进行数据的准备和处理的 (例如数据准备、特征工程、世界模型等)。人工智能部分的改进往往会使非人工智能部分变得不必要。这可以说是人工智能的本质也可以说是它的定义------使那些对特定问题所付出的努力变的过时。但正是这些非人工智能的部分成为了那些以人工智能为驱动力的公司的真正价值主张,同时这也是他们的秘密武器。
 
每一次人工智能的改进都表明人工智能的竞争优势是开源的并且它可以被提供给每个人。像Frederick Jelinek曾经说过的那样:“每当我解雇一个语言学家时,语音识别系统的执行力就会上升。”
 
机器的学习基本上已经引入了减少冗余的下一个阶段:代码被简化为数据。几乎所有的基于模型、概率的规则的识别技术都早在2010年被深度学习算法淘汰了。
 
如今,人们只要用几百行脚本(加上一定数量的数据)就可以把破解领域专业知识、功能建模和数十万行代码。所以说这意味着专有代码在主流人工智能的列车道路上上已经不再是一种可靠的资源了。
 
重大贡献的发生频率其实是很小的。只有非常有限的一部分研究人员才有可能研发出真正的突破或新的发展, 甚至是一个基本组成部分的新组合。而这个产生贡献的内圈其实比人们所想象的要小得多 (肯定少于100个开发者)。
 
为什么会这样呢?从根本上来讲,或许是因为它的核心算法---反向传播所带来的效果。几乎每个神经网络都是用这种方法训练出来的。最简单的反向传播形式一点都不复杂,但在50年多的有趣而多彩的历史当中,只有少数人看到这幕之后对它的结构产生了质疑。
 
如果反向传播能像它今天如此的可见度, 那我们的生活可能会提前10年。
 
从20世纪70年代的普通神经网络到反馈神经网络(反馈神经网络是一种将输出经过一步时移再接入到输入层的神经网络系统)到今天的LSTM网络,这一系列进步在人工智能领域实属巨大的动荡。但它只需要几十行的代码。几代学生和研究人员通过数学计算了梯度下降, 证明了它的正确性。但最后他们大多人都说'这只是他们前进道路上的一种形式的优化',所以很显然分析式的理解是远远不够的,我们需要某种'发明家的直觉' 来做出区分和差别。

核心技术由业界的主要参与者在开源工具和框架中提供出来的。为了达到最新的水平,一些私有途径在逐渐消失。从这个意义上来说, 绝大多数人工智能公司都是这些核心产品和技术的消费者。

我们要去哪里?

人工智能(和所需的数据)已经和许多东西例如电力、煤炭、黄金相提并论。这表明在科技界人们是多么渴望来发现人工智能的模式或趋势,因为它的存在对业务或投资是至关重要的。
 
如果你已经踏入了人工智能列车,又由于人工智能技术已经开始向业务方向发展, 那么有几个重要的方面需要我们认真考虑。
 
首先,主流的人工智能研究列车将明显变慢甚至停止。这意味着没有更多的问题可以被解决。这也意味着我们将离开火车,不得不为客户走“最后一公里”。这对创业公司来说是一个很大的机会,因为他们有机会建立专有技术、创造可持续的业务。
 
第二是主流列车沿着它当前的轨道滚动,那可想而知, 摆脱这条道路或下车就更加困难了。在高速运行的情况下,个别的领域知识面临被大公司“开源”的巨大危险。过去的一切努力都可能是毫无价值的。目前,像AlphaGo LINK这样的系统除了开源框架所提供的标准(“vanilla”)功能外,还需要非常高比例的专有技术。如果我们在不久的将来看到具有相同功能的基本脚本,或许我们不会感到惊讶,但“未知的未知”是下一波可以解决的那类问题。自动编码器和基于关注的其他系统在未来是非常有希望的。
 
在下一个场景中,火车的速度会更快。最后也就是: “奇点来临”。亿万富翁们为此而奋斗。这里最后的游戏是人工的总智能。如果我们取得了它, 所有的赌注都将取消。

最后,这辆主流人工智能列车上会有人发现下一代算法来远离主流。如果这个孤独的骑手可以自己使用它,那我们将会看到第一个自成的万亿富翁。但这是从何而来的的呢?也许会是突然出现在大众面前。它可能是主流技术和遗弃的基于模型的算法的组合。在2010年代,神经网络和一些曾经颇有前景的方法(符号方法等)的兴起失去了部分研究基础。人工智能目前的运行也使得其他相关的研究领域得以复兴。现在很难找到一种“不受欢迎”的技术或算法。尽管如此,在不远的将来,或许会出现一个局外人,他可以发现一种途径来改变整个人工智能的游戏布局。

0
      
Copyright © 2016-2018 长石资本(Longcapital) 版权所有    沪ICP备16031463号    技术支持:益动科技