饺子中的人工智能(下)

上期链接:饺子中的人工智能(上)

2. 从线性回归到神经网络(续)

上期说到,由单变量的逻辑回归可以推广到多变量的逻辑回归,使得模型可以对一个多维向量作出一个判断输出

多变量逻辑回归的模型

类似的,我们可以迅速地把输入的数据维度提高到n维,使得模型可以对一个n维数据作出判断。

妙蛙种子

图像文件的本质,就是一个多维的点阵,每个点包含一个灰度数值(这是黑白图像的情况;彩色图片根据色彩编码会需要更多的数值,但构造是类似的)。例如一张128x128像素的图片,就包含了128x128=16384个数值,把他们展开成一个向量,问题就和上图中多变量逻辑回归的模型没有了本质区别。例如现在要识别图片上的物体是不是苹果的话,就对我们的模型输入大量的学习数据(图像文件),这些图片包括像素信息以及一个是不是苹果的判断值(是苹果y=1,不是则y=0)。再次通过前述的最优化算法,就可以学习出一个对苹果作出识别的模型。

至此理论上逻辑回归已经可以实现图像识别,然而在实际问题中,上述的单一节点模型需要过于巨大的学习数据并需要消耗极大的计算成本。其原因在于现实问题的绝大多数都属于非线性问题。什么是线性和非线性呢?来看两个例子。

首先是线性的逻辑回归问题。假设现在学习数据是一组三维的数据代表两个输入,代表逻辑回归的输出,表示真,反之则为伪(在图中用圈表示真,叉表示伪)。很明显现在这群数据可以由一条直线来区分开来,也就是说Hypothesis 只需要包含两个输入项的一次项就可以很好的分类这组学习数据从而对将来数据作出判断了。

线性的逻辑回归问题

相反的,如果上图的学习数据不能用一条直线分开,现在就需要输入值的非线性组合来帮助划分数据了。比如如果数据刚好是一个圆心在原点的圆,可以想象此时可以利用一个Hypothesis ,其中的刚好等于圆的半径的平方。(下图上)可是如果不幸数据的形状是一个偏离原点的圆,那么就会需要加入更多的2次项等。当形状变得更加复杂,就会需要加入更多更多的高次项来拟合图形。(下图下)

非线性的逻辑回归问题

到底需要多少高次项呢?假设现在仅仅需要加入所有的二次项,那么对于个输入值来说,所有的组合将有种;对于一个仅仅是128x128像素的图像识别,共有16384个输入值的情况,这个数字就来到了1亿3千万以上,这对于现有的计算能力来说是过于巨大的数字。这就要求有更加合理有效的算法来在确保识别正确率的情况下大大减少运算量,而这个算法就是神经网络。

回想非线性算法中的运算量问题,其本质在于,对于一个未知的输入量我们不知道需要加入多少高次项才能足够拟合其自身带有的非线性,于是只能像上述的办法一样,把所有的排列组合加入输入中,导致过于庞大的计算量。神经网络算法的思想是,不同于逻辑回归只有一个运算单元的构造,加入多层结构的运算单元,并利用反馈法,让计算机自动找到这些运算单元的最佳值。

非线性的逻辑回归和神经网络的比较

上图对逻辑回归和神经网络做了一个示意性的比较,逻辑回归需要人为创造大量的输入量来适应模型中的非线性性(左),而神经网络仅仅包含数据中原有的成分(input),由算法来自动寻找中间层(Hidden layer)的参数值从而自动地适应数据中的非线性,这种“适应”往往比人为的机械输入所有非线性项更加高效。可以想象这里的自动寻找最优值的算法,就是整个神经网络和深度学习发展的最核心,在上一期中讲到为什么人工智能在最近5-10年急剧升温,重要原因之一就是这里的算法在2000年前后获得了一系列的突破,使得原来被认为是不可能做到的自动最优化成为了现实。形象地理解,增加这种网络的层数会提高计算机从输入的数据中“抽象”重要数据结构的能力,使得用较小的计算量实现更快速高效的学习,这也是深度学习(Deep learning)中深度的由来。

3. 人工智能的产业应用

回顾计算模型的讨论,我们知道当今所谓人工智能的核心,可以说在于机械学习和神经网络技术的成熟,这种技术归根结底的功能就是对现实世界的事物进行识别。对于一个外行人来说,说到“智能”也许首先想到的是拥有思考的能力,而认识和识别听起来似乎并没有达到“思考”的高度(其实恰恰相反,在计算机上实现识别往往比实现所谓思考更难,不过现在先撇开这个问题)。现在回到上期中对于人工智能热潮的第一个问题1.“识别”或者“认知”听上去并不是什么高大上的“智能”,实现识别功能的意义有多大?

为了回答这个问题,我收集了一些前沿企业在人工智能领域的尝试和发展现状,来看看这些掘金的勇士都有什么样的点子。

Australia and New Zealand Banking Group Limited (ANZ) 人工智能金融助手

澳新银行是澳大利亚四大银行之一,业务主要集中在亚太地区。着眼于年轻用户层的拓展,澳新银行积极地开展面向新用户的资产运用咨询,由金融咨询师为每个用户量身定制资产运用的计划。然而由于散户的数量庞大,个人情况各异,银行面临金融咨询师资源不足的问题;相对的,年轻用户层的资金数量有限,对于金融服务追求的是速度和效率,传统的金融咨询业务显得过于冗长繁琐。于是澳新银行与IBM协作,开发了利用人工智能对用户情报进行分析的系统。利用这一系统,人工智能将对用户的基本情况进行分析识别,把用户分成不同的组别,并作出基本的简单的基础方案;虽然最终提供给终端客户的内容仍然需要有经验的金融咨询师进行审核和精查,但是这一系统的导入大大缩短了从客户登录到金融方案成型的时间。原本针对一个用户的分析需要一个金融咨询师花费5-7天的时间,粗算人工费用这将花费超过3000美元的费用,这不仅迷失了年轻用户层对于速度的需求,同时由于年轻用户层的资本本来就有限,高昂的分析费用使得这一业务的性价比完全失去了竞争力。导入人工智能后,初期分析仅仅需要30分钟即可完成,随后由人工继续为终端用户服务,这一组合拳很好地解决了金融咨询师资源不足的问题,同时由于人工费用的节省,使得金融咨询服务可以以更低的价格面世,大大提高了服务本身的价格效应,使得针对年轻用户的战略得以实现。 (出处参考:https://bluenotes.anz.com/posts/2018/05/how-artificial-and-actual-intelligence-are-changing-the-game)

Amazon ECHO 人工智能家居

2015年Amazon发售了新型的人工智能音响ECHO,ECHO利用语音识别功能,可以实现由用户语音进行网上购物,天气查询,股价查询等服务,并可以直接下载用户在Amazon购买的音乐进行播放。ECHO的核心技术,在于有噪音情况下的语音识别,使得用户可以像和人对话一样随时随地和ECHO进行交互。在这之前,语音识别要求输入的语音有很少的噪音,需要用户对着MIC进行清晰的发音,否则就不能正确识别用户的输入。然而随着人工智能算法的提高和数据量的爆炸,Amazon实现了在有背景噪音的情况下对语音的高精度识别,也催生了ECHO的诞生。

相较于传统型的零售业通过店铺和广告的争夺,网络零售业着眼的是通过数字的手段向用户散播信息从而争取到客源。ECHO的意义远远不只是实现了让客户可以用说话来购物这么简单,每个ECHO就好比一个24小时的零售销售员驻扎在用户的家中,可以0距离接触到终端用户向其推送信息/收集用户数据。更可怕的是,一旦用户习惯使用这一产品,其他的竞争对手将很难再次进入用户的家庭(你不会想在家里放好几个功能类似的智能音箱),从这个意义上来说,ECHO将是Amazon争夺客户战争前沿阵地中最骇人的干将。

最近刚刚发售的Echo SPOT

Blue River Technology 人工智能农业

是的你没有看错,不要以为人工智能只能运用在很局限的商业领域,在传统的第一第二产业,人工智能同样具有巨大的潜力。来自美国的创新企业Blue River Tech.着眼于传统农业中的农药问题,开发了用于散布农药的人工智能机器人。传统农业中农药使用的问题在于,对于病虫害的把握和判断由农民通过经验判断,在精度和时效性上极度有限:往往农家在发现某特定区域病虫害以后,只能对相应区域进行地毯式的农药播撒,这种播撒方式往往把大量不需要播撒的健康个体也包括在其中,导致农药使用量超过实际必要的量,而农药的过量使用不论对于作物本身的质量,还是对于其生长的土壤,都是有长期的甚至不可逆的负面效应。

Blue River Tech.开发的机器人首先对农田进行自动的扫描摄像,然后通过人工智能,识别出其中产生病害的个体,随后同样由机器人对这些病害个体进行点对点的农药播撒。人工智能算法对于病虫害判断的正确度不仅可以超过人类,更重要的是可以不厌其烦地对每一棵个体进行个别的诊断和农药选择性播撒,这是传统农业所无法想象的。根据同公司公布的实验数据,他们开发的人工智能机器人,可以使得同一农田的农药使用量减少90%以上。 (出处参考:http://about.bluerivertechnology.com/)

Nitori 人工智能物流

我有一个朋友说过一句非常深刻的玩笑:日本人整理收纳东西的智慧,都是地方小给憋出来的。不过小地方憋出来的智慧,可没说不能在大地方用,Nitori的物流管理就是如此。Nitori在日本除了经营传统的家居超市以外,在网络上也有功能齐全的网购系统。现今对于网购的物流速度的追求已经到达了几乎变态的程度,从最早的隔天到货,到后来的次日到货,现在Amazon甚至在城市的中心地区开始实验性地尝试当天到货服务,这样的竞争除了对于快递速度的要求越来越高,同时也对贩卖者仓库的出货速度提出了严苛的要求。

Autostore概念图

Nitori在2016年和挪威Jakob Hatteland Computer合作开发了叫做Autostore的人工智能仓库机器人来解决仓库出货的问题。说是机器人,事实上Autostore就像一个巨大的华荣道魔方,货物都存放在一个一个可移动的容器中,收到出货指令后Autostore就会自动将需要出货的容器移动到仓库出口等待取货。厉害的是,Autostore可以记录每个货物的出货频率,从而通过人工智能算法对货物进行自动分类,把经常需要出货的货物自动移动到离仓库出口更近的位置从而提高出货效率。由于全部由机器进行进货出货动作,整个仓库的结构极为紧凑,且可以进行复数层的叠加,提高土地的使用效率。根据Nitori发表的数据,这样一套系统使得仓库面积缩小为原来的一半,并可以削减75%的人工需求,整套系统大约在3-4年就可以回收成本。 (出处参考:https://news.mynavi.jp/article/20160322-nitorirobot/)

4. 对于人工智能的反思:天使还是恶魔?

可以看到,人工智能的运用将在非常广泛的范围为企业带来巨大的经济效应,同时在很多方面方便提高人们的生活质量。但是对于人工智能持悲观,谨慎,甚至是恐惧态度的人也不在少数。这一节是一些我收集的由各个领域的不同视角的人带来的对于人工智能的反思意见。

王垠:洗洗睡吧

如果你是一个深刻而虔诚的计算机宅,王垠这个人你的心目中一定有一个特殊的位置(不一定是好的)。四川大学97级本科毕业,保送到清华大学计算机系直博。期间曾在清华大学计算机系软件工程专业就读,主要进行集成电路布线算法的研究。在此期间,他因《完全用GNU/Linux工作》一文和对TeX的推广等“非研究成果的业余东西”而出名。 在只剩一年就要博士毕业的时候,他申请退学,并将1万7千余字的“退学申请书”(题为清华梦的粉碎)公布在网上,引起舆论界一时对教育体制和理想主义等的热议。后分别赴Cornell大学计算机系和Indiana University Bloomington/IUB求学,也都无一例外中途退学。在Google实习期间,其老板Steve Yegge在他实习后做出如此评价:“Yin’s one of the smartest engineers I know. His intern project at Google was by far the most technologically advanced I’ve seen in 20 years of working with interns. He’s going to go on to do great things.”由此可见王垠的能力。淡出这些退学风波之后,王垠还是成为了一个全职的程序员,并开始在自己的博客“当然我在扯淡”上继续发表他对于技术的看法。个人阅读了大量他的随笔,可以说王垠随着年龄的增长对很多问题的看法都不再那么偏激极端,然而对于人工智能,他则一直持悲观和否定的态度。

王垠对于人工智能的批判主要集中在两点:1. 人工智能如果取代人类劳动将是人类的悲剧; 2. 人工智能很难取代所有的人类劳动。 他在博客中这样写道:

“很多人喜欢鼓吹人工智能,自动车,机器人等技术,然而如果你仔细观察,就会发现这些人不但不理解人类智能是什么,不理解人工智能有什么局限性,而且这些“AI 狂人”们的心,已经严重的机械化了。他们或多或少的失去了人性,仿佛忘记了自己是一个人,忘记了人最需要的是什么,忘记了人的价值。这些人就像卓别林在『大独裁者』最后的演讲里指出的:“机器一样的人,机器一样的心。”

每当提到 AI,这些人必然野心勃勃地号称要“取代人类的工作”,“节省劳动力开销”。暂且不讨论这些目标能否实现,它们与我的价值观,从一开头就是完全矛盾的。一个伟大的公司,应该为社会创造实在的,新的价值,而不是想方设法“节省”什么劳动力开销,让人失业!想一下都觉得可怕,我创造一个公司,它最大的贡献就是让成千上万的人失业,为贪得无厌的人节省“劳动力开销”,让贫富分化加剧,让权力集中到极少数人手里,最后导致民不聊生,导致社会的荒芜甚至崩溃……我不可想象生活在那样一个世界,就算那将使我成为世界上最有钱的人,也没有了意义。世界上有太多钱买不来的东西。如果走在大街上,我看不到人们幸福的笑容,悠闲的步伐,没有亲切的问候,关爱和幽默感,看不见甜蜜浪漫的爱情,反而看见遍地痛不欲生的无家可归者,鼻孔里钻进来他们留下的冲人的尿骚味,走到哪里都怕有人抢劫,因为人们实在活不下去了,除了偷和抢,没有别的办法活……

如果人工智能成功的话,这也许就是最后的结果。幸运的是,有充足的证据显示,人工智能是永远不会成功的。

随后,他又对人工智能在技术层面上的问题表示了怀疑,现在机械学习的成熟虽然使得识别功能已经基本实现,但是这和实现人类智慧还有很大的差距。例如语音识别已经可以较高精度地将人类语音转换成机器数据,但是对于这些数据的语义语法分析,则还非常困难。人们在说话的时候经常使用非常灵活的语法变化,并包含大量的话外之意信息,这些对于计算机来说都还非常难以理解。上一节中提到的ANZ澳新银行的人工智能金融助手服务就是如此,虽然可以基于数据对用户进行简单的分析,但是最终和终端用户交流定夺的还必须是人类咨询师,单由计算机还无法做到完全读懂用户需求的程度,这也是现在已经被很多人所了解的,越是需要非线性思维,创造性思维的职业,越难被人工智能替代的看法。

Elon Musk:卖淫也要先装淑女才行?

Tesla的联合创始人兼CEO马斯克可不像哈佛书呆子马扎一样傻不拉几,作为电动汽车最风口浪尖的推广人,马斯克也没忘记要给韭菜们好好施点肥料。在人工智能中有一个说法称之为Singularity(特异点),特异点在数学上常被用来表示一个光滑连续的场中突变或者发散向无穷的点,在人工智能中的特异点预言,指的是科学家预测,在2045年前后,人工智能将拥有足够的泛用性和自我强化能力,从而开始脱离人类的掌控开始高速地自我发展,到那个时候,人类将有被人工智能取代而走向灭亡的危险。读过上面对于人工智能的介绍,我们已经知道人工智能完全取代人类的可能性还非常小,不过在企业家的眼里,恐惧和无知永远是不可多得的财富。在一次MIT的受邀演讲中,Elon Musk表示,我们必须对人工智能技术的发展持非常谨慎的态度,人工智能没有节制的发展将会召唤来可怕的恶魔,召唤者自以为可以操控这恶魔,但最终却会失败。可以看到的是,人工智能的发展将在未来的几十年重新洗牌世界的资本格局。拥有人工智能技术的公司将有能力用更少的人力成本完成更大的事业拓展,这和工业革命的洗牌如出一辙。且不论人工智能的特异点是否会在2045年到来,掌握人工智能的国家和企业将在短时间内搜刮到更多的资本从而建立新的秩序,而没有资本进行人工智能研发的国家和企业则将在所有的竞争处于弱势,进而进入一种恶性循环被新的世界秩序淘汰。马斯克一边说着人工智能的威胁论一边在Tesla对人工智能研发投入大量资本的勾当可谓居心叵测。

5. 结语:未来在你我的手中

通过对人工智能从原理到应用的讨论,我们已经知道人工智能不论是恶魔还是天使,都将是一把威力无穷的武器。利用这把武器是为人类创造更多的价值,还是贪婪地搜刮财富占地为王,取决于谁掌握这场游戏的主动权。今天如果我们呼喊爱与正义,却被自己的敌人轻易地干到人仰马翻,那只能说明爱与正义根本就不配存在在这个世界。我们也许并不喜欢争斗,但是在人工智能到来的面前,既然有人要争抢这把武器来干架,那就不如忘记正义来战个痛快!

Written on July 24, 2018