新書推薦:
《
大思维:哥伦比亚商学院六步创新思维模型
》
售價:HK$
72.8
《
宏观经济学(第三版)【2024诺贝尔经济学奖获奖者作品】
》
售價:HK$
155.7
《
UE5虚幻引擎必修课(视频教学版)
》
售價:HK$
110.9
《
真需求
》
售價:HK$
110.9
《
阿勒泰的春天
》
售價:HK$
50.4
《
如见你
》
售價:HK$
51.3
《
人格阴影 全新修订版,更正旧版多处问题。国际分析心理学协会(IAAP)主席力作
》
售價:HK$
67.0
《
560种野菜野果鉴别与食用手册
》
售價:HK$
67.1
|
編輯推薦: |
谷歌AlphaGO战胜李世石,标志着机器智能新时代来袭
人工智能火热来袭,未来5年,人工智能会怎样改变我们的生活?未来15年呢?
人工智能的下一个BAT会在什么领域产生?
科技大咖倾情推荐,内容涵盖人工智能前沿研究热点与发展趋势
分享许多知名学者专家难得的不同角度与侧面认识追求
产生了对人工智能未来发展的天马行空想象空间与好奇
将机器人、无人车、深度学习、大数据、虚拟现实等智能技术的变革结合起来,将预示一个大时代的到来,即所谓的超智能时代。《新智元:机器 人类=超智能时代》深入分析了人工智能时代的技术和发展、机遇和挑战,带我们提前走进超智能时代。
|
內容簡介: |
本书主要分为三部分。其中第一部分为杨静为你开启新智元:智能+的世界;第二部分为著名人工智能研究院院长解读AI新智元;第三部分顶级AI专家前瞻人机融合的超智能时代。并附有新智元简介和新智元人工智能智库名单及部分专家简介。
|
關於作者: |
杨静,新智元创始人,中国人工智能学会社会计算与社会智能专委会秘书长。在《程序员》杂志发表文章“人类时代的终结与超越”,以及在《中国传媒科技》发表文章“新智能时代与新媒体革命”。
|
目錄:
|
目 录
第一部分 杨静为你开启新智元:智能+的世界
第一章 算法驱动的全球智能革命 3
2050年,我们都是机器人 4
人类时代的终结与超越 8
做全球智能革命的“中国合伙人” 12
数据驱动生活,算法统治世界 16
《算法帝国》:被算法和算法交易改变的未来 21
中国“超算”超越:从千万亿次到百亿亿次 32
郑州会盟——2014中国计算机大会综述 38
第二章 百度大脑、讯飞超脑与中国大脑 47
“百度大脑”向“谷歌大脑”发起全面挑战 48
李彦宏的“中国大脑”提案与阿波罗计划 53
【胡郁】讯飞超脑——科大讯飞人工智能计划揭秘 61
【科大讯飞】十年磨一剑,迈向人工智能制高点 70
第三章 无人驾驶与智能车 75
让无人驾驶的“中国之梦”触手可及 76
“猛狮”勇闯2014年“中国智能车未来挑战赛” 84
2015中国智能车未来挑战赛“猛狮”再夺冠,总裁判长及冠亚军车队专访 93
第四章 人工智能+机器人到哪儿了 109
SIGGRAPH ASIA 2014:在全球电脑图像盛会凸显的中国力量 110
智能社会前瞻,中国人工智能比肩国际顶级水平 122
【机器姬索菲亚】个人机器人时代来了 125
【李国杰】人工智能到哪儿了? 131
第五章 AI影评 137
《安德的游戏》与中美争霸 138
《她:her》:因为爱,而永恒 142
《超验骇客》:人工智能的涅槃 146
《超体》:超越人类的时空之旅 149
《星际穿越》:让“我们”站在时间面前 152
第六章 智慧人生 157
基因检测——发现“我”是谁 158
2015世界读书日【杨静lilian的书单】 161
人类不与机器人结婚的十大理由 173
机器人成为人类伴侣的十大理由 178
最美的祖母,不褪色的记忆 184
第七章 龙泉寺与机器僧 187
再访龙泉寺 188
【内幕】龙泉寺贤二,史上首个机器僧问世全记录 193
第八章 机器智能+生物智能=新智元 207
【静?沙龙一周年】一个微信群的星际穿越 208
新智能时代与新媒体革命 218
中国式创新将是全球创新的主战场 222
人机融合+万物智能=新智元? 227
【新媒体影响力重磅榜单】新智元获2015最具影响力社群大奖 231
【新智元创始人杨静】智能机器人+将开启新智元 236
第二部分 著名人工智能研究院院长解读AI新智元
第九章 人工智能大咖独家解读AI新智元 251
IBM中国研究院院长,IBM大中华区首席技术官:沈晓卫 252
微软亚洲研究院常务副院长:芮勇 257
科大讯飞轮值总裁、科大讯飞研究院院长:胡郁 268
三星中国研究院院长:张代君 281
华为诺亚方舟实验室:李航、张宝峰 290
出门问问&Ticwatch创始人:李志飞 295
前英特尔中国研究院院长:吴甘沙(驭势科技CEO) 301
第三部分 顶级AI专家前瞻人机融合的超智能时代
第十章 顶级AI专家独家解读超智能时代 311
中国自动化学会副理事长:王飞跃 312
新智元智库首席执委:白硕 321
新智元简介 327
【新智元】智能+中国主平台,领航中国新智能时代 328
新智元团队主要成员 339
新智元上线大咖祝福 341
新智元人工智能智库名单及部分专家简介 347
新智元人工智能智库首期专家名单(按姓氏笔划顺序排列) 348
新智元人工智能智库部分专家简历及照片(按姓氏笔划顺序排列) 352
|
內容試閱:
|
人工智能需要一场认知革命吗?
一、引言
人工智能作为未来IT产业的战略性和前瞻性新兴产业方向,一直是全球科技界和产业界关注的焦点。尤其是伴随着大数据、云计算等新一代信息技术的快速发展和智能化应用需求的日益凸显,人工智能领域在全球范围内掀起了全新的热潮。美国、欧盟等发达国家分别提出了Brain
Initiative和Human Brain
Project等人脑研究计划,投入巨资并将其提升到与人类基因图谱重大工程并重的高度。苹果、谷歌等国际IT产业巨头也相继推出了Siri、Google Now语音搜索等一系列人工智能应用,力争在新一轮人工智能技术竞争中取得先机。本文将从What、When、How和Where四个方面对人工智能的概念以及关键问题进行讨论。
二、What -人工智能是什么?人工智能和机器人是什么关系?
人工智能(Artificial Intelligence)这个词最早是在1956年美国的Dartmouth会议上提出的,当时参加会议的包括明斯基、西蒙、麦卡塞等一些计算机领域的专家。关于人工智能的定义,不同的教科书中往往会有不同的解释。其中有一种比较简单、易于理解的定义,就是人工智能指的是能够和人一样进行感知、认知、决策、执行的人工程序或系统。
另外一个关于人工智能值得探讨的关键问题,就是人工智能和机器人的关系,即人工智能和机器人是不是一回事?人工智能研究的专家往往来自计算机科学领域,他们所研究的是数字世界和虚拟世界,也就意味着他们所说的感知、认知、决策和执行,全部是在数字世界里面执行的。但同时有另外一些研究机器人科学的专家,他们是在物理世界和真实世界中探求能否实现这样的机制。他们要解决的是机械手、机械控制,他们要做的是在真实世界里面做感知、认知、决策和执行,所以说他们的执行一定要有物理实体。比方说针对在家中客厅遥控关闭卧室灯这样一个问题,人工智能专家和机器人专家往往会采用不同的方法。人工智能的专家会考虑在手机上做个软件,通过互联网连到卧室里的智能装置,然后把卧室中的开关连上物联网,这样就可以用手机遥控将电灯关掉,这一过程是在虚拟世界中可以完成的。但是对于一个机器人专家,他可能会做一个爬楼梯的机器人,然后给机器人下达指令,机器人接到指令就会跑到卧室去把灯关了,这个过程是要在物理世界里面来完成的。所以从本质上来讲人工智能和机器人二者是非常接近的,但是其背景是不一样的。
人工智能的第三个关键问题是它的学科基础。人工智能的软件实现涉及计算机科学、信号信息处理及统计模式识别等若干学科。计算机科学包括算法、网络等;信号处理涉及傅里叶分析、拉普拉斯变换及其他时空分析方法;统计模式识别依赖概率论和数理统计,我们现在使用的深度神经网络(Deep Neural Network,DNN)和统计模式识别的算法来自这里。人工智能专家往往有着计算机科学和电子工程的背景。但是机器人领域往往强调控制论,包括卡尔曼滤波、自动控制原理、机械控制理论等。机械控制理论中又有很多机械原理是涉及物理规则的。从中也可以看出,人工智能和机器人是两个相互关联又有区别的研究领域。
三、When -什么时候人工智能将实现革命性的突破?
人工智能第二大方面的问题是When,就是人工智能什么时候能实现革命性的突破?对于这个问题,大致有两派的观点。一派我们称为威胁派,这一派的代表人物是霍金、比尔盖茨和马斯克,他们都提出要警惕人工智能,它对我们人类威胁太大。而且现在越来越多的科幻电影好像是配合他们的说法,不断地向我们展示人工智能对人类构成威胁的一面,如复仇者联盟2和终结者。但是另一派的观点相对理智,以Michael Jordan、Yann LeCun、Andrew Ng等学者为代表,他们认为其实我们现在与实现人工智能还距离很远,人工智能还远远没有达到威胁人类的地步,还有很多探索的工作需要开展。
最近有一本书叫《人类简史-从动物到上帝》,是以色列一位年轻的历史学家写的。他在这本书里面讲了一个事实,并且做了一个推论。大家都知道,人类的产生大概距今300万到400万年前,那时候世界各地出现了猿人,非洲叫智人,欧洲叫尼安德特人,亚洲叫直立人,东南亚叫梭罗人。北美洲和南美洲都有猿人,他们是各色各样的猿人,在中国也出现了山顶洞人、元谋人和蓝田人。非常可惜的是他们不是我们现在汉族人的直系祖先。因为在7万年发生了一件事情,非洲的智人跑到了全球,他们每到一个地方,就把当地的猿人全部杀光,包括欧洲的尼安德特人,并且占领了整个世界。
为什么7万年前的时候这些智人像突然开窍一样迅速占领地球并且成为地球的上帝呢? 当我们在问人工智能什么时候能达到智能突破的时候,我们或许可以先问一个类似的问题:人类的智能是如何突破的?这里有很多神创论、宗教,包括达尔文的进化论在后面支撑。猿人在地球上已经存在了300到400万年了,到7万年前才实现了智能的突破,这是一个非常漫长的时间过程。而计算机出现的时间刚刚只有几十年的时间,和猿人产生智能的时间周期相比,计算机刚刚度过的时间只能算一瞬间。
四、How -如何实现人工智能的突破?
第三个问题是很多人讨论的How的问题,就是我们如何实现人工智能突破。自从Dartmouth会议以来,我们人类人工智能能够取得突破的一个核心要素,现在看来就是深度神经网络。深度神经网络DNN是基于统计的模式识别的一个成功代表。另外一个关键要素就是大数据。以谷歌为代表的世界互联网公司,包括中国的阿里、腾讯、百度、讯飞,就是利用深度神经网络与大数据结合来推动人工智能技术的进步,这已经成为当前人工智能研究的一条主流路径。这条路径中还有一个非常重要的内容,就是基于互联网和移动互联网的研究-工程-产品-用户大闭环优化,它推动了工业界人工智能技术直接迈过了可用性门槛。
从2013年开始,DNN已经被广泛地应用在语音合成、语音识别、语音评测、语音增强等一系列智能语音技术方向。我们可以看到现在这个方面的工作,已经成为了当前机器学习和统计模式识别的主流。目前的DNN对人脑神经网络的借鉴是非常抽象的,我们可以通过对人脑的研究进一步优化DNN。
基于互联网和移动互联网的研究-工程-产品-用户的大闭环优化的核心思想,可以用简单的四个字概括就是大、智、移、云。
移动互联设备对智能交互(包括语音和图像)提出了迫切的需求,而传统的嵌入式移动设备不能够提供足够的运算能力且缺乏足够的电力供应,而在云计算出现以后,这些复杂的计算都可以放在云上。通过云计算自然就存储了大数据,而这些大数据结合DNN,可以很好地解决一些人工智能问题。本文将这个过程形象地总结为涟漪效应。涟漪效应就是水滴刚刚滴入水面的这个过程,会产生一个波纹,逐步覆盖整个水面。我们可以想象一个人工智能产品刚开始投入市场的时候,有些性能是不好的,如讯飞的语音输入法。水波纹每一圈向外扩散就会有更多人使用,这些不断累积的真实数据和使用经验就会放到云上,系统会根据这些数据和经验进行自我学习和更新。当它扩散到更多人群的时候,就是波纹覆盖水面扩大的时候,已经是改进以后的系统。前一千万人免费使用系统的同时也贡献了宝贵的数据和经验。当第一千万零一个人使用的时候,他往往会惊异于系统的优异性能。
2010年以前的语音识别无法在真实场景下使用,科大讯飞刚推出语音输入法的时候,在实验室里测试识别准确率是90%,在真实的环境下识别准确率只能达到55.8%。但是利用涟漪效应和大、智、移、云优化之后,现在的语音识别准确率已经达到95%,并且识别错误率还在以每年30%的速度降低,以这样的速度大概5年以后就可以达到人类的语音听写水平(准确率约为99.5%)。
现在工业界所依赖的大闭环优化、深度学习和大数据,跟脑科学的研究思路结合也是完全有可能的。因为现在人工智能网络借助于新的学习机理甚至拓扑结构上的改进,将可以进一步成为人工智能发展强有力的推动力。例如,一种新型的递归型深度神经网络(Recurrent Neural Network,RNN)已经成为当前语音识别的一个新的标准配置,比传统的DNN方法可以再降低20%~30%的识别错误。RNN就是一种非常新的网络拓扑结构,它和人脑神经网络可以在时间上进行信息积累类似,通过网络拓扑结构的优化和改变,可以实现对序列性数据更好的处理能力。正是涟漪效应、深度学习和大数据的结合,成为目前推动着人工智能向前发展的最有效的路径。
从另外一个角度,最近这几年,包括美国、欧洲、中国都在积极推进脑科学的研究,包括奥巴马政府要做的Brain
Initiative和欧洲的Human Brain
Project,中国也在酝酿中国脑计划,如中科院卓越创新工程中也涉及了这方面的研究。这些国家层面的重大项目都试图从脑神经科学的角度尝试人工智能发展的另一条途径。
我们都知道大脑皮层是一个非常复杂的结构,人脑分为大脑、丘脑(也叫中脑)、小脑、脑干、海马体、脑垂体等。但是人类跟动物一个最大的区别是人类的大脑皮层,它的面积很大,如果摊开大约一张餐桌纸大小,跟所有动物都是不一样的。当把它皱起来的时候它就形成一个空间实体。当人脑在处理信息的时候,大脑皮层的不同区域,会处理不同的任务。有些是处理视觉的,有些是处理听觉的。那么人脑更有意思的地方是什么?我们现在研究图像、语音、文字、触觉都是分离的,但是人脑处理不是这样的。人脑的结构是一层层上来,到了顶层以后,视觉、触觉和听觉会交叉的。这就是概念,它跟人工智能中的认知能力实现是非常相关的。
如果再细化一点,大家知道大脑皮层是有厚度的,如果把它的厚度再展开,它一共有六层,L1至L6。大脑皮层一共有360亿个神经元细胞,这些细胞之间是一个非常复杂的连接网络。大脑皮层有一个非常重要的特点,就是它的记忆功能。记忆和存储是不一样的。记忆是各种各样的信息的抽象。
举一个简单的例子,我给领导递交一份报告,最底层的记忆是记住这个报告的所有内容,然后再上层是记住这个报告大意,包括标题是什么,再上一层是记住有这么一个报告,但是写在一个什么纸上的,再上面一层记忆是我给领导提交过这份报告,但是报告的细节一点都不知道。记忆是需要计算的,而这是计算机在存储时所没有的。
大脑还有几个关键的特性,一个叫存储序列模式,比如说听一首歌曲,从前往后听是可以的,但是如果倒过来听,人是肯定不记得的,因为人的大脑里面有可能是用类似RNN的结构来进行记忆的。第二点是它有自联想的回忆模式,比如当人看到一个猫的上半部脸,他马上能想到这个猫的下半部脸应该是什么样子,因为人有记忆的预测功能。而且当他听到句子前半部的时候,他能够预测到句子的后半部分,这能解释为什么我们在嘈杂的鸡尾酒会上都能具有超强的识别能力。人脑最强大的地方在于它的恒定表征,也就是祖母细胞。当人看到这个脸就知道是谁,它不需要复杂计算,这和我们现在使用计算实现人脸识别的过程是不一样的。所以说大脑皮层超强的记忆功能能够实现预测,我们现在所有的动作都依赖预测结果;而计算机的工作是通过运算和存储实现的,且能耗极高。将以上关于脑神经科学的知识用于人工智能的实现也仍然需要一定的过程。
总结一下,人工智能的创新需要有计算机科学的背景,包括电子工程和机器学习,同时还需要脑科学、神经科学方面的理论支撑,另外也要机器人相关的控制论和工程学。人工智能的技术突破需要同时具备这三个方面的基因。
五、Where -人工智能到哪了?
第四个问题要讨论的是Where,就是大家一直关心的人工智能发展到哪了?世界上一个非常著名的公司Gartner研究过,一项新的技术从开始研究到最后成功的产业化之间要经过很多过程,包括一开始的推崇备至发展到期望巅峰,然后到跌入现实低谷的痛苦,很多技术在这个过程中慢慢消失了,或者被新的技术代替了。人工智能其实是一个非常广泛的概念,语音、图像、语义理解等都属于人工智能。各项人工智能技术以不同的状态分布在整个曲线上。
人工智能所涉及的各项技术的发展是不均衡的。现阶段计算机比较具有优势的是运算能力和存储能力。1996年IBM的深蓝计算机战胜了当时的国际象棋冠军卡斯帕罗夫,从此,人类在这样的强运算型的比赛方面就不能战胜机器了。江苏卫视有个《最强大脑》的节目,让每一个人类选手记100个4位数,然后回答第58、第64个4位数是多少。这对于计算机来讲根本就不是问题。所以从运算智能的角度来说,人类早就不是机器的对手。
同样,我们看到机器在感知世界方面,比人类还有优势。人类都是被动感知的,但是机器是可以主动感知的。比如:激光雷达、微波雷达和红外雷达。不管是Big Dog这样的感知机器人,还是自动驾驶汽车,因为充分利用了DNN和大数据的成果,机器在感知智能方面已经越来越接近于人类。
但是,人类跟动物的区别在于人类拥有自己的语言,有语言就可以表达知识,有知识就可以进行逻辑推理,而有逻辑推理以后我们就有向更高阶段发展的能力。我们认为正是语言的使用区分了人与动物,也将是人工智能面临的最大挑战。或许我们会问:动物难道没有认知吗?动物对自然世界确实有认知,但是它的认知也只能是停留在哪些是固体、哪些是液体、哪些是能吃、哪些是不能吃的,等等。所以说,动物只能对自然世界产生简单的认知,同时对人造世界的自然属性产生认知。动物能够看到月亮,但是它不知道月亮是一颗星球。如果一只兔子来到这个会场,它会知道这里有很多活物(人),有桌子、椅子这些固体,但是它不能理解这些物体和人类社会之间的关系。现在的问题是,计算机能理解这一切吗?这是非常关键的一点。
让我们回过头来看一看人类智能的突破。七万年前智人的智能有过大的突破,研究表明,这是因为他们有特殊的语言和认知。我们到现在分析人类历史都知道有农业革命、工业革命、信息革命。现在历史学家有一个共识,在七万年前人类发生了认知革命。其中的核心是智人拥有丰富的语言,从而产生了三个结果,这些智人通过语言更好地描述自然世界,从而可以执行更加复杂的计划。而最重要的一点,就是智人有了语言之后可以描述在梦中想到的东西和他们脑子里面想到的东西,从而产生虚构、产生宗教,产生各种概念。
正是因为这样,现在很多正在做人工智能研究的专家,包括Michael Jordan和Yann LeCun等都已经意识到,自然语言理解对于人工智能来说是一个突破口。
科大讯飞目前正在执行的讯飞超脑计划,就是想实现包括感知智能和认知智能在内的全面突破。在感知智能领域,语音识别、手写识别方面每年保证30%~50%的错误率的下降。进一步的,我们不仅能够识别普通话,还能够识别方言;不仅能够理解人类和机器的对话,还能理解人和人之间的对话;不仅能够识别联机手写的字符,还能识别离线手写的字符。我们在认知智能上的研究目标,关键是让机器能理解会思考,这必须要突破语言理解、知识表示、联想推理,自主学习等多个方面。
评判一个人智商的标准就是让你参加考试,虽然这个方法很多人都在批判,但是没有其它更好的办法。美国华盛顿图灵中心在研究如何让机器人通过美国高中生物测试。日本国立情报研究所在研发能够考上东京大学的高考机器人。我国863计划也正在开展一个题为类人答题系统的科研项目,其目的就是要研发高考机器人。该项目包括9个课题组,全国共有31家单位参加联合攻关,其中科大讯飞作为牵头单位。将来一份试卷不管是手写识别的,还是选择题涂抹的,都可以先通过OCR转变成计算机可以理解的文本和图像,再让计算机自动对答案的正确程度进行评判,这其实是感知智能和认知智能的结合。现在安徽省合肥市和安庆市的会考中,英文和中文的考试已经全部使用了整套感知智能和认知智能技术进行自动评分,取得了非常好的效果,以后此技术将会被全面推广到包括文科和理科的所有课程。
六、结束语
可以看到,随着技术的发展,人工智能将来在智能硬件、车联网、机器人、自动客服、教育等方面都会发挥越来越多的作用。在这样大的环境下,最后大家所期望的人工智能梦想一定能够实现。
|
|