长春雅诗轩
标题:
对决(中):人工智能与人类智能
[打印本页]
作者:
userzzn
时间:
2016-3-9 17:59
标题:
对决(中):人工智能与人类智能
谷歌让阿法狗挑战李世乭的最好时机是,阿法狗水平接近但略低于李世乭,而且在可预见的将来能够超越李世乭。 视觉中国 图
2016年1月27日出版的《自然》期刊以封面论文的形式,介绍了谷歌公司研发的一种能与专业棋手对弈围棋的人工智能程序——AlphaGo的算法。论文称,Alphago于去年10月,以5:0的成绩战胜了欧洲围棋冠军樊麾。而且,Alphago将于3月份在首尔挑战过去十年被认为是世界围棋冠军的李世乭;比赛一共5轮,时间分别为9日、10日、12日、13日和15日;获胜者将获得100万美元的奖金。
早在1997年5月11日,IBM公司研发的“深蓝”超级计算机就击败了国际象棋世界冠军卡斯帕罗夫。但发明逾2500年的中国围棋远比国际象棋复杂,在搜索的广度和深度上被认为是人类发明的最复杂的棋类游戏。因此,Alphago战胜顶尖围棋手的消息震惊了围棋界,也被誉为人工智能的重大进展。而今年3月的棋局更是激起了人们的好奇心,也再次掀起有关了人工智能前景的讨论。
那么,人工智能战胜人类棋手是否必然?Alphago是如何下棋的?Alphago与李世乭对弈的胜算如何?人工智能与人类是否存在本质差异?人工智能是否可能取代并最终消灭人类?
机器不是人
不管这次比赛结果如何,人工智能战胜人类最强围棋手只是时间问题。那么这是否预示着机器最终将超越人类智力呢?图灵测试是判定机器是否具有人类智能的手段之一。一台机器通过图灵测试是指,它能够与人类以文本传输方式进行对话而不被辨别出其机器身份。这个测试的核心是判断机器能否像人类那样理解、思考和回答问题。很多专业围棋手在观察了Alphago与樊麾的对弈棋局后都觉得无法判定对弈双方谁是Alphago,谁是樊麾。对此,曾获得北京市大学生围棋冠军的王烁就认为在围棋方面,Alphago通过了他的图灵测试。
当然,这只表明机器在特定范围内的行为与人类相似,这与广泛意义下的人类智能还有天壤之别。从外部来看,我们可以把人工智能机器甚至个体的人都看成一个刺激-反应的黑盒子。所谓刺激是机器或人接受的输入信号,而反应则是输出行为。
目前人工智能擅长的大都是那些输入的信号数据结构化、行为目标明确的问题。比如,Alphago读取的输入数据就是19*19棋盘上的棋局,作出的反应是下一个棋步,目标则是赢棋。又如,图像识别程序读取的是数字化图像文件,作出的反应是判定图像的某些属性,目标是让判定的属性与尽量接近预设的属性。再如,自动驾驶程序读取的是各种传感器反映的速度、方向、压力、影像等信号,作出的反应是方向和用力等矢量值,目标是让汽车到达目的地,不发生事故并尽量节省能源。
这类问题大都可通过训练机器来解决。通常做法是大致确定机器黑盒子的内部结构,用结构的参数来表达机器所处的认知状态,然后使用大量的刺激-反应数据来训练参数。在这个意义下,训练可被视为是在参数空间的搜索。因此,人工智能的发展表现为如何确定黑盒子的结构,有效地压缩搜索空间,提高搜索效率。这个通常称为有监督的学习。
但是,人类智能并不局限于这类刺激信号结构化,反应目标明确的问题。简单来说,人类智能可概括为理解世界是什么样子以及会如何变化,并通过自身的反应来适应。这表现为通过特征抽取和概念化来压缩感知信息,并以此为基础构建思维框架来表达、归纳所感知到的世界并进行因果关联,再通过反馈行为来影响世界。这个过程可能借助于发明、创造来实现或提升。下面逐一分析。
信息感知:即接收外部刺激信号。人类感知可表现为视觉、听觉、味觉、触觉和其他各种身体感觉,分别接受图像、声音、气味、口味、受力、温度等物理和化学信号。其中很多感知信息可以绕过意识,直接输入到人体器官,实现潜意识功能。比如,腿部的受力感知可直接通过身体的平衡机制来决定神经的运动和着力,以维持身体平衡乃至完成行走动作。在信息感知方面,机器可能已远胜过人类,因为通过各种传感器和精密仪器,机器不仅能以更高的灵敏度接收人类能够感知的信号,还能探测到人类不能感知的信号,比如超声波和红外线等。而且,存储介质价格的不断下降也使长期大量存储原始信号变成可能。
信息压缩:即通过特征抽取、概念化、分类来压缩和表达感知信息。人类的机械记忆能力远不如机器,但特征抽取和概念化能力却远胜于机器。一个小孩只要看过一两只猫,就能抽取猫的一些基本特征,并根据这些特征从不同动物中分辨出猫,而机器需要学习成千上万个训练样本才能做出正确识别。除了特征抽取外,人类还会创造各种概念来表达所感知到的世界,即对具体实例根据其特征进行分类并针对不同类别建立概念。这些抽象概念不只限于名词,还包形容词和动词所反映的对象。自然语言能够帮助人类用概念来表达现象,但这不是必要条件。很多动物并没有自然语言,却也可能对观察到的现象进行概念化。
归纳和推断:即通过对现象的观察进行总结,建立起概念之间的关系,找出普遍规律并用这些规律对未观察到的部分进行推断。在这方面,人类的能力更是远胜于机器。比如,人抬头看到天空是蓝色的。虽然视野只涵盖天空的一部分,但却可合理推断,视野之外的天空也是蓝色的。又如,原始人类不断重复地看到天亮和天黑交叉出现,那也可能悟出这是一个周而复始的过程,因而在天黑之后可推断出不久天又会亮。人类根据归纳所得出的结论进行推断,可以在空间和时间上大大拓展人类所能表达的意象,从而在大脑中构造一个远比实际观察要更广泛的图景。一个只进过一个幼儿园的儿童,可以根据自己的经验总结出幼儿园的特征,并据此想象其他幼儿园的样子,这种推断会随经验的扩展而不断更新。
类比和推理:从具体实例中抽取反映特征的抽象概念,把实例中观察到的规则上升到抽象概念之间的关系,并以抽象概念为基础进行演绎和推理。这一过程在信息压缩以及归纳和推断中就有体现,这里特别列出是强调其在人类高等思维中的作用。类比推理致力于把实例之间的关系上升到概念之间的关系,并通过概念之间关系的演绎来理解和记忆实例之间的关系。比如,儿童可对“猫离开窝”和“弟弟离开房间”进行类比,进而理解“离开”这一动作概念的抽象意义。抽象概念上的演绎则类似于“如果A离开B,那么B里面就没有A”,这种抽象演绎可以脱离A和B的具体含义。用示意图来表示事物之间的关系也属类比,而数学则是用数字、符号、几何图形和抽象概念来表达和演绎抽象关系的类比推理。类比推理使得人类可通过抽象概念之间的演绎来理解事物之间的复杂关系。
因果关联:指在不同现象之间找出因果关系,即判断某个或某些现象可能导致或影响另一个现象。从了解世界是如何运行的角度来看,因果关联其实是一种认知构造,是对“行动-后果”关系的表述。因果关联注重于其预测和操作意义。比如,放开手中的苹果,苹果就会掉地上。又如,吃了腐烂的果子,可能导致身体不适。当然,人也会得出错误的因果关联。比如,部落里有人捡了一块石头回来,而第二天正好有几个人生病,那大家就可能误以为这块石头带来了厄运。再如,中国和印度是世界上人口最多的国家,这两个国家近代恰恰又比较贫穷,因此很多中国人就误以为人多会导致贫穷,但这与现代经济学的理论和实证分析并不相符。
预测和决策:借助于对因果关联的理解,人类可预测不同行动所产生的后果,并在此基础上制定方案以实现某些具体目标。比如,原始人如果发现了吃腐烂的果子会导致身体不适,那他们可能会在采摘的果子中挑选出那些腐烂的扔掉。又如,早期人类可能通过观察发现,春天将种子播撒在土地里,到了秋天就能收获粮食。观察到这种因果关联,人类就可能从狩猎转为播种来维持长期的食物供应。同样,错误的因果关联会导致人类犯错。比如,把人多与贫穷联系起来促使中国社会开启了人类历史上空前而且也会绝后的极端的一胎化政策。对因果关联的认识也促进工具的使用。假设人想跨过小溪,但不想打湿身体。如果认识到身边的石头放进水里会露出水面,那就可能以石头为工具在水面垫出一条路来过河。
规划:
基于对观察现象的了解和对因果关联的理解,人类可能把比较抽象、长期的目标分解成具体、短期的子目标,并对每个子目标确定具体方案并对最终目标制定整体规划。比如,幼儿园里一个女孩希望吸引一个男孩的注意。她就注意到男孩喜欢玩积木,为了讨好他,她就去给妈妈做家务挣零花钱来买积木送给他,希望获得对方的好感。这是一个整体规划和分步决策的例子。要对一个抽象的目标进行规划和分步决策,需要对与之相关的各种背景现象以及各种因素之间的相互关系有充分了解。这点对人类并不难,但对机器来说则极具挑战性。
创造发明:
指为了表达感受或者实现某种功能而设计、尝试、制造、完善某种装置、方法、过程。表达感受的创造发明可归为艺术创作,包括图像、声音、文字等各种表现形式,其效果往往是扩展、传递、激发人们的感受。比如,原始部落会通过身体上的艺术装饰来吸引异性,而音乐、舞蹈等也是常用的情感抒发形式。实现特定功能的创造发明,也即技术进步则是基于对世界运行特别是因果关联的理解,搜索、联想、设计、尝试、验证的过程。这是一个从简单到复杂的不断积累、叠加、整合的过程,从最初的取火、石器、耕作、制陶、冶炼、车轮到后来的蒸汽机、发电机、飞机、计算机等。
理论发展:
指人类对世界的系统性表达和理解。通俗来说,就是数学和科学等各种理论体系,其中数学研究的是抽象表达体系内部的逻辑关系,科学则包括物理、化学、生物等自然科学以及经济、社会等社会科学的各个领域的理论。虽然系统性的因果关联,包括对各种自然和社会现象的系统性解释属于理论的范畴,但理论并不只限于反映因果关联。比如,数学本身就不涉及因果关系。物理学的各种定律则描述了各种物理量之间的内在关联。虽然物理定律可用来预测物理系统的演化,从而被赋予因果关联的解读,但这并不是必须的。像量子理论和混沌理论甚至可以被认为为是对因果关联普遍意义的否定。在根本意义上,理论是对世界的认知模型,通过这种模型可以对世界进行更简洁、清晰、具有美感的表达。
创作发明和理论发展相辅相成,促进了人类整体认知能力的提升,也体现了人类智能的终极水平。在机器未能独立创立类似于广义相对论和现代量子力学这般精巧的理论之前,尚不能说人工智能完全超越人类。
人类智能的群体特征
上面的叙述并未区分个体和群体的认知。实际上,在人类认知能力的发展过程中,群体交流是一个关键部分。群体交流的基础是不同个体在感知和认知方面的共性,以及建立在这些共性之上的身体语言、自然语言以及其他符号系统的交流方式。作为一种社会性物种,人类认知能力的很大一部分表现为个体之间的交流与合作的能力。因此,情感交流、语言文字表达和理解、处理人际关系的能力以及领导力也是人类认知能力的重要组成部分。而棋类和球类等游戏除了本身的娱乐功能外,还可以帮助人类训练和培养各种相关技能。
除了可以把人类整体的认知进步看成是无数个体相互合作、共同努力的结果,还可以对个体的行为目标进行分解。如前所述,目前机器能处理的大部分是目标明确的问题,而人类的智能行为往往没有明确的目标。比如,人有可能漫无目的地东游西逛来消磨时间,虽然在这个过程中也可能积累对周边环境的了解。实际上,人类个体对世界的了解,尤其在初级阶段,很大部分来自于无监督的学习。因此,机器要模拟人类来进行无监督学习,也许需要能像人类那样自动产生各种探索动机。
决定人类采取这样而不是那样的行动,有感性的推动也有理性的决定。所谓感性是指支配人类行动的直觉、本能、情感等反应机制,而理性则是指引导人类行动的分析、综合、判断、推理等思维机理。与理性相比,感性反映了生命更基础、更本质、更底层的特征,对人类行为的支配也更为直接、迅速和普遍。感性在精神、潜意识甚至无意识的层面影响甚至决定着人类的绝大部分行为,如身体运动、喜怒哀乐、饮食男女、爱恨情仇等;而理性决策则是在经验、知识基础上的思考和判断,如下哪一步棋、上什么学校、从事什么职业、在哪里买房等。当然,每一个具体的行为都可能既受到感性也受到理性的影响,不能一概而论。
不管是判断环境的直觉、体现快速反应回路的本能、还是用于分解抽象目标的情绪,这些感性机制都是人类整体在漫长演化过程各种经验和智慧长期积累的结晶。相比之下,理性反映的则是个体在当前生命中各种经历、知识和思维。在这种比较下,理性追求的是个体、局域、具体、短期、明确的目标;感性则是整体、全域、抽象、长期的目标在个体身上的折射,而个体的感性行为可能是群体理性行为的基础。比如,人类追求爱情可能是一个感性行为。傻乎乎地以为对方是天下最好的人,明知火坑也要跳,一点都不理性。但反过来,如果每个个体都无比理性,那可能没人会结婚生子,整个族群也就无法繁衍延续下去。在这里,群体生存的理性通过个体的感性行为得以体现。
人类理性的基础是因果关联。只有在某种行动-后果的因果关联下,采用这种而不是那种行动才能被称为理性。如前所述,因果关联是人类思维的一种认知构建,建立在对复杂系统的简化表达前提下,即影响结果的各种相关因素可以近似地类比为多元线性回归中的不同因子。如果反映不同因素关联的动态系统远离线性状态,这些因素的影响是很难赋予因果解释的。因此,理性的范围应该是作为认知对象的动态系统处于一种接近于线性的状态。
这种情形何时会出现呢?从数学的角度来看,接近于稳定态时,动态系统的变化趋势可以在稳定态附近做线性展开。在这种状态附近,系统具有预测性,因果关系也有意义。如果系统处于非线性混沌态,一个微小的动作就可能导致系统结局大不相同,因果关系将失去意义。与近线性系统会收敛到局域稳定态不同的是,非线性态可能促进系统质变跃迁,让系统轨迹从局域收敛步入全域搜索。在这种意义下,基于因果关联和可预测性的理性所追求的是局域优化,而积累了漫长演化经验和智慧的感性则体现了人类整体在更大范围的演化轨迹。
值得一提的是,我们这里使用的“感性/理性”可能与人们平常理解的意思略有不同。下面排列的成对描述也许可以反映本文赋予给“感性/理性”的含义,每对词汇的前者对应感性,后者对应理性: 直觉/经验、内在/外在、底层/上层、先天/后天、遗传/习得、冲动/冷静、无序/有序、有机/无机、发散/收敛、突变/渐进、质变/量变、神圣/世俗、非线性/线性、不可预测/可预测、情怀/理智、混沌/清澈、综合/分析、利他/自私、群体/个体、全域/局域。
欢迎光临 长春雅诗轩 (http://bbs.yashixuan.com/dz/)
Powered by Discuz! X3.3