中国社会科学院邮件系统 丨
English

学者解读人工智能的任务和方法


2018年06月15日 08:30    来 源:《社科院专刊》2018年6月15日总第442期     作者:赵京桥

  本报讯  近日,中国社会科学院财经战略研究院2018年度第8期“双周财经论坛”在京举行。本期论坛特邀中国科学院计算技术研究所研究员徐君作题为“从Alpha Go到智能搜索:浅谈人工智能的任务和方法”的学术报告。活动由中国社会科学院财经战略研究院副院长夏杰长主持。

  徐君主要从人工智能任务和方法上介绍Alpha Go的技术创新,以及其对当前智能搜索技术发展的重要贡献。

  徐君对“人工智能”的概念进行了阐释。他认为尽管人工智能成为当前最热门的领域,人们对其科学概念有诸多讨论,但到底什么是人工智能并没有形成共识,很大原因在于人类对自身智能的理解非常有限,对构成“人”的智能的必要元素也了解有限。在这种情况下,当前对人工智能判断的主要方法之一,是依据外在表现判定是否具有“智能”,即“图灵测试”。图灵测试避免了哲学意义上对机器是否能够拥有智能上的争论,但也存在很多不足。

  在对人工智能概念和图灵测试进行分析后,徐君介绍了人类的棋类游戏成为人工智能测试任务的发展历程。IBM的超级电脑“深蓝”战胜国际象棋世界冠军卡斯帕罗夫,是Alpha Go之前人工智能在棋类游戏测试上的成功案例,计算机通过近似穷举的方式战胜人类,代表了高性能计算机技术取得了突破性进展,但穷举搜索并不意味着“深蓝”实现了“智能”。围棋是人工智能棋类测试任务中最为复杂的棋类游戏,由于围棋的落子可能性很多而且棋局很长,也就是搜索的宽度很宽、深度很深,现有计算机技术无法进行穷举搜索。Deep Mind研发的Alpha Go、Alpha Zero能够战胜人类顶尖棋手,一方面是有其强大的计算机系统支撑,但主要的技术突破在于搜索算法的突破,实现了机器的深度强化学习和自学习。

  徐君认为,Alpha Go的深度学习,实现了以过程为中心的传统精确算法向以优化为中心的模糊算法转变。围棋是一种完全信息下交替选择的马尔科夫博弈游戏。Alpha Go通过智能体—环境交互建模决策序列,进行深度强化学习,其马尔科夫决策过程(MDP)包括了状态、动作、短期奖励、策略和长期回报五个过程;通过深度强化学习,Alpha Go建立了其策略网络(估算每一个落子位置的概率)和价值网络(估算当前棋局的胜率)。Alpha Go以及完全通过自学习形成的Alpha Zero的出现和取得的成功,代表了计算机在深度强化学习能力上的巨大突破,计算机可以在无人类积累的数据和指引下完成学习任务,并可以在能力上超越人类。但徐君并不认为Alpha Go的人工智能摆脱了对人类知识的依赖。

  徐君分析了Alpha Go的技术突破对智能搜索发展的贡献。他认为,利用深度强化学习技术建模的智能搜索技术,可以更好更快地为用户提供所需要的搜索结果。当前,领先的互联网公司都在利用计算机进行深度强化学习,提高信息流处理效率,为用户提供更好的使用体验。

  (赵京桥)

  

  
责任编辑:刘远舰

本网电话:010-85886809 地址:中国北京建国门内大街5号 邮编:100732

版权所有:中国社会科学院 版权声明 京ICP备11013869号 京公网安备11010502030146号