加入收藏 | 设为首页 | 会员中心 | 我要投稿 云计算网_宿迁站长网 (https://www.0527zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长资讯 > 评论 > 正文

AlphaGo赢了人机大战第一局,阿里来科普一下什么是“人工智能”

发布时间:2016-03-12 04:41:10 所属栏目:评论 来源:阿里百川专区的网站
导读:前几天,万众瞩目的李世石 VS AlphaGo 世纪大战结果出炉!AlphaGo 惊天逆转,战胜李世石!开局李世石有些动摇,但随着棋局的进行,李世石渐入佳境,形势越来越好了。但正当

摘要:【人工智能-智能语音交互系列】系列文章第一篇!每一个人工智能的领域背后都有详细的技术分支,语音识别是自然语言处理的一部分,而后者又是人工智能的一部分。借此,我们就来科普一下,智能语音交互体验背后的支撑技术之一——自然语言理解,看看机器是如何了解人类的意图的。

前几天,万众瞩目的李世石 VS AlphaGo 世纪大战结果出炉!

AlphaGo 惊天逆转,战胜李世石!开局李世石有些动摇,但随着棋局的进行,李世石渐入佳境,形势越来越好了。但正当大家都认为棋局已到垃圾时间的时候,李世石一个小失误,局面重新变得扑朔迷离。AlphaGo 成功凭借李世石的失误,成功逆转,获得了最终胜利!这是人工智能和围棋领域的历史性事件,人工智能第一次在围棋领域战胜了世界冠军!

可以说,AlphaGo 是现阶段围棋人工智能领域最厉害的角色,看到这个场景,不亚于我们在科幻电影中看到机器人可以像真正的人类一样与我们对话。近年来,人工智能的创业和研发活动越来越活跃,机器变得越来越聪明,包括机器学习,计算机视觉,语音认别,智能机器人等领域都已经有一些重大的技术突破。在日常的生活场景中,以语音识别来说,作为能够架起用户跟成千上万的互联云端服务之间的桥梁,在生活中的众多场景中已经给我们带来巨大的体验优化,如语音操控、语音支付等等。

每一个人工智能的领域背后都有详细的技术分支,借此,我们就来科普一下其中一个领域,智能语音交互背后的核心支撑技术——自然语言理解,看看机器是如何了解人类的意图的。

此文为云栖社区【人工智能-智能语音交互系列】第一篇,文章持续更新中,敬请关注!

《自然语言理解  Natural Language Understanding》

作者:阿里云-数据事业部-iDST-高级算法专家 李永彬(花名:水德)

1、引言

Siri,Cortana,Google Now,小冰,度秘,随着技术的进步和自然人机交互需求的扩大,个人智能助理渐渐成了各大巨头争夺的下一个入口。这些智能助理尽管能力有大有小,但有一个共同特点——用户能通过“自然语言”与其交互,这比起传统的用关键词进行搜索的方式,显然是一个不小的进步。比如,当你说“订一张明天北京去杭州的机票,国航头等舱”时,一般的搜索引擎会给出如下的网页列表:

AlphaGo赢了人机大战第一局,阿里来科普一下什么是“人工智能”

而我们的个人智能助理能直接给出你期望的答案:

AlphaGo赢了人机大战第一局,阿里来科普一下什么是“人工智能”

要想从“订一张明天北京去杭州的机票,国航头等舱”得到这种直接答案,首要的一步就是要对自然语言进行理解。

自然语言理解(Natural Language Understanding,NLU)以语言学为基础,融合逻辑学、心理学和计算机科学等学科,试图解决以下问题:语言究竟是怎样组织起来传输信息的?人又是怎样从一连串的语言符号中获取信息的?换种表达就是,通过语法、语义、语用的分析,获取自然语言的语义表示。

2、自然语言语意表示

自然语言理解的结果,就是要获得一个语义表示(semantic representation):

AlphaGo赢了人机大战第一局,阿里来科普一下什么是“人工智能”

语义表示主要有三种方式:

分布语义,Distributional semantics

框架语义,Frame semantics

模型论语义,Model-theoretic semantics

2.1 分布语义表示(Distributional Semantics)

说distributional semantics大家比较陌生,但如果说word2vec估计大家都很熟悉,word2vec的vector就是一种distributional semantics。distributional semantics就是把语义表示成一个向量,它的理论基础来自于Harris的分布假设:语义相似的词出现在相似的语境中(Semantically similar words occur in similar contexts)。具体的计算方法有多种,比如LSA(Latent Semantic Analysis)、LDA(Latent Dirichlet Allocation)及各种神经网络模型(如LSTM)等。

这种方法的优点在于,它完全是数据驱动的方法,并且能够很好的表示语义,但一个很大的缺点在于,它的表示结果是一个整体,没有进一步的子结构。

2.2 框架语义表示(Frame Semantics)

顾名思义,这种方法把语义用一个frame表示出来,比如我们一开始举得例子:“订一张明天北京去杭州的机票,国航头等舱”,表示如下:

AlphaGo赢了人机大战第一局,阿里来科普一下什么是“人工智能”

在计算方法上,典型的比如语义角色标注(Semantic Role Labeling),具体可以分为两个步骤:frame identification和argument identification,frame identification用于确定frame的类型,argument identification用于计算各个属性的具体值。

这种方法和distributional semantics相比,能够表达丰富的结构。

2.3 模型轮语义表示(Model-theoretic Semantics

模型轮语义表示的典型框架是把自然语言映射成逻辑表达式(logic form)。比如对于下图中的“中国面积最大的省份是哪个?”,将其表示成逻辑表达式就是图中红色字体部分,进一步那这个逻辑表达式去知识库中查询,就得到了答案。在计算方法上,典型的就是构建一个semantic parser。

AlphaGo赢了人机大战第一局,阿里来科普一下什么是“人工智能”

模型论语义表示是对世界知识的完整表示,比前两种方法表达的语义更加完整,但是缺点是semantic parser的构建比较困难,这大大限制了该方法的应用。

2.4 我们目前采用的语义表示

我们目前采用的是frame semantics表示的一种变形:采用领域(domain)、意图(intent)和属性槽(slots)来表示语义结果。其中,

领域是指同一类型的数据或者资源,以及围绕这些数据或资源提供的服务,比如“餐厅”,“酒店”,“飞机票”、“火车票”、“电话黄页”等;

意图是指对于领域数据的操作,一般以动宾短语来命名,比如飞机票领域中,有“购票”、“退票”等意图;

属性槽用来存放领域的属性,比如飞机票领域有“时间”“出发地”“目的地”等;

对于飞机票领域,我们的语义表示结构如下图所示:

AlphaGo赢了人机大战第一局,阿里来科普一下什么是“人工智能”

(编辑:云计算网_宿迁站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读