对话翁嘉颀:畅聊竹间智能情感计算技术与商业落地|CCF-GAIR2018【鸭脖娱乐】

本文摘要:(公共编号:2018年全球人工智能和机器人峰会(CCF-GAIR)在深圳召开会议,峰会由中国计算机学会(CCF)主办,由香港中文大学(深圳)主办,宝安区政府大力指导,是国内人工智能和机器人学术界、工业界和投资界三大领域的顶级交流盛会CCF-GAIR2018沿袭了前两届顶级阵容,获得了1个主会场和1个专业场所(仿生机器人、机器人行业应用于计算机视觉、智能安全性、金融科学技术、智能驾驶、NLP、AI芯片、IoT、投资者)的非常丰富的平台,希望三界参加者从产学研究的多个维度中提供更加前瞻性和落地性的会议内容和体验。

鸭脖娱乐

(公共编号:2018年全球人工智能和机器人峰会(CCF-GAIR)在深圳召开会议,峰会由中国计算机学会(CCF)主办,由香港中文大学(深圳)主办,宝安区政府大力指导,是国内人工智能和机器人学术界、工业界和投资界三大领域的顶级交流盛会CCF-GAIR2018沿袭了前两届顶级阵容,获得了1个主会场和1个专业场所(仿生机器人、机器人行业应用于计算机视觉、智能安全性、金融科学技术、智能驾驶、NLP、AI芯片、IoT、投资者)的非常丰富的平台,希望三界参加者从产学研究的多个维度中提供更加前瞻性和落地性的会议内容和体验。在自然语言处理专业场所,竹间智能CTO翁嘉忌应邀自然语言处理落地问题和应用于未来圆桌辩论嘉宾,分享自己的意见。

会议后,对翁嘉高进行了一对一的采访。竹间智能成立于2016年,主要实现文本分析、自然语义解读、感情计算。竹间智能主要有两条产品线,一条是类脑对话机器人,包括呼叫机器人、导游机器人、金融机器人、市场营销机器人、个人助理、品牌IP机器人等,一条是多模式感情识别系统,另一个是感情识别分析系统、脸部表情识别系统、印象分析系统、广告效果分析系统、呼叫中心质量检查系统、教室感情分析系统等。

目前,对话式人工智能的公司大多集中在文本上,竹间智能的多模式感情识别包括文本、声音、脸部表情等多个模块。这次采访翁嘉高也主要围绕情感计算技术和商业落地两个方面。翁嘉高明显,嵌入式分为三个层次,最底层是自然语言处理,第二层是意图解读,第三层是解读背后的意思,现在行业还停留在前两个阶段,要做第三个阶段,感情计算是不可避免的。

感情计算的难题是,不仅要正确解读单一模式的感情,还要正确判断多个模式的感情发生冲突时,哪个感情是现实的。例如,当一个人的声音感情高兴时,脸的表情毕竟很生气,他是高兴还是生气?更无能为力的是,AI知道人的感情后,如何展开反应,如何寻求心情低下的人?竹间智能以电影《Her》中的智能机器人赛曼莎为原型,指出机器人应该能够理解面部表情,不能理解人类的对话,从一开始就致力于计算多模式的感情。此外,创始人简仁贤从一开始就不仅关注手机和扬声器中的智能语音助手,还关注商店和零售等场景。在这些场景中,只有文字和语音的互动似乎太多了,视觉是必不可少的。

但是,现在不仅要探索零售场景,还要探索感情计算的落地场景,在家庭等很多个人场合,很难拒绝接受机器人安装照相机。翁嘉高是指现在语文和文本技术需要在特定领域的老板解决问题,特定领域需要预约酒店,预约餐厅参观,与人展开自然对话,根据机器人的逻辑进行说明。

未来,每个人都有自己的智能助理,需要解读你的感情、意图、上司照顾日常生活。每个企业都没有呼叫机器人,今后用户的智能助理和企业的呼叫机器人工作的可能性很高。在这些场景中,大公司和创业公司都有机会,公司不能解决问题的所有技术和场景。以下是访问原文,展开了不改变意图的编辑和整理。

:你现在在竹间智能管理什么工作?重新加入竹间前你的工作经验如何?翁嘉定:我从1982年开始专门从事计算机,27年前认识了人工智能。当然,那个时代实现实现人工智能。因为当时的人工智能已经下降了。

当时,大多数人工智能的人都转移到搜索引擎,因为搜索引擎与文本分析有一定的关系。我在搜索引擎领域大约11年了,现在我又回到了人工智能。

这次AI应该不会再发泡了。我知道有必要进入人类的生活。

我大约两年半前重新加入竹间智能,现在兼任公司CTO,负责管理技术部分,设计竹间现在整个对话的结构,模块如何表现,模块如何交流等,对外项目整体落地:能明确说明有什么模块吗?翁嘉定:聊天机器人大约分为三类。第一个是功能型机器人,如SIRI、微信的语音助手,可以打开天气,可以打开股票,可以设定警告,第二个是知识型,可以回答陆奇在哪里工作(这是昨天仅次于的新闻,他再次参加了很多拼写),陆奇离开百度后,股票下跌了多少(3天左右下跌了18分左右)第三是闲谈,可以和人类进行感情对话,展开情景对话。

如果你告诉机器人你的爱,我们希望机器人如何恢复,如何控制整个对话的上下话题。我负责管理的是对话整体的流程控制。例如,用户说了一句话,机器人必须识别是否应该继续执行任务,是否应该获得科学知识,是否应该打开闲谈。

因为每个模块都可以接触。这和搜索引擎一样,百度的搜索引擎背后有约300个模块,谷歌背后有约500个模块,今天只有300个以上的模块出答案,出答案后,我应该怎样整合答案,排名。

第一页应该看什么,第二页应该看什么?那个聊天机器人也是,聊天机器人更加苛刻。我听不到一百句话,听不到一句话。此时,我应该选择哪个词来问,这样它就不会更生动,也不会那么呆板,但是问题会太奇怪。

这是整个对话的控制。:现在有像微软公司的小冰一样同时发展智商情商的对话机器人,创业公司更加横向,主要攻击任务类型,或者科学知识图像领域。竹间智能向哪个方向发展?翁嘉高:微软公司冰融合智商和情商的概念是正确的,竹间智能创始人简仁贤也是微软公司冰的创始人之一,他于2015年从微软公司创立竹间智能(Emotibot),公司名称的命名是感情机器人的意思。竹间智能只是比微软公司的冰早一年半就成为感情机器人。

情商和感情不是意思,情商的意思是我知道解读你,我侮辱你,我冷冷地问什么,那当然包括感情在内。在文字感情方面,一些企业实现了以、胜、中三种分类,微软公司的小冰可能实现了6种,竹间智能在文字感情方面实现了22种分类,不能更准确地观察无聊、嫉妒。

光是文字的感情太多我们才能发出声音和感情。例如,一个人说我考了500分,这时不知道应该恭喜还是应该请求,必须告诉我语气。一般来说,声音的感情不会比文字的感情最重要,信号更反感。

脸部表情的感情很简单。我说话的时候,我的脸有变形的可能性,我的嘴正好张开,这个时候抓住,并不意味着我现在很吃惊。那么,文字、声音、表情混合起来就更简单了。

像我经常推荐的例子一样,我笑着,回来的同事说你死了,脸的表情和文字的感情冲突,这时该怎么办?这是多模式感情的概念,你现在的感情是文字、声音,再加上脸的表情,混合整体,然后各有各的权重,一般文字的比重不会稍低,声音不会最低,脸的表情在中间。刚才的例子,我笑着说你死了,这看起来像以下内容。如果前面两个人都有趣的话,我突然笑着说你死了,那还是有趣的话,前面两个人明显吵架的话,我突然笑着说你死了,那个同意威胁你,所以这种感情不仅仅是文字。

:感情计算的概念最近大家都说得很多,能说说你对这个概念的解释吗?翁嘉高:感情计算是MIT教授Rosalind的Picard明确提出的,他是感情计算的祖先。而且,现在我一般把嵌入式分为三个层次,最下面的层次叫做自然语言处理。例如,肚子饿了想不吃点什么这两个词,其句法分析不同,这是最下面的层次。

第二层被称为意图解释,这两个词不同,但意图完全一致。其意图可能意味着我想订购商店,或者去附近的餐馆。

并且,第三层是背后的意思,现在还没有人能做到。在我今天的情况下,我们第一次见面,如果我突然说我饿了,我相信你的心情会太好。你总是说我想吃饭吗?那么,如果我对女同事说我饿了,她真的说我是契约她来睡觉,还是有不正当的企图呢?有不同的场景,有不同的人,在什么情况下说某种程度的话,只是背后的意思不同。现在大家还在做第一层和第二层。

我是怎样把句子分开的,我是怎样把句法结构分开的。在这方面,国内哈工大有很多专业。第二层意图解读这也是很多人做到的。

现在可以大致使用了。我对电视和扬声器说来谁的歌,说要听音乐。然后我告诉扬声器,谁的歌好听并不意味着我想听他的歌。

我只是说我将来不会放他的歌给我。我现在可以正确理解这些句子的意图。第三层,背后的意思。谈饿了么,这句话到底背后的确是什么意思?那就跑到这一步,情绪计算是不可避免的,整个场景、情况是不可避免的。

:现在竹间的智能有融合文字、声音、脸来计算感情的落地场景吗?翁嘉高:我们的长子夏普电视作为新零售的例子,夏普有新开业的百货商店分店,在那家百货商店里总共买了5家电视。开业前三天夏普营业额90万,另外四家特合营业额只有四十几万,夏普一家多达其他四家总和,这是怎么回事?我们可以在卖场门口敲一个大电视屏幕,抓住每个路人的脸,识别男人/女人、长发/短发、年龄、表情、面值等,很多人停下来看。然后,根据用户的图像,展开不同商品和优惠活动的推荐。

这使得进入商店的客流超过其他人的五倍。进店后,我们有无人的智能架子,上面安装了平板电脑和照相机,照相机看到长发的女孩子回头,智能架子不会积极说话。这个女人,你的头发很漂亮,我这里有洗发、护法、润发的产品,你有兴趣吗?如果照相机发现女孩子的脸上有黑斑就不会自动推荐遮瑕膏等产品。

如果对方对此,就不会成为话题。如果照相机发现消费者的脸色更漂亮,就不会暂停话题。

鸭脖娱乐app

因此,我们看到这个案例的互动包括脸、声音和文字。:现在的对话式人工智能主要攻击语音,竹间智能为什么一开始就尊重视觉?翁嘉高:我们对话式人工智能的想法主要来自电影《Her》,其中的智能助手赛曼莎只能感受到用户的状态,可以看到用户的表情听到用户说的话。任何人的交流,声音是最重要的,但往往一句话也不说,表情已经足够了。例如,遇到商店,看到某个产品遮住反感的表情,已经表现出明显不讨厌这个产品。

所以,当时做的时候,最初跟上,我们有图像处理、声音处理、文字处理,当时的上司(简仁贤)已经考虑了他将来想要的场面。不仅包括手机嵌入式、扬声器嵌入式,还包括在卖场。视觉是必不可少的部分。所以最初上司的野心很大。

:文字、声音、脸部多模式感情计算的难题在哪里?翁嘉忌:大问题当然是几种感情冲突时该怎么办?如果你说文字很高兴,声音也很高兴,脸的表情也很高兴,那就没问题了,小学生也很高兴。那个声音很生气,文字很高兴。

例如,我生气地说今天很高兴。听了之后,你是什么意思?要解决问题,首先要正确识别文字、脸部和声音的感情,另一个是几个感情冲突时,我应该是谁?一般来说,声音感情所占的比例更大,但声音感情生气的话,自信度只有三四分,文字说你很高兴,自信度是九十九分。

这个时候该怎么办?另一个最重要的是整个情况,有三种以上的模式识别,但是只有一部分,如果太准确的话,我必须看倒数的情况。人的感情变化不太快,你当然有时不会惊讶,也不会瞬间生气,但并不意味着你生气的下一秒突然高兴,所以必须考虑倒数的感情。

这是一个大问题。最后,最好的地方是智能助手发现你的愤怒和悲伤,如何安抚你,请求你,分辨感情后,该怎么对待呢?:多模式感情计算的方案在你们现在的业务中占很大比例吗?翁嘉高:现在智能呼叫大部分都没有视觉,智能电视、冰箱、扬声器也没有照相机,但是你家里有很多照相机,很担心。这个承认侵犯了隐私。

在公共场合,例如外面的卖场、银行、照相机和监视摄像头,这个大家都拒绝接受。例如,我去试镜的时候,照相机对着我,在这里说话的时候,上司我做了脸部分析。

有些奇怪,但可能拒绝接受。人们对摄像头的接受程度取决于场景,也许取决于时代。每个时代拒绝接受的东西都不同。

你知道你不会用手机吗?因为不能使用电脑,所以这个可能接受度不低。使用APP吗还是习惯用电话说话,用电话交流,不是app,而是用网络。五十六岁的一代,他可能不习惯使用搜索引擎。

因为他长大的时代没有搜索引擎。而且,四十多岁的一代,以APP的比例,意味着二十多岁的一代比较多。因此,这仍然取决于未来的一些变化,一些场景拒绝接受,另一些场景拒绝接受。

:现在有些扬声器已经有屏幕了,有可能加入视觉吗?翁嘉高:现在特别可能还不好买。一般来说,如果有一个照相机,我可以再做一个盖子,盖上这个盖子,盖上照相机。必须告诉用户这里有照相机,并且可以在适当的时候复盖照相机,这个用户可以拒绝接受。

否则,突然有特殊的照相机,成本增加,反而买得不好,这个扬声器在做什么呢?而且扬声器至少说OK,我一动,照相机就让步,不是你在家里的天花板上放了照相机,而是知道没有隐私。:如果是机器人呢?拥有与人眼相近的眼睛。

翁嘉高:我们看科幻电影的时候,大家都拒绝接受。机器人可以在你家走路吗?但是,你知道挂着这样的机器人,照相机在你家,你的心现在应该很痛苦。:竹间智能有机器人工厂(BotFactory),协助企业定制机器人,不让定制机器人有自己的个性吗?翁嘉高:现在我们只做最简单的事情,机器人有机器人的属性。

机器人叫什么名字,是男生还是女生,今年多少岁你晚上睡不着觉吗?宽度是什么样的?爸爸是谁?妈妈是谁?从哪里来的?我们不会根据大家最常问的这些问题展开原著。另外,机器人的风格也有坦率的,也有可爱的。这个我们现在有电源。有些机器人可以开玩笑,有些机器人不能停止天气。

我们试着下一步,有没有你自己的机器人,我有你平时和朋友聊天的数据开展训练,自学说话的方法,你有机器人,用你的风格聊天。这个步骤在技术上是不现实的,现在只是数据量的问题。我必须得到足够的数据,这样机器人才能逐渐类似于你的不道德。

但是,这与不想公开隐私有关。和朋友说话的对话是隐私。

:这是实验过的吗?翁嘉贵:我们两年前做过实验,但是找到用户没有这种耐心。因为可能需要很多时间,所以请告诉我孩子要教几年十几年,二十年,对吧?有那么多耐心教机器人吗?请告诉我两天左右没有耐心,这是耐心的问题。:现在像微软公司的冰一样,在人工智能创作方面发展起来,她不会写诗,不会唱歌,也不会写新闻。在这方面,你们是怎么想?翁嘉忌:只是写诗,对联,这种可玩性相对较低。

因为只是在非常有限的方向上解决问题。从冷笑话的角度来看,这些很好,大家都不新鲜。但是,从简单的角度来看,为了解决这个问题,有必要为我赚钱,现在还没有用。

当然,冰的定位是陪伴,那么无聊。这个填充花哨的东西反而是件好事,帮助。

:竹间智能从一开始就重视商业化吗?翁嘉定:是的。我们必须回顾商业化的地方。我做了有趣的机器人,只是拿不到钱。微软公司无所谓,微软公司有Windows、Offices这样的利益业务,可以让冰变成冷笑话。

:现阶段,你希望对话人工智能超过什么水平?翁嘉高:我现在技术水平需要在特定领域的老板解决问题。特定领域是指订购酒店,订购餐馆,解读对话。设立餐厅的机器人必须解读特定的语言。例如,七八个有两个孩子和七八个有两个孩子这两个词意思不同。

鸭脖娱乐污版下载

人说,一般需要说明,没有各种各样的意见。例如,我和父母和长子的女朋友在一起,这意味着需要几个座位?他不告诉他四个人,他告诉他奇怪的文字。那么,在这个领域,不是让人适应环境的机器人,而是让机器人听不懂人的话。

我真的是未来,每个人都有自己的机器人,那个机器人告诉你的兴趣,你告诉他老板我会订购店内吧。他告诉你不吃什么,不吃什么,昨天,前天不吃什么,今天不要订购一模一样的东西。我跟他说老大我给我妈打电话吧,他给我妈指的是谁。

然后告诉妈妈的电话,几点打电话比较合适,他可能会警告你,现在太晚了,妈妈已经睡着了。今后,每个企业都可能没有自己的机器人。

例如麦当劳,可能有预约的机器人。上司管理预约。如果有自己的机器人,麦当劳有机器人,将来机器人可能会和机器人交流。

我只要跟我的手环说话,上司我就点个巨霸吧。然后说巨无霸是麦当劳,去找麦当劳的机器人,两个机器人不一定是用人语交流的。他们不会用那个方法交换信息。然后麦当劳处理了这个,把这个订单扔掉了。

:在这样的未来场景中,大公司占有终端优势,创业公司的机会在哪里呢?翁嘉玉:微信是一个非常自然的入口,因为每个人都习惯关闭微信。例如,我在微信上说,我这个月刷了多少卡?微信的机器人说,招募银行、交通银行、浦发的卡,去找这三个机器人,上司做身份认证,不需要进入三个银行的APP,微信的机器人需要告诉他三个银行的信息。当然,入口难以保护小公司,但语义解读,微信一家做不到,腾讯一家做不到。

我的意思解读包括每个招聘、工行、浦发,其后面也有这个机器人拒绝接受这些指令。或者拒绝接受自然语言。这只是每个家庭都必须合作。有关文章:竹间智能简仁贤:千篇一律的聊天机器人。

|Chatbot趋势探索自然语言处理的商业落地:从基础平台到数据算法|CCF-GAIR脚本2018微软公司讨论:智商和情商兼备的语音助手少女歌手小冰告诉我们:不能作为歌曲合唱的人工智能登场的原创文章,允许禁止发表。下一篇文章发表了注意事项。

本文关键词:鸭脖娱乐,鸭脖娱乐app,鸭脖娱乐污版下载

本文来源:鸭脖娱乐-www.pennyspen.com

相关文章

admin

评论已关闭。
网站地图xml地图