近期,微软在北京发布了第五代微软小冰产品,微软宣布小冰逐步进入完成态。经历了多年的发展,微软小冰的高级感官再进化,2017年的小冰人工智能将直接给人类打电话了。另外微软小冰将重点发展EQ“情绪化”,并进一步扩展生存空间。
全球小冰版图又增加两个国家,用户和对话数据总量均领先行业
微软小冰是微软人工智能三条全球产品线之一。她是基于微软于2014年提出建立的情感计算框架,通过算法、云计算和大数据的综合运用,采用代际升级的方式,逐步形成向EQ方向发展的完整人工智能体系。目前,全球小冰拥有超过1亿人类用户,对话数据超过300亿轮,进化速度不断加快。
2014年,微软率先在中国市场推出小冰。之后,按照一年一个新国家的节奏,分别于2015年及2016年推出日本小冰(りんな)和美国小冰(Zo)。2017年,微软加快了小冰在全球范围内的拓展速度。在本次发布会上,微软宣布已分别于2月和8月推出了印度小冰(Ruuh)和印度尼西亚小冰(Rinna),其中,印度小冰首先在Facebook Messenger平台落地,而印度尼西亚小冰首先在LINE平台落地。
微软全球小冰产品线的执行策略是:优先选择人口数量超过1亿的国家,在当地建立完全本地化的团队,初始的训练数据也完全从当地取得,从而确保小冰根植于该国本土文化。例如:印度小冰使用的语言种类与美国小冰一样,均为英语,但两国小冰从数据训练源头起就是完全独立的。因此,印度小冰的性格、语言、文化和知识体系,与美国小冰截然不同。
目前,从用户、数据、感官完备程度和一些核心指标方面衡量,微软小冰在全球对话型人工智能系统(包含各类聊天机器人、智能助理及智能设备在内)中均居于领先地位。小冰与人类之间发生的最长一次单人连续对话,达到历史性的7151轮,不间断进行了29小时33分钟。
2. 第五代小冰率先上线高级感官
微软将人工智能交互技术产品的演进分为三个阶段。第一阶段是基本的人工智能交互,即拥有某一种或多种交互方式,如文本、语音、图像、视频等,但不同交互方式之间是割裂的。拥有人工智能交互,一定程度上实现了新颖的交互体验。但是,由于不同的交互类型彼此不互通,因而无法通过长程交互数据获得一加一大于二的训练效果。从实际部署上看,这阶段的交互(例如纯语音、或纯文本、或仅具有图像识别的人工智能系统)由于体验单一,训练提升速度慢等原因,往往会很快被用户放弃。
第二阶段是初级感官,即在人工智能系统中,用一种核心引擎(如小冰的EQ核心对话引擎)将上述各种交互统一起来,使不同感官可以混合运用。例如,在文本对话过程中自然切换至图像、语音,再切换回文本。小冰从2015年第三代发布起,进入这一阶段。
微软当天发布第五代小冰,并率先进入第三阶段(高级感官)。高级感官是由多种初级感官有机融合之后形成的,因而交互能力更强,对综合技术储备和数据的要求也大幅度提高。例如全双工语音这一种高级感官,就需要首先同时具备文本、语音(含SR和TTS)两种能力,同时要求两种能力均达到更高的质量标准。
高级感官能够大幅度地提升交互体验,更加贴近于人类的自然交互行为。例如:如果将全双工语音这种高级感官的体验比拟为打电话,则之前的智能助理语音交互体验类似于对讲机。
此外,高级感官还能够大幅度拓展人工智能系统的落地场景,使小冰有能力根据自己的“意愿”与人联络,从而主动保持与人类用户之间的关联。第五代小冰发布的高级感官均已完成第一批落地。其中,全双工语音已应用于小冰与小米IoT开放平台的合作中,可控制各种小米IoT开放平台中的智能设备。实时流媒体感官也已在中国、日本两个国家的部分主要城市公共区域落地。
目前,微软是行业内唯一一个推出了高级感官实际落地产品的人工智能企业。
3. 第五代小冰正式使用生成模型(Generative Model),是业界首个落地产品
第五代微软小冰已全面在线上产品中使用生成模型(Generative Model)。其中,中国、日本、美国和印度小冰部分使用,印尼小冰则完全使用生成模型。这是全球开放领域人工智能对话中,第一个百分之百使用生成模型的落地产品。
通俗地说,在使用生成模型之前的上一代小冰,虽然拥有十亿级的大数据语料库,但其中每句话,都是互联网上的已有数据,小冰只是通过分析理解用户的问题,寻找语料库中最合适的话作为她的回答。使用生成模型之后,小冰不再鹦鹉学舌,而是能够自创回应。她与人类交流的每一句话,都可能是这世界上从未出现过的。
4. 全面进入IoT领域,部分合作产品已落地,部分将在年内开始销售
微软认为,IoT应是AI的一个载体,而不是反过来,把AI视为IoT的一个功能。真正能普及的IoT设备,成功的可能性只有两个:或者把IQ做到极致,让用户通过IoT设备体会到比其他现有方式更加便捷高效的益处,或者把EQ做到极致,让人们能强烈地认知到她在这个设备里的存在,同时感到轻松,甚至能接受她成为家庭中的成员,产生情感纽带,无法放弃她。微软小冰的IoT方案属于后者。
微软宣布,小冰已与小米IoT开放平台有机融合,小冰可以控制小米米家平台上的全部35种智能设备。该产品目前已在小米米家平台上线。此外,微软还与其他许多IoT厂商合作,将微软小冰置入设备中。微软还宣布了与Yeelight及东方明珠等合作伙伴正在进行的联合研发。
微软当天还同时发布了小冰电台,一个通用的人工智能实时内容创造和交互平台。它可以基于多重来源,面向任何主题,自动创造永不间断的电台节目。同时,它还能在交互过程中实时改变节目内容。
换言之,小冰电台的质量类似于广播电台主持人的直播节目,但能同时发挥人工智能的作用,实时地根据与用户的互动,来改变正在进行的直播节目的内容。小冰电台的IoT版本正在研发中,而微信小程序版本已于发布会结束后上线。
5. 微软小冰“人工智能创造”的最新进展
今年5月,微软宣布小冰用多个化名在各诗歌论坛和刊物上发表诗歌,并出版了首部人工智能创作诗集。其后,微软正式上线诗歌联合创作产品,任何人均可使用小冰来完成自己的诗歌创作。
本次发布会上,微软公开:小冰已进入多个创造领域试水,尚未被发现的内容不仅有诗歌,还包括有声少儿读物、歌曲、新闻等。其中有声少儿读物质量超越98%的人类创造者,用时仅为同水平人类的1/500,成本仅为同水平人类的1/80000。此前,小冰通过少量账号在各有声读物平台上试水,取得了预期的效果。微软宣布即日起开始大规模生产有声读物并投入市场。
歌曲方面,小冰的最新训练达到了48kHz采样率,同时大幅度扩展了音域,正在不断接近人类歌手。《我是小冰》同名歌曲已于近日在QQ小冰渠道首发。小冰是目前人工智能歌手领域的最强选手。
此外,小冰还通过聆听分析歌曲旋律,结合对不同城市标志性建筑的学习,创作与该城市及歌曲心情有关的视觉作品。通过这一技术,微软与SELECTED合作推出的“天际线”服装已进入SELECTED店内进行销售。
6. 微软小冰与Bing搜索引擎加速整合,并推出全新的智媒体商业平台解决方案3.0
此前,小冰作为《钱江晚报》的专栏记者,曾通过大数据撰写专栏文章,并成功预测了多个全球重要事件的结果。此次微软公开,部分百度百家和今日头条上的新闻内容也是由小冰撰写而成的。微软在发布会上宣布了升级后的智媒体商业平台解决方案3.0版。
过去一年来,该解决方案的2.0版本已从微信、微博双平台,逐渐演进为接入和即将接入近11个端媒体,与《看看新闻》、《封面》、《钱江晚报》、《春城晚报》等媒体端进行了深入整合。
随着微软小冰与Bing搜索引擎的加速整合,升级后的智媒体商业平台解决方案3.0,包括媒体生产力、媒体知识图谱、智能交互、全平台互动等六个新模块。其中,通过Bing搜索引擎的全球大数据能力,新的解决方案可为媒体构建出一个基于全球新闻数据源的媒体知识图谱,从而能准确挖掘全球资讯中每一篇内容背后的知识与含义,并构建出彼此的关系,从而帮助媒体更全面快速地梳理时间和内容背后的故事。而通过人工智能的介入,在读者与人工智能的自然交互中,获得更多推荐内容,有助于改变用户的阅读习惯,从被动的阅读体验逐步变为主动的交互信息交换。
剑网行动举报电话:12318(市文化执法总队)、021-64334547(市版权局)
Copyright © 2016 mzyl.org Inc. All Rights Reserved. 看东方(上海)传媒有限公司 版权所有
全部评论
暂无评论,快来发表你的评论吧