智能音箱系统论文?智能广场舞音响的原理

seosqwseo2周前 (04-29)测评日记11

一、智能广场舞音响的原理***功能及其推广价值论文

智能广场舞音响的原理、功能及其推广价值论文

在日常学习和工作中,大家都有写论文的经历,对论文很是熟悉吧,通过论文写作可以培养我们的科学研究能力。那么你有了解过论文吗?以下是我收集整理的智能广场舞音响的原理、功能及其推广价值论文,仅供参考,大家一起来看看吧。

摘要:

科学技术的飞速发展提升了人们对生活水平的要求,使得智慧城市成为旧城改造和新城建设的主要方向,作为智慧城市建设对象之一,智能广场舞音响将逐渐取缔传统音响。在文中主要介绍了智能广场舞音响的工作原理,分析了其未来发展的可能性和制约因素,提出了其在城市建设中的施工技术应用等。

关键词:

广场舞音响;定向声技术;互联网技术;

引言

随着社会的发展,现代人的生活水平也逐步提高,对强身健体的需求达到新的高度,广场舞应运而生。但矛盾也随之产生,噪声扰民是其中具代表性的问题之一。为了解决这个问题,以及顺应互联网技术和5G技术的快速发展,智能广场舞音响设备将逐步替代传统音响设备。在施工方面,同样也需要考虑到其特有的功能而去采取合适的技术方案,以便充分发挥其功能。

1.智能广场舞音响的原理

1.1定向声原理

智能广场舞音响的定向传声功能是基于定向声技术,利用两列超声波信号在空气中自解调作用产生具有高指向性的可听声,将声音的传播控制在指定的区域内,即该声音只能被指定区域内的人所接收,创造了一个不给周边环境带来噪音污染的音频空间。利用该技术,在城市中的居民活动区域周边安装定向声学音响,可以使居民活动区域划分成多块,广场舞的音效也不再能影响到其他居民的活动。

1.2智能联网技术

传统广场舞音响功能单一,只具备普通的播放功能。而智能广场舞音响在具备播放功能基础上,还可以利用互联网,将设备接入网络。借助当今高度发达的互联网技术,搭建一个智能网络平台,此平台拥有内容播放、后台管理以及前端应用三个系统,其中内容播放系统可以实现远程信息发布、素材管理、排期管理、广告投放、广告投放监控和评估等;后台管理系统为城市管理人员所设计,能够使管理人员掌握系统的核心控制权,例如队伍审核、队伍管理、设备管理、场地管理等;前端应用系统为居民使用者服务,可以进行场地预约、时间预约、上传健身音乐等*作,领队还拥有组建队伍、队员审核等权限,可以采用微信小程序、移动APP的方式*作,简单易用,轻松上手。

图3智能音响的互联网应用

2.智能广场舞音响的功能及其推广价值

2.1智能广场舞音响的功能

智能广场舞音响的定向声学技术及其接入互联网的特性,决定了其满足当今城市居民对生活智能性和方便性的需求。

(1)解决广场舞音乐扰民问题。近年来,随着广场舞的'兴起,广场舞音乐扰民问题越来越严重,其根本原因在于普通音响设备的声音不定向传播特性,一小片区域对于音乐的需求会同时影响一大片区域。利用智能音响设备的定向声技术,可以将居民生活区分成多个区域,即便是相距很近,也能完成无声区与有声区的分隔。由于该声音的高指向性与定向传播性,处于智能音响设备工作区域外的其他地方,只能听到微弱的声音甚至完全听不到声音。因此,既解决了部分群众对健身的需求,又不干扰其他居民的正常生活,广场舞扰民问题将不会再存在。

(2)促进城市建设的智能化。在生活高度智能化的今天,城市居民对于生活智能化的需求也变得越来越高,传统的音响设备功能的单一性将决定其被淘汰的命运。智能音响不单单只是一个音响,更是一个具备互联网功能的智能城市设备。城市管理者通过互联网可实现对所有设备的统一*作和调控,设置定时开放及关闭时间,同时也能利用其完成相关的文化宣传与建设,一物多用,使城市管理更为智能化。智能音响的互联网功能也同时能使居民获益,广场舞爱好者不用再随身携带U盘等移动存储设备来实现播放特定的歌曲,而是能够直接利用互联网,利用扫描二维码等方式,从网络资源中选择喜爱的歌曲,方便了居民的同时也为居民提供了更多的选择。

(3)满足城市美观的要求。智能广场舞设备外观看起来新颖时尚,且在施工过程中会综合考虑使用的需要,选择特定的区域安装,可以代替以往的大喇叭等设备,使整个区域看起来统一、协调且美观,并且还可以根据不同城市的文化与特点,设计特定的外观,提升城市美观度(图4)。

图4智能广场舞设备效果图与实例

2.2智能广场舞音响的推广价值

智能广场舞音响设备能够完美解决城市发展中存在的部分问题,提高了城市居民生活的品质,达到一物多用,一物精用等特点,节约城市空间,提升城市功能,不仅如此,该音响设备能够为城市管理者提供巨大的便利,解决部分城市管理难题。

从城市建设来说,智能音响设备更能提升居民的幸福度,满足居民的日常生活需求,改善居民的生活品质,符合城市建设的根本目的。智能音响设备采用新技术,更能适应现代社会发展的趋势,满足长期使用时居民对功能的要求,不至于短期内被淘汰和更换,从长期发展的角度来看,更加经济。目前旧城改造的项目越来越多,引入了智慧城市等概念,智能广场舞音响设备完美契合该理念,可以成为智慧城市建设中重要的一环,符合城市改造的未来发展方向。

3.结束语

智能广场舞音响设备将先进的定向声技术以及互联网技术同传统音响相结合,使传统音响的功能提升与革新,解决了目前城市中存在的一些问题,提升了城市居民的生活水平,给城市管理提供了便利,是新时**展需求与科学技术结合的新产品,具有较高的利用价值。由于智能音响设备的诞生时间不长,因此也有一定的可发展性,如音质的提高、功耗的优化等问题可以改进。综合来说,智能音响设备应用面较宽、应用价值高,是目前城市建设和旧城改造中值得考虑使用的设备。因此,智能广场舞音响具有较高的推广价值。

参考文献

[1]潘凤英.广场舞**背后的理性思考和对策研究[J].厂广州体育学院学报,2015,35(4):25-27+45.

[2]刘军.声波定向发射器的原理研究与电路实现[J]中国人民公安大学学报:自然科学版,2011,17(3):84-87.

[3]谢将剑,霍静怡,赵明杨,等基于声频定向系统的定向音箱的设计[J]电声技术,2016,40(4):17-21.

[4]章凡为.灯光音响工程施工技术浅谈[J].艺术科技,2006(1):21-25.

;

二、小度智能音箱显示异常运动什么意思

近几年来,智能音箱的普及度非常高,不少人都会选择购置智能音箱并通过语音进行简单的交互。然而,也有很多人在使用过程中,发现智能音箱存在着一些“听不懂人话”的缺点……

作为小度音箱(无屏基础版)的用户,本文针对使用中的一个体验细节进行分析,并尝试给出语音交互的解决方案。

一、CASE示例场景1

用户:小度小度,播放金玟岐的《十三》/播放SHE的《十七》

小度:好的,播放金玟岐的《岁月神偷》/好的,播放SHE的《super star》

用户:小度小度,播放金玟岐的《十三》/播放SHE的《十七》

小度:好的,播放金玟岐的《岁月神偷》/好的,播放刘德华的《十七岁》

……

无限循环

场景2

用户:小度小度,播放邓紫棋、艾热的《光年之外》/播放邓紫棋的《光年之外》热爱版

小度:好的,播放邓紫棋的的《光年之外》

用户:小度小度,播放艾热的《光年之外》/播放邓紫棋的《光年之外》热爱版

小度:好的,播放邓紫棋的的《光年之外》

……

无限循环

二、问题抽象

问题1:当播放音乐的语音指令有2到3个甚至多个约束条件的时候,DuerOS有时会回应错误问题2:即使用户”字正腔圆、咬牙切齿“的反复重复同一条指令,DuerOS仍会在多个错误回应之间循环切换,反复给出错误的回应三、问题可能原因分析 1. ASR(自动语音识别)识别错误或NLU(自然语言处理)分词、忽略关键条件等错误

也就是说,在系统看来,它所收到的指令,前者可能类似于”播放SHE的’时期‘“,后者则类似于”播放SHE的十/七“或者“播放SHE”(忽略了“《十七》”之类,理解的错误造成了小度无**确播放。

2.版权问题

经验证小度的音乐版权服务方,百度音乐和QQ音乐都没有金玟岐的《十三》的版权,但有其他几首歌的版权,因此版权理应也不是这个体验洼地的主要原因。

3.策略问题:小度的语音交互什么时候应该进入“对话模式”?

相比问题1,问题2才是造成这个体验洼地的关键。这是因为,在小度已经无**确识别用户意图的同时,没有通过进入对话模式给用户提供更多解决问题的方案,而是机械的重复系统里置信度高的*作,这无疑会使得用户火冒三丈。

所谓“对话模式”通常有多轮的语音交互,并且AI能够理解用户的上下文含义,从而更“聪明”地做出回应,举个经典的例子:

用户:谁是美国的第16任总统AI:林肯用户:他去世时多大?AI:林肯享年65岁

对话模式中,AI承接了上文的“他”指的是“林肯”;而如果是非对话模式,AI则会对用户的第二句“他”不知所措。

目前的策略,一般情况下小度与用户之间的交互是单轮命令式的,即用户“小度小度”唤醒后给予小度指令,小度会做出单次回应。

但有以下两种情况(记忆中观察到的,因为疫情影响手边没有产品,应该会有情况遗漏)小度会切换到对话模式:

当用户主动说出“进入极客模式”或者“来聊聊天吧”之类的指令当小度“不自信”的时候。比如给予的指令小度理解不清楚、小度为了消除指令的歧义、或者出现打断对话等异常情况时,小度会采用各种确认策略,反复确认用户的指令,这样也就进入了多轮对话

所以在现有常规的交互策略下,当小度“自信”的时候,比如他自信地忽略掉了一些限定词(例如艾热、热爱版),从而自信地认为用户就是想听邓紫棋原版的《光年之外》,这时它一般不会进入对话模式。

尽管用户火冒三丈地多次重复同样的“播放《光年之外》艾热版”的指令,小度依然会我行我素地播放邓紫棋原版的《光年之外》。

我不清楚这种策略设置的决策依据是什么,可能是这种case比较极端没有被注意到,可能是技术限制,也可能是出于成本考虑,在此不做判断,但不影响从体验优化的角度给出建议。

四、尝试给出解决方案问题1的解决

结论:出于可能的成本考虑,“版权问题”的情况自动进入对话模式,其他由于AI能力问题造成的错误,交由问题2的解决方案一并解决。

示例对话:

用户:小度小度,播放金玟岐的《十三》小度:对不起,暂时没有相关歌曲的播放版权,是否为您播放金玟岐的《岁月神偷》用户:好的

GUI原型:无

VUI交互流程:

问题2的解决

结论:当用户反复唤醒小度重复相同指令时(先为“播放下一曲”之类的命令加白,不在此讨论之列),自动进入对话模式。功能逻辑:

这里有几个概念需要解释:

1)确认策略

AI在回应用户指令时,会有一系列备选答案,按置信度高到低排列,形成N-Best列表。在使用列表中不同置信度的答案回应用户时,AI需要使用不同的确认策略。高置信度的答案采用隐性确认,低置信度的答案采用显性确认(举例见下方示例对话)。

2)消除歧义策略

当用户给出模糊不清的指令或冗余的指令时,AI向用户反复确认、拆解或补充,以形成确定的指令。

示例对话:

//进入对话模式//

用户:小度小度,播放邓紫棋和艾热的《光年之外》小度:(置信度大于80%,隐性确认)好的,为您播放邓紫棋的《光年之外》……(若循环上述对话,则进入对话模式,触发确认策略)

//进入确认策略//

小度:(置信度大于65%小于80%,显性确认)您是希望播放邓紫棋的歌曲《光年之外》现场版吗?用户:不是小度:(置信度大于50%小于65%,显性确认)您是希望播放邓紫棋、华晨宇的歌曲《光年之外》吗?

……(置信度递减)//进入消除歧义策略//

小度:(置信度小于45%)对不起,请问您想听哪谁的歌?用户:邓紫棋和艾热小度:能说一下主要是哪位歌手吗?用户:艾热小度:好的,在艾热的歌曲中找到了23首歌曲,请问歌曲的名字是?用户:《光年之外》小度:好的,为您播放,邓紫棋、艾热《光年之外》

GUI原型:无

VUI交互流程:略

五、结论

新的问题:

短期来看,这个解决方案有肉眼可见的需要改变的代码量,因为第一步执行判断“是否用户重复了m次相同指令”应该是要在整个代码架构上加一次判断,有一定的工程量。

但是长期来看,对用户体验的提升是值得的。站在用户的角度,无疑希望体验能够优化的更好。是否要为了优化这个体验细节而付出这个开发成本(用户有其他临时替代方案,比如打开小度app手动搜寻歌曲,比如有屏音箱),需要更多的数据论证相关收益和优先级,作为非内部人士,缺乏相应的决策依据,这里不做判断。

在重新看这个体验问题中,由于场景的复杂和AI能力的不足,用户扮演了一个“帮助系统修正错误”的反馈角色。

因为我的水平有限,相关思考多来自于工作的语音项目和学术论文设计,但没有完整实*过复杂的语音助手项目落地,理解有误的地方请不吝指正和批评。

本文由@eason原创发布于人人都是产品经理。未经许可,禁止转载

题图来自Unsplash,基于CC0协议

三、智能音箱调研报告|语音交互功能详析

2014年11月发布亚马逊低调发布智能音箱Echo,内测半年后于2015年正式发售,当年销量为250万台,16年销量520万台,超越传统音箱领头羊Sonos,成为**音箱行业霸主,一度在细分的智能音箱市场占据了99%的市场份额。亚马逊发布的智能音箱Echo受到市场强烈反响以后,google在2017年5月发布google home,苹果在2017年WWDC发布智能音箱HomePod,国内厂商京东和科大讯飞合作推出叮咚音箱……一时间国际互联网和硬件行业巨头纷纷加入战局,争夺语音交互流量入口,带动了AI落地的一轮热潮。

智能音箱已经成为全球增长快的消费级硬件。2017年6月苹果home pod发布以来,下半年至今,每月都有一两家科技公司发布智能音箱新产品或二代、三代产品。目前为止国内科技巨头BAT、小米,老牌电器厂商联想、苏宁,语音技术企业科大讯飞、思必驰,硬件技术创业公司出门问问、若琪等都陆续通过自研或合作的方式入局。

智能音箱的*发离不开语音技术的支撑,掌握语音技术的有两类厂商。一是互联网巨头如Amzon、Google、BAT、苹果、微软等,二是专研语音交互技术的厂商如科大讯飞、思必驰等。语音技术厂商通过自主研发软硬件产品,或对外输出技术,赋能传统智能音箱厂商、内容和互联网服务厂商,获取用户和数据,建立平台生态。

1.Amzon Alexa

基本信息: Amzon Alexa是亚马逊的智能虚拟助理和开放平台,2010年启动研发,于2014年11月和Echo同时发布。Alexa具备语音技术能力,并通过运行独立的程序,称为“技能”(Skills)来实现不同功能应用(类似手机里在*作系统上运行APP),支持音乐播放、语音购物、智能家控、智能通讯等一系列功能。由于其先发优势与大量的落地产品,不论是从产品搭载数量和智能水平上,alexa都已远超其他技术厂商(CNET在CES2017的统计)。

开放情况: Alexa 2015年6月,亚马逊将Alexa开放给第三方开发者,发布了 Alexa Skills Kit(ASK)和Alexa Voice Service(**S)两套开发工具包,让开发者能够更加容易开发Alexa的“技能”;并设有了风险投资基金alexa found专门扶持语音交互领域的初创企业,以及大学生开发竞赛Alexa prize。从2014年发布时的29余项技能,到如今近4w项技能,积极开放政策和不断优化的开发工具,使得Alexa拥有了远超其他技术厂商的海量技能。

应用范围:截止目前Amzon Alexa已陆续在全球38个国家开通(中国暂未开通),涵盖英语、德语、法语、意大利语、西班牙语和日语等6种语言(暂不支持中文)。除了搭载自家echo系列音箱产品外,Alexa也赋能sonos、联想、哈曼卡顿等音箱产品,amzon fire TV等智能电视,amzon fire、华为mate9、HTC等平板电脑和智能手机,华硕、惠普、联想等笔记本电脑和PC,智能冰箱、智能灯、智能开关等智能家居产品,智能耳机、智能手表等可穿戴设备,以及包含福特、宝马、雷克萨斯、丰田等品牌的智能汽车。

2.Google Assistant

基础信息: Google assistant是谷歌的虚拟助理,于2016年5月在谷歌开发者大会正式发布,支持语音交互,搭载在Google的智能手机和智能音箱中。

开放情况: 2016年12月,Google推出开发者平台Actions on Google,2017年4月发布了SDK(软件开发工具包)以便第三方开发者为Google assistant开发应用程序,并进一步扩展支持智能汽车和其他智能家居设备。Google assistant支持语音输入和视觉响应,可通过设备的相机识别物体并收集视觉信息。

应用范围:当前Google assistant已支持英语、日语、法语、德语、西班牙语等8种语言,预计2018年底将支持30多种语言,覆盖95%的Android手机(暂不支持中文)。除了搭载自家Google home系列音箱和Pixel系列智能手机外,Google assistant还赋能索尼、诺基亚等智能手机,松下、LG、Sonos等品牌的智能电视、智能机顶盒、智能音箱产品,联想、爱可视等电脑及沃尔沃等智能汽车产品。

3.Microsoft Cortana

基础信息: Cortana是微软的虚拟智能助理,于2015年1月正式发布,逐步应用于搭载windows*作系统和Android/ios系统的移动设备。Cortana具备语音交互功能,并使用**ng的搜索引擎信息回答问题,能够调用应用程序、查询天气、提供餐厅和景点推荐,控制智能家居。

开放情况: 2017年的build开发者会议上,微软退出Cortana技能开发平台,允许第三方开发者为cortana开发技能。

应用范围:截止目前cortana支持包括中文(简/繁)、英语、德语、法语、日语在内的近10种语言。Cortana已集成到微软众多产品,如Edge浏览器、windows10、车机系统、Skype(微软的即时通讯服务),并赋能微软与harman kardon合作的智能音箱invoke等。

4.Apple siri    

基础信息: Siri(Speech Interpretation and Recognition Interface)是苹果的虚拟助理。Siri公司创建于2007年。起初 Siri只是 iOS平台的一个应用程序,苹果在 2010年 4月收购了 Siri公司并重新开发后,Siri成为了苹果设备的内置软件,于2011年重新发布,并只允许在 iOS、macOS中运行。Siri支持语音交互,可以完成数据搜索、天气查询、设置闹钟等许多服务。

开放情况: 2016年6月苹果开发者大会上开放了Siri接口,在IOS开发平台中新增Sirikit,支持开发者调用Siri展示应用内容。Siri目前暂无独立的技能开发平台。

应用范围:截止目前Siri支持包括中文(简/繁)、英文、法文、德文、意大利文在内的20余种语言,并赋能苹果全线产品,如iPhone、iPad、iPod、Apple watch、mac等。

1.科大讯飞

基本信息:科大讯飞成立于1999年,是国内大智能语音技术厂商,在智能语音技术领域有着长期的研究积累,并在中文语音合成、识别、评测等多项技术上拥有国际领先的成果,与中国官方关联密切,堪称“中文语音产业国家队”。科大讯飞占有中文语音技术市场70%以上市场份额,语音合成产品市场份额达到70%以上。

开放情况:讯飞开放平台是全球首个提供移动互联网智能语音交互能力的讯飞开放平台,基于讯飞开放平台陆续推出讯飞输入法、灵犀语音助手、AI+教育、AI客服、AI医疗(语音电子病历、医学影像辅助诊断系统、智能助理等)、晓译翻译机、飞鱼智能车载系统、家庭场景的讯飞魔飞麦克风系统等是多宽人工智能产品。

应用范围:科大讯飞支持34种语言,包括中文各地方言,目前已赋能长虹、海信、康佳等国内大牌智能电视、GlassX、ZWatch等可穿戴设备,奥迪、宝马、奔驰、通用、福特、上汽、广汽、长安、吉利、长城、奇瑞等国内外智能汽车,智能音箱(京东叮咚音箱)、聊天机器人(小鱼在家)等智能硬件产品,窗帘、空调等智能家居产品,为包括滴滴打车、高德地图、QQ阅读等在内的超过60000个App提供智能语音交互服务,覆盖聊天通讯、工具、视频、新闻、导航等生活领域的方方面面。

2.百度DuerOS·小度

基本信息: DuerOS是百度的对话式人工智能系统,于2017年7月百度AI开发者大会上正式发布。DuerOS具备影音娱乐、信息查询、生活服务、出行路况等10大类目共200多项能力,用户可在不同场景下实现指令控制、信息查询、知识应用、寻址导航、日常聊天、智能提醒和多种O2O生活服务;同时支持第三方开发者的能力接入。

开放情况: DuerOS开放平台包括智能设备开放平台和技能开放平台,分别适应不同类型的硬件厂商和为开发者。为方便“上手”,百度发布了针对个人、产品厂商、特殊厂商的DuerOS套件,并融合包括声智科技、先声互联、Intel、Rockchip等第三方解决方案,上线了技能商店APP“小度之家”。

应用范围: DuerOS支持普通话、英语、粤语、四川话等多种语言,已赋能智能音箱、电视、冰等大小家电与智能家居产品,智能手机、手表等随身设备,车机、智能后视镜等智能车载产品,累计搭载5 000万设备,日活超过1000万,有1600万DuerOS合作伙伴,落地80多家主控设备,积累了超过10000名DuerOS开发者,DuerOS累计回答问题数已达24亿。

3.小爱开放平台·小爱同学

基本信息:小爱开放平台(原水滴平台)于2017年5月对外开放语音能力与SDK,基于小米的硬件生态和海量数据,提供全球领先的语音识别、NLP等多项人工智能技术,为开发者提供一站式的人工智能服务。

应用范围:小爱开放平台能力已在小米电视、小米AI音箱、小米金服‘米小贝’等小米软、硬件产品中集成,为小米生态链中8500万台IoT连接设备赋能,虚拟助手小爱同学的日活跃用户也达1000万。

4.AliGenie语音开发者平台·天猫精灵

基本信息: AliGenie开放平台于2017年10月12日云栖大会发布,由阿里巴巴人工智能实验室发起的,面向企业/机构/创业者/开发者,将阿里巴巴在人工智能领域积累的技术以API或SDK等形式对外共享的**平台,目前已经拥有涵盖影音娱乐、新闻资讯、购物外卖、家居控制、生活助手、儿童教育等的100多项技能。

应用范围: AliGenie开发者平台主要包括三大部分:精灵技能市场、硬件开放平台、行业解决方案,全面赋能智能家居、制造、零售、酒店、航空等服务场景

5.腾讯云·小微

基本信息:腾讯云的智能服务系统和智能服务开放平台,帮助智能硬件厂商实现语音人机互动和音视频服务能力。微信AI团队自 2012年起,就将语音输入、语音识别、语义分析技术等功能应用到微信中,腾讯云小微将微信的语音技术作为底层能力,故命名为“小微”,于2017年6月腾讯“云+未来”峰会上正式对外发布。

应用范围:腾讯云小微包括硬件开放平台、Skill开放平台、服务机器人(智能客服)平台,结合腾讯社交关系链,覆盖家庭、车载、运动、酒店和儿童陪伴教育等众多场景。

6.思必驰·DUI开放平台

基本信息:思必驰2007年成立于英国剑桥,创始人均来自剑桥,2008年回国落户苏州,是国内少有的拥有人机对话技术,国际上极少数拥有自主产权、中英文综合语音技术的公司之一。思必驰于2017年9月正式发布DUI(Dialogue User Interface)开放平台,以任务式对话为核心,兼具闲聊与问答功能,打造人性化交互。作为一个全链路智能对话开放平台,DUI开放基于思必驰智能语音语言技术的对话功能,并提供GUI定制、版本管理、私有云部署等开发服务。

DUI具备青囊(服务与研发支撑)、天机(大数据)、紫微(丰富的第三方资源)、玲珑(终端解决方案与环境)四大系统。DUI平台对接丰富的第三方内容,内置国内专业的语音语言技能商店,具备深度数据可视化、个性化自定义、零门槛*作,开发者通过DUI可实现全链路的高度定制,几乎可自定义每个模块。

应用范围:平台已覆盖车载、家居、机器人、故事机、手机助手等多应用场景,提供智能车载、智能家居、智能机器人等解决方案,赋能天猫精灵X1、小米AI音箱小爱同学、联想智能音箱、小米板牙70迈智能后视镜等前沿智能产品。

1.出门问问

出门问问是Google(谷歌)投资的一家中国人工智能公司,由硅谷华人科学家李志飞于 2012年回国创立。拥有自主研发的语音识别、语义分析、垂直搜索、基于视觉的ADAS和机器人SLAM等核心技术。代表性的软硬件产品包括智能手表Ticwatch、车载智能后视镜问问魔镜Ticmirror、智能音箱Tichome、出门问问语音助手APP以及高级驾驶辅助系统问问魔眼Ticeye。

2.猎户星空

猎户星空拥有全套远场语音技术,自研全链路的远场语音交互系统“猎户语音OS”,已赋能喜马拉雅“小雅”音箱,美的、海尔、博联、海尔优家、欧瑞博等品牌的智能家居产品。小米AI音箱、小米电视,也应用猎户星空的TTS(语音合成)技术以及ASR(语音识别)技术。猎户星空自己音箱小豹AI音箱,接入微信支付、银联支付、融合区块链技术。

2017年猎户星空还获得了世界公认人脸识别“世界杯”的微软百万名人识别竞赛识别百万名人子命题有限制类(只使用竞赛提供数据)的第一名。2018年3月21日,猎户星空正式对外发布人工智能领域的机器人产品矩阵,在接待、售卖、儿童陪伴等多个场景落地。同时发布了猎户机器人平台 Orion OS,**了自研的多芯片系统,摄像机+视觉算法,麦克风阵列,猎户TTS,室内导航平台和七轴机械臂等,形成了完整的机器人技术链条。Orion OS现与微软、搜狗、高通、英伟达和锤子科技等建立了战略合作伙伴关系。

3.若琪Rokid

Rokid公司成立于2014年7月,隶属于杭州灵伴科技有限公司。总部位于中国杭州,北京和旧金山分别设有研发中心,致力于机器人领域研究,专注于远程定向拾音/语音语义识别、人脸/手势识别、音响和投影系统等核心技术。Rokid现有PEBBLE•月石智能音箱、AR眼镜Rokid Glass、智能机器人ALIEN·外星人等产品,Rokid智能家居机器人在2016年和2017年连续两年获得CES国际消费电子产品展创新大奖。

4.聚熵智能·DeepBrain

DeepBrain 2012年成立于上海,致力于研发人工智能产品,核心团队是来自于国内外名校的技术研究人才,为超过100家厂商提供深度人机对话能力,并与三星、华为、联想、中兴达成深度合作。DeepBrain在2014年发布了国内首款智能音箱——小智超级音箱,比 Echo的推出还要早半年。其语义技能平台已进驻上千名开发者,开发了超过 1000种以智能家居为主的语义技能。

5.搜狗语音

搜狗由搜狐公司创建于2004年8月3日,域名为Sogou,目的是增强搜狐网的搜索技能。2013年9月,腾讯注资搜狗,并将腾讯旗下的搜搜业务,输入法业务注入搜狗。2017年11月,搜狗在纽交所上市,腾讯目前持有搜狗45.37%的股权;搜狐持有搜狗股权比例为39.21%。搜狗语音技术研究于2012年启动,并在2013年6月正式上线搜狗语音云开放平台,接入搜狗包括输入法、地图在内的全线产品,并推出搜狗语音助手,与Siri一样,搜狗语音助手在手机端上提供的交互体验并不能让用户产生足够的依赖性,产品的使用率并不高。2016年8月搜狗发布了语音交互引擎「知音」,2017年12月与四维图新、飞歌展开合作,推出飞歌智能车联网软硬件解决方案G8Ⅱ后装智能车机,为2018年3月发布的小米电视 4A提供ASR语音识别能力,为会议平板厂商视源股份发布的首款智能语音平板 MAXHUB提供语音技术。

销量与市场占有率对智能音箱产品有着非比寻常的意义。因为智能语音技术刚刚落地,极其依赖用户数据的喂养,越使用才能越智能。

根据笔者估算,截止2018年Q1,全球智能音箱市场保有量占比如下所示。Amzon凭借其先发优势和形态丰富的产品,一骑绝尘,占领了71%的份额,Google以其完备的低-中-高产品矩阵和用户基础,抢夺12%的份额,天猫、小米分别凭借电商体系、智能家居生态与低价*款策略占据6%、4%的份额,京东涉足智能音箱较早,品类丰富,也占据了3%的市场份额,apple的homepod在今年 2月9日才正式发售,且定价偏高,仍旧占据了1%,其他所有品牌占据3%。

作为智能音箱品类开创者,Amzon不断地优化音箱产品新能,持续创新。从场景和形态出发,陆续推出小巧低价的echo dot,带屏音箱echo show、闹钟音箱echo spot。既有促销*款铺量,又有高端品类防守,具备了高、中、低三个档位完善的产品矩阵,各型号累计销量在3千万以上,是目前唯一销量破千万的智能音箱厂商,引领着全球智能音箱市场。

京东与科大讯飞联合成立的灵隆科技推出叮咚音箱,作为国内较早涉足智能音箱的厂商,从2015年5月开始,京东已经发售了一系列新品。整体产品线与Amzon相似,不断探索更多形态与场景,持续提供更多自定义功能,并以儿童教育音箱,切儿童早教市场。随着小米、阿里、百度的强势入局,京东也推出了高端带屏音箱叮咚PALY,低价叮咚mini2,抢夺国内市场。

2016年5月,在Amzon几乎垄断智能音箱市场之时,Google入场搅局,推出Google home,凭借其优雅的设计、背靠Google搜索引擎的智能问答和价格差异,曾一度占据了20%以上的市场份额,并在2017年10月推出低价的Google home mini和高价的Google home max,不断支持更多新技能和场景:接入更多智能家居设备、支持500w个菜谱抢占厨房,支持语音购物等。

小米作为国内领先的智能家居生态构建者,产品覆盖了耳机、移动电源、手环、插座、血压计、空气净化器、净水器、运动相机、平衡车、电池、床头灯、电饭煲等智能家居设备。小米于2016年底开始研发虚拟助手小爱同学,并在2017年9月正式发布了智能音箱小爱同学,除了强大的小米家居生态背景,小爱同学还因其机智的人设获得极高关注。2018年小米推出Q萌版小爱同学mini加入国内低价冲量大战。

阿里对新技术研发极为重视,在17年7月发布了天猫精灵x1,同时亮相的还有负责阿里消费级AI产品研发的阿里巴巴人工智能实验室,17年10月云栖大会正式宣布成立达摩院,网罗各个重点技术领域的专家人才,进行基础科学、AI芯片和**式技术创新研究。18年3月推出天猫精灵M1曲奇,火眼支架,6月推出天猫精灵方糖,持续探索更多音箱形态,花式输出AI技术,包括图像识别、人脸识别、物体检测及情感反馈等能力。同时提高产品性价比,紧守音箱低价冲量的战场。依托阿里强大的电商网络,天猫精灵已成为国内销量大的智能音箱品牌。

2017年2月百度全资收购渡鸦科技,11月发布了RavenH智能音箱,形状新奇色彩绚丽,带有可拆卸点阵触控板,对标高端音箱Sonos、Bose和哈曼卡顿,售价1699。18年初联合老牌音响制造商DOSS(德仕)推出DOSS智能音箱,3月、6月陆续推出国内首款智能视频音箱599元的小度在家、89元低价小度智能音箱,在京东和天猫发售,凭借极高的性价比,在国内音箱价格战中尚有一席。

除了销量可见的主流智能音箱,国内外仍有不少智能音箱产品。如微软与哈曼卡顿联合推出的invoke,搭载了微软Cortana,Line与高通合作推出的Clova,以及国内中小创业团队的系列智能音箱,出门问问的Tichome、喜马拉雅的小雅音箱等等。随着智能音箱市场的逐步成熟,各类音箱或者会找到自己的位置,或者无声寂灭。

智能音箱除了提供核心内容资源消费功能,各品牌还深挖居家场景,开放平台,吸引第三方开发者,提供了越来越多的技能。智能音箱界独领**的Amzon Echo已经具备了超过3w项技能,从技能增长梯度看,2016年开始*发式增长,随着Echo销量的增加,至今仍在不断攀升。超过3w项技能加持的Amzon比它的一众追随者更像一个语音*作系统。

如同智能手机*作系统的app一样,海量的语音*作系统技能中,真正获得关注的还是少数,大量的技能成为僵*技能,无人问津。因此其他智能音箱品牌,只要覆盖了高频、核心功能,提供更多资源、家控和创意功能,则无需畏惧Amzon**的技能数量。

智能音箱产品功能趋同,主要分为内容技能、工具技能、互动娱乐三个大方向;功能面向核心场景及针对核心人群的核心功能趋向性逐渐显现。

用户关注度高的功能主要有音乐**、生活助手、智能家居、游戏娱乐,其次是教育内容、趣玩搞笑、新闻,再其次是新闻、财经类功能;

工具技能用户口碑偏低,但有不可替代性;互动娱乐技能可替代性强,口碑和体验好的功能更受欢迎;内容技能评价均匀,重点在优质资源可得性。

摘录自ebay、Walmart、京东、天猫等电商平台的用户评论数据。

用户体验总结:

1)智能音箱产品整体受欢迎程度很高、用户接受度较高,评价矩阵皆为70~80%的5星好评;

2)用户对音箱产品唤醒、识别、解析等语音基础性能感知差异不大(可能由于个人拥有音箱品牌数量少于1个,对比不明显);对音质、内容资源丰富度、“聪明程度(智能感与趣味性)”等较为敏感。

3)老人、孩子对音箱的满意度、喜爱度是重要消费决策因素。

4)海外用户对音质要求更高,对音箱的使用场景区分更鲜明,倾向于为不同居所场景配备多个音箱产品,对是否自带电池等要求不多;国内用户音质要求和鉴别水平不足,期望自带电池便携便移动。

5)用户期望唤醒词自定义、内容资源更丰富、资源内容相互打通。

1)音箱销量: 2017年全球智能音箱出货量3200w台,其中Amzon与Google以大约9:1的比例瓜分市场。Amzon音箱销量量级已超2000w,铺货量和活跃设备数全球遥遥领先。截止2018年4月底,国内厂商销量以天猫、小米为首,量级在200w左右,百度、腾讯及众创业公司量级均在10w之下。具备生态闭环和技术平台的大厂商均有“高性价比铺量”的趋向,以低价占据迅速用户市场。据C****ys分析公司保守预测,2018年全球音箱销量将增长到5630台,美国作为主战场销量将达3840台,中国作为第二大市场销量可达440万台。

2)功能覆盖:智能音箱产品功能同质化明显,主要分为内容技能、工具技能、互动娱乐三个大方向;具备生态闭环和技术平台的大厂商正在将以语音技术为核心的AI技术平台打造成Android/ios式的*作系统,吸引更多智能硬件厂商、独立开发者入驻;鉴于技术水平差距不明显和技能开发者的可转移性,技术、技能都不会是决胜的关键因素。

3)用户反馈:智能音箱产品整体市场接受度较高,评价矩阵皆为70~80%5星好评;用户对唤醒成功率、识别成功率、解析成功率等语音交互基础性能感知差异不大,对音箱的音质、内容资源丰富度、智能感与趣味性等维度较敏感;同时用户期望仍处于不断攀升的阶段,对音箱产品提出了越来越多个性化要求。

相关文章

创维平板电视机85英寸图文测评

创维平板电视机85英寸图文测评

很多小伙伴在关注创维平板电视机85英寸怎么样?质量好不好?使用测评如何?本文综合已购用户的客观使用分享和相应的优惠信息,为大家推荐一款高性价比的产品,一起来看看吧。...

小米(MI)电视40英寸EA40金属全面屏内置小爱蓝牙语音遥控全高清智能液晶平板电视小米电视EA43英寸【蓝牙语音】使用心得反馈

小米(MI)电视40英寸EA40金属全面屏内置小爱蓝牙语音遥控全高清智能液晶平板电视小米电视EA43英寸【蓝牙语音】使用心得反馈

很多小伙伴在关注小米(MI)电视40英寸EA40金属全面屏内置小爱蓝牙语音遥控全高清智能液晶平板电视小米电视EA43英寸【蓝牙语音】怎么样?质量好不好?使用测评如何?本文综...

TCL电视43V6E图文测评

TCL电视43V6E图文测评

很多小伙伴在关注TCL电视43V6E怎么样?质量好不好?使用测评如何?本文综合已购用户的客观使用分享和相应的优惠信息,为大家推荐一款高性价比的产品,一起来看看吧。...

飞利浦(PHILIPS)55英寸舒视蓝护眼质量测评好不好

飞利浦(PHILIPS)55英寸舒视蓝护眼质量测评好不好

很多小伙伴在关注飞利浦(PHILIPS)55英寸舒视蓝护眼怎么样?质量好不好?使用测评如何?本文综合已购用户的客观使用分享和相应的优惠信息,为大家推荐一款高性价比的产品,一...

企业购海信会议平板使用心得反馈

企业购海信会议平板使用心得反馈

很多小伙伴在关注企业购海信会议平板怎么样?质量好不好?使用测评如何?本文综合已购用户的客观使用分享和相应的优惠信息,为大家推荐一款高性价比的产品,一起来看看吧。...

TCL电视75V8E怎么样

TCL电视75V8E怎么样

很多小伙伴在关注TCL电视75V8E怎么样?质量好不好?使用测评如何?本文综合已购用户的客观使用分享和相应的优惠信息,为大家推荐一款高性价比的产品,一起来看看吧。...