随着智能音箱产品在大众生活中的普及度越来越高,其承载的前沿人工智能技术也在突飞猛进。从过去相对单一的听歌、设置闹钟,只能简单语义理解和应答的娱乐工具;到如今掌控智能家居、看剧、带娃样样精通的智能小助手,产品的迭代让我们不禁发出『智能音箱已不再是音箱』的感叹。产品不断增长的智商和能力背后,是行业里一个个不断取得突破进展的AI黑科技:全双工免唤醒、DLNA投屏、童脸识别……让我们不妨一起来了解下智能音箱上那些亮眼的黑科技发展史吧。
手口眼俱到的多模态交互,人机对话更随性
语音交互,是智能音箱区别传统智能产品的关键因素之一。相比于早期的智能音箱,现在的智能音箱、智能屏在语音识别和流畅度上有了完全不一样的体验,交互体验越来越随意和自然。在交互领域,第一次让一问一答的生硬场景发生改变的,是小度智能音箱于年6月首次发布的极客模式(连续对话技术)。极客模式实现了人与智能音箱连续对话,大大改善了此前人机交互中无法多轮对话、多次重复唤醒的体验和回答生硬等问题。至年,天猫精灵和小爱同学也开始将连续对话技术部分运用到智能音箱新品中。
当然,令智能音箱人机交互出现“质变”的,是年7月小度业内首发的全双工免唤醒能力,不仅实现了“一次唤醒,多轮交互”,还能在与他人对话的同时互不干扰地实现人机交互,与机器的聊天越来越像人与人之间的自然互动。全双工免唤醒技术的出现,对于智能音箱来说是里程碑式的事件。在此之前,用户多数情况下每次下达指令都得唤醒一次智能音箱,虽然在极客模式下的特定场景中可以实现连续对话,但应用场景十分有限,音箱的理解和表达能力也远不及人类。全双工免唤醒则是让智能音箱的沟通能力得到了一次飞跃。直到今天,这项技术仍属于智能语音领域的前瞻性技术,目前只在小度的产品以及天猫精灵后期推出的一款新品上得以实现。
随着技术的发展,智能音箱的交互形式也越加多样化,在交互方面,小度也走在了最前面。年12月小度智能屏X8的推出,首次提出了兼具全双工免唤醒、眼神唤醒、手势控制在内的『多模态交互』方式。此后国内头部智能音箱品牌都在交互形式多样化上展开了探索,如年3月份,小爱同学也开始将手势控制运用到新推出的Redmi小爱触屏音箱上。目前,眼神唤醒能力尚且只能在小度的产品上实现,但可以预见,多模态交互将成为未来人机交互的主流。
红外遥控加DLNA投屏技术,全屋IoT成为可能
IoT是智能音箱最早切入和布局的领域之一。随着红外遥控技术、DLNA投屏迭代升级,用户在智能家居联动体验上感受更佳。年5月,天猫精灵方糖推出需外接设备的红外遥控智能音箱,此后年4月,小度智能音箱1S技术升级无需外接设备即可红外遥控全屋IoT,在电视、空调、机顶盒的可控覆盖品类范围、语音操纵能力和灵活度上更胜一筹。同年9月,小爱音箱Pro也同步推出红外遥控技术,红外遥控技术逐渐成为智能音箱的标配。
如果说红外遥控功能在技术呈现上并不复杂,那么智能音箱的投屏能力则让各家品牌高下分明。年7月,小度推出了全球首创的智能音箱DLNA直接投屏能力,通过小度助手即可点播,将普通电视瞬间变成智能电视。此后,小爱触屏音箱也上线了这一功能。天猫精灵最新推出的几款有屏智能音箱产品中,尚未有过相关功能的展示。
儿童模式专属保护,宝贝开心父母放心
随着智能音箱技能与内容生态的逐步丰富和完善,其使用场景和边界也在不断拓展。如今,儿童教育成了智能音箱行业都想要拿下的香饽饽,但最早洞察到这一家庭细分场景消费需求,并单独设置儿童专属功能的,仍然是小度。
小度智能音箱在年6月份推出了业内首创的儿童模式,并于年12月升级推出“童脸识别”,经过“童脸识别”进入儿童模式为孩子智能化推荐适龄内容,广大父母无需再担心孩子接触到负面、低俗内容。此外还有先学后玩、科学距离提醒、观看时长控制等多重呵护,让孩子玩的开心父母放心,因此儿童模式一经推出便深受广大有娃家庭用户好评。年1月天猫精灵CC也上线了儿童模式,通过童脸识别进入儿童模式,其距离提醒、定时防沉迷、内容过滤、有害光线过滤等功能也与小度异曲同工,意在全方位呵护宝贝健康成长;今年3月,Redmi小爱触屏音箱8姗姗来迟,同样推出了儿童模式和童脸识别功能。可见,对儿童使用的模式定制已开始成为智能音箱行业标配。
智能看护,随时随地贴近家庭
智能音箱还是智能家居生活中的AI小管家,年4月,小度智能音箱1S发布智能看护功能,用户可以自定义看护的时间,通过手机应用即可随时看到小度守护的家中情景。还有两种看护模式可供选择,包括儿童看护模式和安全看护模式。12月,小度发布的智能屏X8再次升级智能看护功能,视频通话、远程监控、语音留言、家庭固话、看护助手、智能抓拍等功能面面俱到,提供行业最强的智能通讯与安防能,不但让家人之间想念即可相见,还可以对家里的老人和孩子的看护更加细致。同期发布的小爱触屏音箱,则需要通过连接米家摄像头才能实现智能看护功能,虽然设备和步骤都多了一步,但不难看出这一功能是当下很多家庭的“刚需”。
技术是智能音箱发展的核心推动力。经过上述对黑科技突破的梳理盘点,我们不难发现,在百度人工智能沃土中成长起来的小度,拥有显著的领先优势。这一点,得到了中国科学院的研究证实。年12月,中国科学院物联网研究发展中心发布的《智能音箱的智能技术解析及其成熟度测评》测评报告显示,在听懂、理解用户的指令方面,小度系列智能音箱是唯一听懂率超过90%的产品,无论无屏还是有屏产品均明显领先于其他品牌;在满足用户需求和体验方面,小度同样在评测中满足度得分第一,其中有屏音箱的用户满足度相对更高。
从近期小度的技术动态来看,最新发布的产品搭载了百度首款专门针对远场语音交互研发的鸿鹄芯片,新品在首次唤醒率和识别率大幅提升的同时功耗更低,相信在该芯片的加持下,小度的智能度相较中科院发布报告之时又有新的提升。在智能音箱黑科技的创新上,小度还将续写什么样的故事,让我们拭目以待。