“小白、小T、小爱”,伴随着人工智能电视的火热,这些虚拟语音助手的名字越来越被人们熟知,通过语音指令操控电视,以人工智能识别用户意图,成为当下电视行业最为炙手可热的新技术。然而要做到理解用户意图,这些智能电视的“听力“水平究竟如何,成为消费者及全行业关注的焦点。
近日,国家数字音视频及多媒体产品质量监督检验中心进行了一场多机型五大品牌人工智能电视的对比测试比较,专门针对语音识别操控电视播放视频节目的体验进行评价,测试参照标准为《中文语音识别系统通用技术规范》、《智能电视语音识别-测试方法》《智能电视语音识别通用技术要求》及其他特定测试方法,测试项目包含远场语音、声纹识别、语义理解准确率、模糊检索准确率、语音识别时间5个测试项目,参加测评的包括长虹、TCL、海信、创维、三星品牌5款同尺寸智能电视,本次测评意在全面呈现各品牌语音识别技术的用户体验差异。
远场语音是指不借助遥控器上的麦克风或手机,仅通过电视内置的声音采集设备识别指令,参评的五台电视中,只有长虹Q5K电视支持这一功能, 可直接通过说话执行包括开机、关机、搜片、暂停等功能,Q5K的远场语音采集范围可以达到5米,更符合家庭中电视的实际观看距离,而脱离遥控器或手机的语音按键来与电视机直接交流,更接近人与人之间的自然交流。声纹识别功能也是长虹Q5K独有的一项功能,其他四个品牌的机型均不具备,通过声纹识别,Q5K可以识别家庭中不同的使用者,呈现专属界面,并根据观看习惯推荐节目。
语义理解是体现智能程度的一个重要环节,用户有时不能准确说出自己想看节目的名称,比如针对指令“我想看孙俪老公的电影“,电视能否找到邓超的电影并开启播放,成为评判的依据,在此项测试中,长虹Q5K以95.7%的语义理解准确率夺得第一,领先于对比机型91.4%、87.1%、75.7%、11.4%的成绩。模糊检索针对用户可能出现口误或方言的情形进行纠错,比如针对指令”我要看张郎“,能否被电视正确识别为战狼,长虹Q5K依然以95%的成绩位居第一,对比机型成绩为82%、65%、62.5%,以及无法识别。而语音识别时间则代表系统反应速度,长虹Q5K以0.9秒成绩并列第一,快速的反应对于流畅的用户体验十分重要。
国家数字音视频及多媒体产品质量监督检验中心对这场测评给出了自己的评价:”CHiQ电视Q5K人工智能性能表现突出,优于行业同类产品。Q5K本机搭载”远场语音”,提升了人机交互便捷性;特有的“声纹识别”技术能够识别不同家庭成员角色,实现内容精准推送;不仅能够精准的理解用户需要检索的影音内容并执行相应操作,更能在用户指令模糊或错误的情况下分析出正确的检索结果。“
这一评价对于10月12号正式亮相的长虹Q5K在人工智能给予了高度的认可,这背后是长虹在人工智能电视和语音识别技术上多年的积累,证明了长虹在大数据运营能力及人工智能技术上的实力足以碾压全行业,CHiQ Q5K正是在去年发布人工智能电视的基础上,从平台、算法、协议等多个维度对人工智能电视技术做了完善、优化,推出行业首个人工智能电视技术系统,正是在这一整套系统的协作下,才能为家庭用户带来更出色的使用体验。
目前市面上的人工智能电视多以语音操控为主。由于门槛低,所以语音操控技术被争相模仿,但远未涉及深度学习、智能识别等人工智能技术应用。真正意义上的人工智能电视,语音操控仅仅是基础,还需要深度学习等深层技术的应用。长虹CHiQ电视Q5K的上市以及声纹识别技术的加入,或许带给彩电业更好的思考与借鉴。