解析未来离线语音的普及之路

导读 未来物联网勾勒的美好画卷正徐徐展开 而成为主驱动力的智能家居正躬逢其盛。而在所有打开智能家居大门的“钥匙”之中 语音俨然成为最大

未来物联网勾勒的美好画卷正徐徐展开 而成为主驱动力的智能家居正躬逢其盛。而在所有打开智能家居大门的“钥匙”之中 语音俨然成为最大热门。据ReportLinker预计 到2024年 全球智能语音市场规模将达到215亿美元。

然而 如果将语音等同于智能音箱 那当是谬以千里。智能音箱作为中控设备只是语音的一个入口。从客厅到厨电、卫浴等应用场景的任意家电产品 语音其实可以脱离音箱实现“单机智能” 而语音芯片 正是其赋能者。

打破固有思维 语音≠云

尽管一提到语音方案 业界的惯性思维大都集中在联网上云的层面 但其实上 应用只有深入到细分市场需求层面 才会激发新的洞察。

探境科技CEO鲁勇 曾深入剖析语音在智能家居产品的需求。以大家常见的互联网电视为例 技术路径一拆为二 一个是语音识别环节 获取用户的指令 另一个是内容获取环节 执行指令获取云侧的影音。

再深一步剖析我们会发现 其实从智慧客厅到智慧厨房、智慧卫浴等细分场景的各类家电中 需要获取影音内容的仅有电视和音箱等极少数家电产品。像灯具、开关空调等绝大多数的产品 或许会在某些高端产品线上附加此类功能 但并非刚需。

可见 智能家居的语音需求可分为两类 一类是通过语音获取内容 一类是通过语音控制家电。需要获取内容的家电品类并不多 其内容获取环节也与语音技术无关 影音内容的好坏取决于云平台上片源的质量。

而控制电器的技术路径 又可分为“远程控制”及“语音控制”两种。其中远程控制通过Wi-Fi蓝牙等无线技术实现app联网 并进一步控制电器 其技术的关键节点在于云端联网 远程控制实际上就是控制功能通过联网来延伸。

可见 在智能家居领域 智能交互的最终目的就是为了控制家电设备 与其强相关的只有“语音控制”这一方向。

“语音控制”本身则可细分成“指令型”与“自然型”(即NLP自然语言处理)两种。“指令型”可通过离线来实现 也可通过在线来实现。而NLP目前主要是通过云侧实现。

“就像大家把云和语音强关联一样 其实很多人又把‘云’和‘NLP’两个问题混到了一块 认为自然语言识别就得上云。”鲁勇认为 未来随着算法模型越来越小、而芯片功能越来越强大 NLP实现离线识别将指日可待。

可见 语音识别并不等于云。语音识别和云计算是两个层面的事情 一个是具体的技术 一个是基础计算设施。语音识别技术的实施途径分为离线和在线两种 两者的区别是将计算放在端侧还是云端进行。

事实上 智能家居领域 离线语音方案有其特定的优势。

离线语音的普世之路

在不远的未来 万物互联将催生上亿台设备 如果所有计算都放在云端的话 不仅成本昂贵 而且效率难以保证。尤其是智能家居这一特殊场景 对实时性、稳定性及隐私性都有极高的要求。出于对云端数据处理能力、网络延迟及数据安全性的考虑 把算力“下放”到靠近终端的边缘计算将得到快速的发展。

如果说这是产品设计的考量 那么从生态链角度出发 对于广大的家电厂商而言 上云意味着或将流量入口或大数据开放给第三方的生态链公司 或自建私有云入口 既要考虑生态的兼容性 又存在一定的研发门槛 而端侧方案则不必考虑诸多顾虑 更可放手一博

对于C端用户而言 离线语音带来的好外也是显而易见。用户无需购置和使用智能音箱等这类集中式控制硬件 也无需考虑不同品牌与云平台的兼容 亦无需要考虑私隐安全的问题。更重要的是 离线方案无需依赖网络、没有延迟、识别精准 从而降低了用户的使用门槛。

鲁勇认为 智能家居发展方向应当是“先实现智能 再考虑生态” 本该保证产品易用性的生态 不该成为制约用户使用的障碍。

离线语音使智能家电产品变得像USB一样 实现即插即用 没有任何使用门槛 这将从根本上提升最终的用户体验 大大打消终端消费者的使用顾虑。此外 离线语音可面向几乎所有的家电品类 让每一台家电都成为真正的智能化设备 让智能家居从小众产品变为普世产品。

正是凭借自身深厚技术底蕴与敏锐市场判断力 探境科技离线语音识别芯片——音旋风VOI611迅速打开了市场的大门。音旋风VOI611在市场上的竞争优势极为明显:支持200条命令词 拥有高达99%唤醒率与97%识别率 误唤醒率少于1次/24小时 响应时间小于0.2s 可做到10米远场识别距离 具有精准的识别效果。

此外 探境科技的语音芯片价格几乎与普通MCU持平 且没有任何研发门槛 这无疑将大大加快家电企业智能化的速度。

目前探境科技已覆盖的智能家居产品包括:智能灯具、智能开关、空调伴侣、语音风扇、空气净化器、晾衣架等多个品类 合作厂商包括美的、海尔、新颐、艾美特等知名企业。

同时鲁勇强调 端侧和云端 并不是非此即彼的单选题 在已有端侧语音方案实现单机智能的前提下 是否要联合Wi-Fi模组 或是增加云端识别 对于厂商而言不过是一道可以自由组合的多选题。

目前业界已意识到在线方案的诸多弊端 “离线+app”、“离线+云识别+app”这样的离在线方案已见苗头 鲁勇认为随着语音方案的算法模型越来越小 以及芯片性能逐步提升 端侧NLP的技术壁垒已可攻破。未来离线NLP技术成熟之后 更智能、可定制的离线NLP语音方案将是家电厂商的不二之选。

未来“芯”中有数

看准离线语音芯片的锚点 探境已然长线布局 取得初步研发成果。

2020年第四季度 探境科技内部代号为音旋风二代的芯片产品已流片成功。音旋风二代与一代相比 算力更强 可以运行更大的神经网络模型 同时功耗更低 价格也更低。此外 探境的端侧NLP产品也已现雏形。

凭借“存储优先架构”(SFA架构)解决存储墙这一独一无二的硬件架构 辅以打通语音识别全链路的算法精进 探境的语音芯片具有体验好、功耗低、性价比高、实用性等优势。

鲁勇提到 探境不仅可为客户提供芯片、算法、Turn-Key等多种语音方案 还支持客户进行二次开发 支持算法移植。在系统软件层面 对于不同的客户提供不同层次 包括指令集、SDK开发环境或应用层语音/图像算法 并可为客户个性化部署流程。

在鲁勇看来 无论任何产品都要尊重人性 人需要陪伴 需要情感交流 这也是探境的终极发展方向 而语音和视觉正是自然界中人类最便捷最符合人性的交互方式 探境科技不会单纯的追求某个AI技术指标 而是要做有温度的芯片方案 以AI技术推动生活。

“下雨时每一滴水会如何进入到山谷 这个路线是肯定无从了解的。但是你一定知道方向——因为有重力 所以必然向下。而类似于必然发生的「重力」 商业趋势也是必然的 总体趋势一定能够预知。”物联网之父凯文•凯利曾如此总结趋势的重要性。

在经过市场的锤炼之后 探境未来也将更加“芯”中有数。未来 探境秉持对市场的潜心洞察与剖析 加以硬件、算法的持续创新 也将迎来新的高光时刻。 责任编辑:tzh

免责声明:本文由用户上传,如有侵权请联系删除!