语音识别 - Powered by MinDoc

语音识别技术也被称为自动语音识别 Automatic Speech Recognition，(ASR)，其目标是将人类的语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列。
语音识别技术常用的方法有如下四种：

指特定词语或短语，用于唤醒设备并启动语音交互。语音识别唤醒词的设计和选择对于用户体验至关重要。一般来说，唤醒词应该是易于发音、清晰且不易与其他词汇混淆的短语。

【中文】

【英文】

建议由2-4个单词（4-6个音节）组成，过短容误识高，过长不便用户记忆；
命令词间音节区分度越大越好；
符合用户的语言习惯，是常用的说法，内容具体直接；
应避免使用日常用语，如：“HI、HELLO”；
避免使用相似音节，词的发音清晰响度要大，如避免同时使用TURN-ON和TURN-OFF；
应避免使用叠词，如：“HELLO-HELLO”；
CI系列：所有单词全部大写，如果一个命令词由多个单词组成，那么单词与单词之间用中横线连接，如：HELLO-AIR-CONDITIONING。
SU系列：如果一个命令词由多个单词组成，那么单词与单词之间用空格分开，支持大小写，如：HELLO AIR CONDITIONING 或者 hello air conditioning

命令词是想要定义的语音话术，用户必须按照定义的话术说出才有效（自然说除外）。如用户可以使用“设置十五度”“十五度”来实现同一个设置温度15度的控制。

免唤醒的命令词可以在设备未唤醒的情况下直接触发语音交互。

生活中高频次发生并且容易诱发唤醒词或命令词误识别的词，用于针对性防误识别和误唤醒。
不能和唤醒词、命令词重复，多条词条之间用“|”隔开

识别灵敏度有三档：低、中、高。默认为中。灵敏度越高越容易识别，同时误识别率会增高，反之，灵敏度越低越难识别，误识别率会降低。

作者：admin 创建时间：2024-09-25 11:37
最后编辑：admin 更新时间：2025-12-12 15:48