什么是语音识别?

语音识别技术也被称为自动语音识别 Automatic Speech Recognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。
语音识别技术常用的方法有如下四种:

  1. 基于语言学和 声学的方法
  2. 随机模型法
  3. 利用人工神经网络的方法
  4. 概率语法分析

什么是唤醒词?

指特定词语或短语,用于唤醒设备并启动语音交互。语音识别唤醒词的设计和选择对于用户体验至关重要。一般来说,唤醒词应该是易于发音、清晰且不易与其他词汇混淆的短语。

唤醒词自定义规则?

【中文】

  • 一般为4-6个字,4个字最佳,过短容误唤醒高,过长不便用户呼叫和记忆;
  • 避免使用敏感词:包含政治,伟人名字、脏话,黄赌毒等;
  • 避免使用口语化的词汇,口语词汇日常使用频率很高,容易导致误唤醒,如“你好啊”;
  • 唤醒词发音应选择易开口,响度大,发音清晰易分辨的词;
  • 避免使用多音字,唤醒词的音节覆盖应尽量多,差异大;
  • 避免使用叠字,避免连续使用零声母的词,如“安”;
  • 如因使用市面上已存在的唤醒词而产生纠纷,由开发者自行承担,请慎重选择。
  • 唤醒词加上免唤醒的命令词,总数不能超过10条。
  • 设计词条时,如果词条之间只有一个字的不同,这个字尽量不要放在最后一个,可以降低误识别率。

【英文】

  • 建议由2-4个单词(4-6个音节)组成,过短容误识高,过长不便用户记忆;
  • 命令词间音节区分度越大越好;
  • 符合用户的语言习惯,是常用的说法,内容具体直接;
  • 应避免使用日常用语,如:“HI、HELLO”;
  • 避免使用相似音节,词的发音清晰响度要大,如避免同时使用TURN-ON和TURN-OFF;
  • 应避免使用叠词,如:“HELLO-HELLO”;
  • 所有单词全部大写,如果一个命令词由多个单词组成,那么单词与单词之间用中横线连接,如:HELLO-AIR-CONDITIONING。

什么是命令词?

命令词是想要定义的语音话术,用户必须按照定义的话术说出才有效(自然说除外)。如用户可以使用“设置十五度”“十五度”来实现同一个设置温度15度的控制。

命令词和回复语自定义规则?

  • 一个行为的命令词允许填多条,多条命令词之间用“|”隔开。当设置多条命令词时,说每个命令词都能触发该行为。
  • 如果打开自然说功能,则一个行为仅允许设置一个命令词,但是可以设置多个泛化词。
  • 回复语是针对该条控制指令的设备回复播报。
  • 单条回复语不得超过500个字符,支持中英文、逗号、句号、问号,不要使用阿拉伯数字,可以用中文数字来代替。
  • 回复语中支持标签[=py],来指定某些多音字播报时的读音。
  • 例:已调[=tiao2]至中[=zhong1]风档,
  • 注:拼音声调范围为 1 - 5,1 - 4 对应一声到四声,5对应轻声。
  • 播报为:已调(tiao2)至中(zhong1)风档。
  • 一个行为的回复语允许填多条,多条回复语之间用“|”隔开。当设置多条回复语时,行为被触发后,系统会随机选择一条回复语进行播报。

什么是免唤醒的命令词?

免唤醒的命令词可以在设备未唤醒的情况下直接触发语音交互。

什么是防止误识别的命令词?

生活中高频次发生并且容易诱发唤醒词或命令词误识别的词,用于针对性防误识别和误唤醒。
不能和唤醒词、命令词重复,多条词条之间用“|”隔开

什么是识别灵敏度?

识别灵敏度有三档:低、中、高。默认为中。灵敏度越高越容易识别,同时误识别率会增高,反之,灵敏度越低越难识别,误识别率会降低。

作者:admin  创建时间:2024-09-25 11:37
最后编辑:admin  更新时间:2024-11-07 11:39