小语种识别方案开发须知

概述:

为了给客户带来更多有价值的方案,开发多个小语种模型,方便方案商在无小语种语料的情况下,能进行初步的模型制作和样品测试;
本文档主要用于指引方案商快速了解相关开发及注意细节;


一、方案注意事项:

  • 模块选型:CI-03T(推荐)、CI-33T
  • 芯片选型:CI-1302(推荐)、CI-1303
  • 词条数量: 建议<30条;词条多了,一方面出现相似的词概率多,另一方面验收时间和优化反复时间也会多;
  • 词条要求:命令词建议至少4个音节,尤其是唤醒词,必须保证至少4个音节,命令词请选择发音有明显差异的词条,发音相近的词容易误识别
  • 测试注意:声音平稳,语速正常,不要刻意太慢或者太快

【特别注意】

  • 选词好坏对项目落地的影响很大
  • 可能存在客户的词条在原本的训练集中很少的情况,该情况下需要客户提供至少50人的语料进行迭代训练
    a、3周左右出模型并合并客户制作的逻辑控制控制
    b、项目出来会单独开放给提供语料的客户
    c、收到项目的客户,可自行更改逻辑后再次调试,或二次开发固件调试
  • 截止2024年8月17日支持语言:中、英、日、韩、西班牙、德、俄、泰、越南、阿拉伯语,这些模型可以直接提交文本联系客服制作模型(注意不支持阿拉伯数字); 【其他语言需要确定商务条件,提供语料后,周期约3个月】

二、小语种方案开发流程

  • 注册智能公元平台账号,熟悉中文固件开发流程(智能公元平台的文档中心)
  • 与客户确定好词条,请客户提供至少4个人的测试语料(语料应尽量干净无底噪,2男2女)
  • 使用中文开发好固件后,再替换为对应小语种的语言模型、声学模型、和cmd_info文件

三、客户录音训练集的文件夹格式:

如需录音,请按下面格式进行录音:

示例文档

备注:

  • 如果要录制语料,可先录制一个人的语料提供给我们看下是否格式正确,如无问题,在进行后续录音
  • 录制后的声音必须严格按照一个声音一个文件按压缩包进行校对处理好,如未清洗好,会导致识别效果不稳定;

四、验收标准见表格:

PS:如命令词条区分度高,则误识会大幅度减少,项目更容易落地量产;

作者:PEACHES  创建时间:2025-03-21 10:05
最后编辑:PEACHES  更新时间:2025-03-26 09:45