在实际开发语音产品过程中,要达到好的语音识别效果,除了语音算法要给力外,设计出好的唤醒词和命令词也能起到事倍功半的效果。所以下面介绍一下如何设计中文、英文和日文的唤醒词和命令词。
中文唤醒词设计
1. 一般为4-6个字,4个字最佳,过短容误唤醒高,过长不便用户呼叫和记忆;
2. 命令词中字的音节较长且相邻汉字的声韵母区分度越大越好;
3. 应避免重复或者相近读音的字出现在唤醒词中。相邻音节要规避连音,即避免前一个韵母与后面声母相同或近似,比如“语音”;
4. 字要发音清晰、能量响度高、开口度大,最好带有爆破音,声调建议选择第四声,如“灌溉”;
5. 尽量选取不常说词作为唤醒词,可以有效降低误唤醒甚至避免误唤醒;
6. 应避免使用叠词,如:“你好你好”、“宝宝开机”;
7. 为提高发音能量,可选择包含爆破音声母的音节,如 p、b、t、d、k、g 等;
8. 韵母选择大口型,开口音的韵母,比如 a、ai、an、ian、ao,避免 e、i、en、in 等;
9. 中文命令词中只能由汉字组成,不允许有空格,逗号等其他字符;
10. 平台提供了唤醒评价功能,如唤醒词的适合度为“优”,则是一个较好的唤醒词;
11. 一个模型仅允许一个唤醒词,如果需要多个唤醒词,请单独优化并使用多网络切换功能。
中文命令词设计
1. 一般为4-6个字,4个字最佳,过短容误识高,过长不便用户呼叫和记忆;
2. 命令词中相邻汉字的声韵母区分度越大越好;
3. 符合用户的语言习惯,尽量采用常用说法,内容具体直接;
4. 应避免使用日常用语,如:“吃饭啦”;
5. 生僻字和零声母字应尽量避免,如“语音识别”中“语音”两个字均为零声母字;
6. 命令词中的字最好不要有语气词,如“啊”、“呢”等;
7. 应避免使用叠词,如:“你好你好”;
8. 中文命令词中只能由汉字组成,不允许有空格,逗号等其他字符;
9. 命令词中的数字需要以汉字表示,如“调高一度”;
10. 若您还未确定命令词,建议您从文档中心的“命令词推荐”中选择。
英文唤醒词设计
1. 唤醒词建议由2-4个单词(4-6个音节)组成,过短容易出现高误唤醒,过长不便用户呼叫和记忆;
2. 唤醒词中单词的音节较长且相邻发音区分度越大越好;
3. 应避免重复或者相近读音的单词出现在唤醒词中,相邻音节要规避连音;
4. 单词要发音清晰、能量响度高、开口度大;
5. 尽量选取不常用的词作为唤醒词,避免使用日常用语,可以有效降低误唤醒甚至避免误唤醒;
6. 应避免使用叠词,如:“HELLO-HELLO”;
7. 一个语言模型仅允许一个唤醒词,如果需要多个唤醒词,请单独优化并使用多网络切换功能,具体方法可联系我司技术支持人员获取更多信息。
英文命令词设计
1. 建议由2-4个单词(4-6个音节)组成,过短容易出现高误识,过长不便用户记忆;
2. 命令词间音节区分度越大越好;
3. 符合用户的语言习惯,尽量采用常用说法,内容具体直接;
4. 应避免使用日常用语,如:“HI、HELLO”;
5. 避免使用相似音节,词的发音清晰响度要大,如避免同时使用TURN-ON和TURN-OFF;
6. 应避免使用叠词,如:“HELLO-HELLO”。
日文唤醒词设计
1. 唤醒词建议由4-6个音节的日文组成,过短容易出现高误唤醒,过长不便用户呼叫和记忆;
2. 唤醒词中单词的音节较长且相邻发音区分度越大越好;
3. 应避免重复或者相近读音的词出现在唤醒词中,相邻音节要规避连音;
4. 词要发音清晰、能量响度高、开口度大;
5. 尽量选取不常用的词作为唤醒词,避免使用日常用语,可以有效降低误唤醒甚至避免误唤醒;
6. 应避免使用叠词,如:如:“ラボ-ラボ”;
7. 一个语言模型仅允许一个唤醒词,如果需要多个唤醒词,请单独优化并使用多网络切换功能,具体方法可联系我司技术支持人员获取更多信息。
日文命令词设计
1. 一条日语命令词建议由4-6个音节的日文组成,过短容易出现高误识,过长不便用户呼叫和记忆;
2. 命令词间音节区分度越大越好;
3. 符合用户的语言习惯,尽量采用常用说法,内容具体直接;
4. 应避免使用日常用语,如:“はい、おはよ”;
5. 避免使用相似音节,词的发音清晰响度要大,如;下げて(sa ge te)、上げて(a ge te);
6. 应避免使用叠词,如:“ラボ-ラボ”。