语音识别三大应用


#1

今儿读了一篇好文,在这里总结一小下。

语音识别在实际应用中一般分为三类:语法驱动 (Grammar-Driven),听写
(Dictation),自然语言理解 (NLU)。

  1. 语法驱动 (Grammar-Driven)
    这种应用在识别中着重寻找关键字,也就是识别slot data, 比如人名,电话号,日期等等。就像在手机app的登录页面里,从Edit Text Field中获取用户名一样。这种方式先将语法定义在BNF或XML文件中,并且应用已知用户将会说的话题范围是什么。

  2. 听写 (Dictation)
    听写,也就是从语音到文字的识别。比如Nuance Dragon Naturally Speaking系列软件和各种语音输入app。

  3. 自然语言理解 (NLU)
    这种应用试图理解用户的意图,即user’s intent,甚至去理解用户的情绪。然后根据用户的意图去执行一些操作。

详情请戳这里:


#2

赞赞赞赞赞赞赞赞!


#3

顶顶顶 …