设备上的AI对我们来说是众所周知的,但直到现在,OEM才开始认真地实施这项技术。谷歌最近宣布了一种全神经语音识别器,它将在很大程度上不依赖于网络。这意味着端到端的语音识别将通过RNN换能器(RNN-T)技术在设备中进行。所发生的是语音识别器驻留在设备内部,使得它足够强大,可以在Gboard中进行语音输入。据说它非常小巧,可以存放在手机上。
这个想法是语音识别器可以一直使用,不管是离线还是在线。逐字符检查单词,以便实时检查和识别。
它只像键盘听写系统一样工作,它听你的声音。谷歌表示,斑点或网络延迟减少了。
这个新系统被称为递归神经网络传感器(RNN-T)。它被描述为一个没有注意机制的序列对序列模型。它连续处理输入样本,并流式输出听写符号。
Rn-t允许离线识别。这是可能的,因为模型直接托管在设备上。搜索是在RNN-T训练的单个神经网络中进行的,只有80MB的空间很轻。
所有神经和设备上的这种Gboard语音识别器将在所有像素模型上准备就绪。目前只有英语,但预计在不久的将来会提供其他语言。