一 引擎简介
HHSRE 是针对小内存ARM系列平台优化开发的目前全球最小的中英文语音识别引擎,并达到了90%的识别精度及较快的识别响应速度。
由于小内存ARM系列平台的执行代码和内存及速度的客观限制,在响应速度和识别精度的客观要求下,HHSRE优化了中英文统计数据模型(HMM)、语法搜索算法和评分机制,使之在ARM小内存平台系统的运行达到实用。
HHSRE 语音引擎目前支持中文(普通话)和英文(美式),数据及执行代码小于200KB,使用内存小于64KB,响应速度小于2秒。
二 接口概述
为了减少对内存的使用,引擎分成三个单元:1. 语音特征数据生成接口,2. 语音识别评分接口,3. 语法数据生成工具
1. 语音特征数据API:
输入:语音数据,数据采样率 ( Sample rate ) 8000Hz,单声道 ( Mono ),16位 (Bit)
每帧256 Samples,每两帧之间重叠 128 Samples。
输出:特征数据,26 × 2 字节 × 帧数。
特别提示:* 最长支持8秒的语音数据输入。
2. 语音识别评分API:
输入:特征数据(语音特征API的输出数据)
语法数据(语法生成工具产生的数据)
输出:句和单词的识别评分
3. 语法数据生成工具:
输入:Unicode文本文件
输出:语法数据文件
特别提示:
* 语法文件目前最大支持256(句) × 32(单词)Unicode语法文本。
* 在引擎授权之后,我公司直接提供以上语法处理工具。
三 产品应用
1. 点读笔、点读机
2. 儿童电脑、学生电脑
3. 电子词典、掌上电脑