极速非自回归架构:阿里达摩院推出,专为中文实时转写设计,毫秒级延迟。
- 🚀 速度: 10秒语音 < 0.5秒识别
- 💡 CPU: 8核以上 (无需GPU)
- 🧠 精度: 标准中文场景极高准确率,普通话准确度达到98%以上
- ⚡ 场景: 通话实时转文字
下载
极速非自回归架构:阿里达摩院推出,专为中文实时转写设计,毫秒级延迟。
- 🚀 速度: 10秒语音 < 0.3秒识别
- 💡 CPU: 8核以上 (无需GPU)
- 🧠 精度: 标准中文普通话加四川话微调,四川方言准确率达到95%以上
- ⚡ 场景: 通话实时转文字
下载
轻量级语音理解:支持中/英/日/韩/粤,低资源占用,适合移动端或边缘设备。
- ⚡ 低延迟: 响应速度极快
- 📱 内存: 1GB 空闲内存
- 🌍 多语: 跨语言识别能力强,抗噪声口音能力强,准确率达到93%以上
- 🤖 场景: 实时交互助手
下载
轻量级语音理解:支持中/英/日/韩/粤,低资源占用,适合移动端或边缘设备。
- ⚡ 低延迟: 响应速度极快
- 📝 内存: 1GB 空闲内存
- 🌍 多语: 跨语言识别能力强,抗噪声口音能力强,准确率达到93%以上
- 🤖 场景: 实时交互助手
下载
通义千问大模型:支持全球主流语言及中国各地方言,快速LLM字幕生成首选,6亿参数大模型。
- 🌏 覆盖: 30+ 语种 & 方言
- 💾 内存: 3GB 空闲内存
- 📝 用途: 高精度字幕/离线转写,方言准确率达到95%以上
- ⚙️ 算力: 建议最新架构CPU
下载
通义千问大模型:支持全球主流语言及中国各地方言,高精度离线语音转文字首选,17亿参数大模型。
- 🌏 覆盖: 30+ 语种 & 方言
- 💾 内存: 5GB 空闲内存
- 📝 用途: 高精度离线方言语音转写,方言准确率达到95%以上
- ⚙️ 算力: 最新架构CPU, 适合离线或对实时要求不是很高的语音转文字
下载
工业级抗噪系统:基于FireRed架构,具备极强的环境噪音过滤能力,支持中国各地流行的主要方言。
- 🔇 抗噪: 强噪音下依然精准
- 💾 内存: 4GB 空闲内存
- 📼 场景: 录音文件后处理,方言准确率达到96%以上
- 🐢 速度: 适合非实时批量处理
下载