Paraformer-zh

体积: 200MB+

语言: 中文普通话

极速非自回归架构：阿里达摩院推出，专为中文实时转写设计，毫秒级延迟。

🚀 速度： 10秒语音 < 0.5秒识别
💡 CPU： 8核以上 (无需GPU)
🧠 精度： 标准中文场景极高准确率，普通话准确度达到98%以上
⚡ 场景： 通话实时转文字

下载

Paraformer-sc

体积: 210MB+

语言: 中文+四川话

极速非自回归架构：阿里达摩院推出，专为中文实时转写设计，毫秒级延迟。

🚀 速度： 10秒语音 < 0.3秒识别
💡 CPU： 8核以上 (无需GPU)
🧠 精度： 标准中文普通话加四川话微调，四川方言准确率达到95%以上
⚡ 场景： 通话实时转文字

下载

SenseVoice-zh

体积: 155MB

语言: 中文普通话

轻量级语音理解：支持中/英/日/韩/粤，低资源占用，适合移动端或边缘设备。

⚡ 低延迟： 响应速度极快
📱 内存： 1GB 空闲内存
🌍 多语： 跨语言识别能力强，抗噪声口音能力强，准确率达到93%以上
🤖 场景： 实时交互助手

下载

SenseVoice-yue

体积: 155MB

语言: 中文+粤语

轻量级语音理解：支持中/英/日/韩/粤，低资源占用，适合移动端或边缘设备。

⚡ 低延迟： 响应速度极快
📝 内存： 1GB 空闲内存
🌍 多语： 跨语言识别能力强，抗噪声口音能力强，准确率达到93%以上
🤖 场景： 实时交互助手

下载

Qwen3-LLM-0.6B

体积: 822MB

语言: 多语种方言

通义千问大模型：支持全球主流语言及中国各地方言，快速LLM字幕生成首选，6亿参数大模型。

🌏 覆盖： 30+ 语种 & 方言
💾 内存： 3GB 空闲内存
📝 用途： 高精度字幕/离线转写，方言准确率达到95%以上
⚙️ 算力： 建议最新架构CPU

下载

Qwen3-LLM-1.7B

体积: 2GB

语言: 多语种方言

通义千问大模型：支持全球主流语言及中国各地方言，高精度离线语音转文字首选，17亿参数大模型。

🌏 覆盖： 30+ 语种 & 方言
💾 内存： 5GB 空闲内存
📝 用途： 高精度离线方言语音转写，方言准确率达到95%以上
⚙️ 算力： 最新架构CPU, 适合离线或对实时要求不是很高的语音转文字

下载

FireRed-ASR

体积: 820MB

语言: 多方言支持

工业级抗噪系统：基于FireRed架构，具备极强的环境噪音过滤能力，支持中国各地流行的主要方言。

🔇 抗噪： 强噪音下依然精准
💾 内存： 4GB 空闲内存
📼 场景： 录音文件后处理，方言准确率达到96%以上
🐢 速度： 适合非实时批量处理

下载

🚀 信创电话助手模型资源库