AI In Action
挑战
活动
学习路径
展示
排行榜
EN
登录
实时语音翻译器 | AI In Action
挑战
实时语音翻译器
官方
高级
AI 音频与语音
10-15 hours
实时语音翻译器
创建一个实时语音翻译应用,能够监听一种语言的语音输入,进行转录、翻译,并将翻译结果朗读出来。支持多种语言对,实现低延迟处理。
0 个赞
0 次 Fork
0 条评论
translation
whisper
tts
real-time
0
登录以跟踪进度
目标
捕获实时麦克风输入并将其流式传输进行转录
使用 Whisper 对源语言语音进行转录
使用 LLM 或翻译 API 将转录文本翻译为目标语言
使用目标语言的 TTS 语音朗读翻译结果
最小化端到端延迟,实现近实时的对话流程
提示
将音频分成短小的重叠片段处理以降低延迟
尽可能使用流式 API 来减少等待时间
并排显示原始转录文本和翻译结果
资源
platform.openai.com/docs/guides/speech-to-text
platform.openai.com/docs/guides/text-to-speech
评论 (0)
登录
后发表评论。
暂无评论。成为第一个评论的人!
音乐制作套件
语音助手构建器