AI In Action
挑战
活动
学习路径
展示
排行榜
EN
登录
语音助手构建器 | AI In Action
挑战
语音助手构建器
官方
高级
AI 音频与语音
12-18 hours
语音助手构建器
构建一个可定制的语音助手框架,用户可以通过可视化编辑器定义意图、回复和动作。助手能够监听唤醒词、理解自然语言命令,并用合成语音进行回应。
0 个赞
0 次 Fork
0 条评论
voice-assistant
nlu
wake-word
conversational-ai
0
登录以跟踪进度
目标
实现唤醒词检测以激活助手
捕获并转录用户语音命令
使用 LLM 处理自然语言意图
构建用于定义自定义命令和回复的可视化编辑器
用上下文感知的合成语音进行回应
提示
使用 Porcupine 或简单的关键词检测模型实现唤醒词检测
将意图定义为映射到动作处理器的结构化 JSON
在多轮对话中保持上下文,以支持后续追问
资源
platform.openai.com/docs/guides/speech-to-text
platform.openai.com/docs/guides/text-to-speech
评论 (0)
登录
后发表评论。
暂无评论。成为第一个评论的人!
实时语音翻译器
音频深度伪造检测器