这节课我们学一下Dify里如何把文本转换成语音,比如我们希望大模型回答我们的问题是以语音的方式回答我们的,还可以把生成的语音导出来,形成一段音频。

配置硅基流动,拿到API密钥
上节课我们已经学了硅基流动的基本配置,但也只学了它生成图片的功能,这节课我们就直接配置一下里边所有的大模型。
也就是说你对硅基流动有了一定的了解,所以不作过多的介绍,直接配置就好。
首先我们登录硅基流动的网站,然后点击API密钥,再点击新建密钥,然后点击复制密钥,就可以拿到API密钥了。
配置Dify,增加硅基流动的API密钥
安装硅基流动模型供应商
有了API密钥后,我们先来安装硅基流动的模型供应商。
打开Dify,然后在设置里,选择模型供应商,在安装模型供应商里,点击SiliconFlow(硅基流动),然后把刚才复制好的API密钥粘贴到输入框,然后点击保存。
在硅基流动里添加模型
直接在模型列表里,找到SiliconFlow(硅基流动),然后点击添加模型,随便选择一个模型,然后复制刚才那个密钥,就可以把硅基流动的所有模型都添加到Dify里了。
验证模型是否安装成功
当上面的步骤完成后,我们需要验证一下。直接点击模型供应商里右上角的系统模型设置,可以看到语音转文本模型和文本转语音模型都已经配置好了。
这个配置好了,说明我们的硅基流动也配置好了,可以使用里边的模型了。
Dify文本转语音
让聊天以语音的方式回答你
现在Dify回答(聊天),就有语音功能了。
创建空白应用,然后选择Chatflow(对话式),然后起个名字,比如文本转语音,然后点击创建。
这时候在界面的右上角,有一个功能的按钮,点击后可以开启文字转语音功能。
开启功能后,会让我们进行音色设置。我们选择语言中文,音色随便选一个,然后开启自动播放,就可以实现有语音的聊天了。
我们测试一下。
让语音可以保存下来
只能聊天的时候使用语音很好,但有时候我们希望把回答直接转成语音,并能下载下来。这个也是完全可以实现的。
直接在直接回复节点之前,增加一个工具,选择Audio,然后再选择Text to Speech(文本转语音),然后点击保存。这时候再选择模型,调整一下声色就可以了。(具体视频中演示)
这期就到这里了,希望对你有所帮助。
转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。可以在下面评论区评论,也可以邮件至 web0432@126.com