首页 资讯

扣子(coze)实战 | 用coze一键打造自己的口播数字人,操作简单方便(包含coze网页登录、声音克隆、数字人制作)

分类:资讯
字数: (1059)
阅读: (22)
0
关注👇,一块交流,一块进步!

大家好,我是老三,专注于AI智能体工作流方面的知识分享,今天给大家分享的是用coze一键打造自己的口播数字人。

前言

前一段时间,我在搞数字人方面的,想用coze做一个工作流来自动生成数字人口播视频

尝试了coze里面的婵镜和飞影数字人插件,发现用这样的插件做出来的效果和直接用他们官网进行制作并没有什么特别的优势,我甚至感觉还不如直接在他们官网上使用呢

所以我就抛弃了上面的这两个方式,搭建出了一个>成本更低、操作更傻瓜、效果还不错的生成数字人的工作流

实现了一键制作出数字人,即用即走!

>大家可以先看看我的工具的是如何生成数字人的:

>制作出来的数字人效果如下:

这个工具是不是制作数字人更加方便,而且效果还是在线的,如果你也感兴趣,请继续往下看吧。

接下来,我们和大家分享如何制作出这个的数字人的工作流,大家可以>关注点赞收藏,后续我会继续为大家分享工作流教程。

正文一、整体工作流如下:扣子(coze)实战 | 用coze一键打造自己的口播数字人,操作简单方便(包含coze网页登录、声音克隆、数字人制作)二、开发思路:从上传的口播文件中提取出音频的内容再通过音色复刻,将输入的文案结合音频进行声音克隆将克隆出来的声音加上口播视频进行制作出数字人最后在视频上加上字幕三、详细工作流分析1、开始节点

接收应用UI传进来的口播文件和口播文案

扣子(coze)实战 | 用coze一键打造自己的口播数字人,操作简单方便(包含coze网页登录、声音克隆、数字人制作)2、音频文件提取

接收“开始节点”的口播文件,将音频提取出来

>注:自制插件

扣子(coze)实战 | 用coze一键打造自己的口播数字人,操作简单方便(包含coze网页登录、声音克隆、数字人制作)3、音频内容提取

将口播文件的音频内容提取出来

扣子(coze)实战 | 用coze一键打造自己的口播数字人,操作简单方便(包含coze网页登录、声音克隆、数字人制作)4、声音克隆

结合口播的音频和“开始节点”的文案进行音色复刻,并完成声音的克隆

注:自制插件

扣子(coze)实战 | 用coze一键打造自己的口播数字人,操作简单方便(包含coze网页登录、声音克隆、数字人制作)5、数字人生成

传入“开始节点”的口播文件以及克隆出来的音频进行数字人生成

扣子(coze)实战 | 用coze一键打造自己的口播数字人,操作简单方便(包含coze网页登录、声音克隆、数字人制作)6、查询数字人

我们在这个循环体里面间隔的查询数字人是否已经生成

扣子(coze)实战 | 用coze一键打造自己的口播数字人,操作简单方便(包含coze网页登录、声音克隆、数字人制作)7、生成字幕

将生成的数字人链接传入进来生成下方带有字幕的数字人

扣子(coze)实战 | 用coze一键打造自己的口播数字人,操作简单方便(包含coze网页登录、声音克隆、数字人制作)

到此为止,整个数字人的制作完成了,用这个工作流制作数字人是不是很方便的呢?

掌握以上关键步骤, 你也能轻松制作出自己的数字人! 快去亲自试试吧!

关键点分析
  • 视频中展示的登录页面,我虽然没有讲,但是也是一个比较重要的地方,这个登录界面是不依赖于任何第三方的接口,纯coze就可以实现,对于想做付费的小伙伴,是一个比较不错的方案
  • 声音克隆:采用的是通义千问的CosyVoice2.0,克隆出来的声音虽然达不到原声的程度,但是整体效果还是不错的
  • 数字人:采用的是当下比较火的开源数字人平台heygem,对出来的口型也是非常不错

转载请注明出处: CHATWEB

本文的链接地址: https://www.chatweb.com.cn/post-41.html

评论列表:
评论本文(0)
empty

暂无评论