第1步:下载软件 获取途径1:https://www.123pan.com/s/hjQ0Vv-0FGpd.html 获取途径2:https://pan.baidu.com/s/1tDzthB3HN9CtWrb_ie4r4Q?pwd=28ij获取途径3:https://drive.google.com/file/d/1mYbpvcsl7wPeA_WisqmQChsTUKk9RaLS/view?usp=drive_link Github项目主页:https://github.com/OpenTalker/SadTalker?tab=readme-ov-file
第2步:启动软件 在下载下来的SadTalker.zip上点右键,选“解压到SadTalker文件夹”,解压出来。
解压密码:jinhuazhou
打开解压出来的SadTalker文件夹,找到WEBUI运行.bat,打开它。会弹出一个黑色窗口,稍等一会,窗口里会出现2行文字,如下图:
把黑色窗口第一行那个网址复制一下,只能选中后,按Ctrl+C复制,右键出不来菜单,粘贴到浏览器地址栏里打开;或者是,按住Ctrl键,再用鼠标点那个网址,会自动在浏览器里打开它。最好用谷歌浏览器,或微软Edge浏览器。打开那个网址后,浏览器显示的内容如下图所示。注意:不可开着梯子,不可开着代理之类的,网络必须直连。
至此,软件已经启动,该软件就是在这个浏览器页面里操作。在软件使用过程中,那个黑色窗口不要关闭,否则软件停止运行。 第3步:软件的使用 首先,上传相片,上传音频,如下图所示。 音频可以用文字转语音工具制作,也可以自己录。
接着,设置一下右边的选项,有两种建议方案。 第一种设置方案: 该方案生成的数字人和原图一样大,头部动作幅度虽然较小,但不会出现头部和身子分离的现象,身子不动。 请按照下图设置:
第二种设置方案: 该方案会对原图进行裁切,只生成头部视频,没有身子,生成的数字人表情动作比第一种方案更丰富,更生动。 请按照下图设置:
生成并下载视频: 设置完成后,点“生成”,稍等一会,就会在左下方生成视频。原来的那个黑色窗口里会看到进度。 生成视频后,在生成的视频上点右键,会看到下载选项; 如果找不到下载选项,可以直接打开软件目录里的“results”文件夹,再打开里面的文件夹,会看到几个mp4文件,有的仅是头部,有的是普通画质,有的是超清画质,都打开看看,找个好的。
crop:对原图进行裁切,只生成头部视频,没有身子,生成的数字人表情动作丰富,更生动。 resize:生成的数字人身子也稍微动,但效果很烂,太假,不建议使用。 full:生成的数字人和原图一样大,身子不动。如果勾选“静态模式”,则头部动作幅度较小,但不会出现头部和身子分离的现象;如果不勾选“静态模式”,则头部动作幅度更大,但有时候会出现头部和身子分离的现象。 extcrop、exfull:与cropfull功能一样,但对头部的裁剪范围更大。 其他选项说明: 姿态Posestyle:头部晃动幅度,值越大,晃动越厉害。 表情expressionscale:脸部表情幅度,尤其是嘴唇,值越大,动作越大。 batch sizein generation:值越大,处理越快,但对显卡要求越高。显卡不好选1就行。 启用参考视频Use Reference Video下方的选项: pose:生成的数字人的脸部姿势和参考视频一致。 blink:生成的数字人眨眼和参考视频一致。 pose+blink:生成的数字人脸部、眨眼与参考视频一致。 all:生成的数字人和参考视频全部保持一致,包括声音。