数字人模型使用方法 v1.0 beta

ZeroCut 有两个自主研发的数字人模型，分别为：

两个模型都可以在网页版的 Agent 模式或专业版中使用，也可以通过 API 或 Cli 调用

如果你希望用自己的音色来说话，ZeroCut 提供了音色复制的功能，你可以在网页版 Agent 模式或专业版中，上传一段 10～30s 的语音，比如自己说话、讲课的片段，放到素材(materials）目录下（Web版直接上传mp3即可）。

然后让 AI 帮你复刻音色：

用语音demo.mp3 复刻一个音色

AI 会自动完成语音复刻，并将音色 ID 返回出来。

可以在管理后台查询到复刻音色：

通过音色 ID 可以生成语音、生成数字人视频等。

⚠️ 注意：

你应该准备一个用于生成数字人人物形象的清晰的正面照片。

如果你要求人物在视频中有复杂动作，比如特定手势，可准备多张参考照片，但照片务必要正脸，形象清晰。

Web版直接上传照片，专业版将照片复制到素材目录（materials）下。

接下来你就可以在 Agent 模式下（或专业版里），对 AI 说：

参考照片.png，使用 z_video_xxxxxx 音色，生成一个数字人视频，内容为图1人物坐在一张沙发上，手里捧着一本三国演义，声情并茂地朗读《出师表》；模型使用 zerocut-avatar-1.0。

这样 AI 就会按照你的要求生成数字人视频啦

注意按照如下格式：

参考图 + 音色 + 场景 + 人物 + 道具 + 动作 + 内容 + 模型

这样就能生成你想要的数字人视频了。

#数字人模型使用方法 v1.0 beta