数字人模型使用方法 v1.0 beta

模型介绍

ZeroCut 有两个自主研发的数字人模型,分别为:

  • zerocut-avatar-1.0 - 性价比极高的数字人模型,价格低至每秒 6 积分,支持生成 5~240 秒视频

  • zerocut-avatar-1.5 - 高品质数字人模型,价格为每秒 15 积分,支持生成 5~240 秒视频

使用方法

两个模型都可以在网页版的 Agent 模式或专业版中使用,也可以通过 API 或 Cli 调用

1. 复刻音色

如果你希望用自己的音色来说话,ZeroCut 提供了音色复制的功能,你可以在网页版 Agent 模式或专业版中,上传一段 10~30s 的语音,比如自己说话、讲课的片段,放到素材(materials)目录下(Web版直接上传mp3即可)。

然后让 AI 帮你复刻音色:

用 语音demo.mp3 复刻一个音色

AI 会自动完成语音复刻,并将音色 ID 返回出来。

可以在管理后台查询到复刻音色:

通过音色 ID 可以生成语音、生成数字人视频等。

⚠️ 注意:

  • 复刻一个音色,需要消耗300积分,一个人物通常只需要复刻一次,请勿重复复刻

  • ZeroCut 做了安全策略,复刻的语音ID只有当前账号才可以使用,其他账号无法使用

  • 复刻的语音要尽早使用,7天内须至少使用过一次,否则将被平台删除,且积分不会返还

  • 如果不想用自己真实的音色,可以跳过这一步,使用数字人模型时不指定音色,AI会根据人物形象自动配音

2. 准备人物形象照片

你应该准备一个用于生成数字人人物形象的清晰的正面照片。

如果你要求人物在视频中有复杂动作,比如特定手势,可准备多张参考照片,但照片务必要正脸,形象清晰。

Web版直接上传照片,专业版将照片复制到素材目录(materials)下。

3. 描述场景和说的内容

接下来你就可以在 Agent 模式下(或专业版里),对 AI 说:

参考 照片.png,使用 z_video_xxxxxx 音色,生成一个数字人视频,内容为图1人物坐在一张沙发上,手里捧着一本三国演义,声情并茂地朗读《出师表》;模型使用 zerocut-avatar-1.0。

这样 AI 就会按照你的要求生成数字人视频啦

注意按照如下格式:

参考图 + 音色 + 场景 + 人物 + 道具 + 动作 + 内容 + 模型

这样就能生成你想要的数字人视频了。