开源项目功能
HeyGem、LstmSync
- 技术特点:
- 保留原视频的所有动作
- 通过现有视频+音频完成对口型功能
- 局限性:
- 依赖原始视频素材质量
- 无法生成新动作
平台技术
HeyGen平台
- 技术特点:
- 有大量公用数字人
- 可完成对口型功能
- 缺点:
- 动作表现单一
- 缺乏肢体语言表达
- 无法创造动作
禅境平台
技术特点
- 形象生成
- 动作生成(基于形象)
- 口型同步(在动作基础上)
缺点:
- 动作夸张不自然
- 口型匹配不完全准确
一、整合方案:
- 各平台优势整合
- 禅境平台:用于基础形象生成(质量最优)
- 即梦平台:用于动作生成(弥补禅境动作缺陷)
- HeyGem开源方案:用于最终口型同步(保证自然度)
- 规避各平台弱点
- 避开禅境不自然的自动生成动作
- 避开HeyGen缺乏动作的局限性
- 避开即梦可能存在的形象生成质量波动