数字人技术测试

多种技术对比的数字人技术

开源项目功能

HeyGem、LstmSync

  • 技术特点
    • 保留原视频的所有动作
    • 通过现有视频+音频完成对口型功能
  • 局限性
    • 依赖原始视频素材质量
    • 无法生成新动作

平台技术

HeyGen平台

  • 技术特点
    • 有大量公用数字人
    • 可完成对口型功能
  • 缺点
    • 动作表现单一
    • 缺乏肢体语言表达
    • 无法创造动作

禅境平台

技术特点

  1. 形象生成
  2. 动作生成(基于形象)
  3. 口型同步(在动作基础上)

缺点:

  • 动作夸张不自然
  • 口型匹配不完全准确

一、整合方案:

  1. 各平台优势整合
  • 禅境平台:用于基础形象生成(质量最优)
  • 即梦平台:用于动作生成(弥补禅境动作缺陷)
  • HeyGem开源方案:用于最终口型同步(保证自然度)
  1. 规避各平台弱点
  • 避开禅境不自然的自动生成动作
  • 避开HeyGen缺乏动作的局限性
  • 避开即梦可能存在的形象生成质量波动
可乐的小站
使用 Hugo 构建
主题 StackJimmy 设计