HappyHorse 1.0 模型介绍
HappyHorse 1.0 支持图像、视频、音频和文本四种输入模态,以实现更丰富的表达和更可控的生成。使用图像设定视觉风格,使用视频指定角色动作和镜头运动,使用几秒钟的音频设定节奏和情绪……结合文本提示词,创作过程变得更自然、高效,真正像导演一样。
当前网页应用可用性
happy-horse.ai 目前提供文本转视频和图像转视频功能。HappyHorse 1.0 是付费升级版,具有原生 1080p HD、音视频同步和高级多模态功能。
核心参数
- 图像输入:最多9张图像,格式为jpeg/png/webp/bmp/tiff/gif,每张最大30MB
- 视频输入:最多3个视频,总时长2-15秒,格式为mp4/mov,每个最大50MB,分辨率409600-927408
- 音频输入:最多3个音频文件,最长15秒,格式为mp3/wav,每个最大15MB
- 文本输入:自然语言提示词,生成时长可在4-15秒之间自由调整
- 混合输入总文件限制为12个。优先上传对视觉或节奏影响最大的素材