我们聚合了常见的视频生成模型,方便大家调用。生成失败均不扣费
Veo 3.1模型#
Veo 3.1 是 Google 最先进的模型,可生成高保真度的 8 秒 720p 或 1080p 视频,这些视频具有令人惊叹的逼真效果和原生生成的音频。具备以下特点:首尾帧生成视频:通过指定第一帧和最后一帧来生 成视频。
seedance-1.5-pro (企业级高可用)#
即梦同源的视频生成能力,专业级视频生成引擎,释放无限创意。 准确遵循复杂指令,视觉表达流畅一致,支持最高1080P高清渲染,更可驾驭多元艺术风格,在视频生成质量出色的基础上,是生成效果与速度兼备的高性价比之选。图生视频 - 首帧:输入首帧图片和文本提示词,生成视频
图生视频 - 首尾帧:输入首帧图片、尾帧图片和文本提示词,生成视频
Grok Video 3 (速度极快)#
Grok Video 是 xAI 推出的高性能视频生成模型,主 打原生音效同步与极致生成速度。它依托 Colossus 超算集群,能够快速将文本或图像转化为带有环境音与背景音乐的短视频,并支持视频续写与风格转换。Sora 2 (暂不可用)#
Sora 2 能完成前代Sora模型难以企及——甚至完全无法实现——的任务:演绎奥运级体操动作、在冲浪板上精准模拟浮力与刚性动态的后空翻,以及在猫咪死命抓握时完成三周半跳跃。
该模型在可控性方面也实现了重大突破,能够执行跨越多个镜头的多重复杂指令,同时精确维持世界状态。它在写实风格、电影风格和动漫风格的呈现上均表现卓越。由于sora2本 身限制,不要使用真人照片作为参考图
参数表#
参数表#
模型:veo3.1#
模型:veo3.1-pro#
模型:grok-video-3#
是否支持gen_duration: ✅ 6,10或者15
模型:sora2#
是否支持gen_duration: ✅ 10或者15
模型:seedance-1.5-pro#
是否支持gen_duration: ✅ 4,5,6,7,8,9,10,11,12
prompt:特写镜头下,两人凝视着墙上一幅神秘的图案,火把的光芒忽明忽暗地摇曳。男人低声自语:“一定是这个了,这就 是密文。” 女人看向他,激动地轻声追问:“你发现了什么?”; model:veo3.1; resolution=1280x720
prompt:一张超写实的微距照片,照片中,迷你冲浪者在古朴的石制浴室水槽内乘风破浪。一个老式黄铜水龙头正在流水,营造出永恒的冲浪声。超现实、奇幻、明亮的自然光线。; model:veo3.1
prompt:雾气缭绕的太平洋西北森林的广角镜头。两名疲惫的徒步者(一男一女)在蕨类植物丛中艰难前行,突然,男士停下脚步,盯着一棵树。特写:树皮上留有新鲜的深爪印。男士:(手放在猎刀上)“那不是普通的熊。”Woman:(声音因恐惧而紧绷,目光扫视着树林)“那是什么?”粗糙的树皮、折断的树枝、潮湿泥土上的脚步声。一只孤零零的鸟在鸣叫。”; model:veo3.1-pro; resolution=1080x1920
prompt:猫咪开车疾驰,开出跑道; model:veo3.1
prompt:视频以中景平拍镜头开篇,画面中是一位黑发佳人,眼眸漾着暖棕的柔光。她身着一袭华美的高定火烈鸟礼裙,层叠的粉与玫红羽饰错落有致,搭配俏皮的粉色心形墨镜,相映成趣。她步履从容、自信淡然,踏过阳光倾洒的环礁湖,脚下是澄澈见底的浅碧色湖水。镜头缓缓拉远,切至中全景,惊艳的一幕徐徐展开:礼裙长长的拖摆在她身后的水面上翩然漾开,轻盈浮滑,宛若流云。明艳的裙裾撞入静谧简约的湖景,浓烈的色彩对比,更衬出画面如电影般梦幻的氛围感,定格下这一瞬极致的优雅,勾勒出高定时尚的绮幻意境。; model:veo3.1-pro; resolution=1920x1080
prompt:一个木质老年木偶坐在街头长凳上缓慢弹奏吉他,他看向手中的吉他,动作僵硬但有节奏感,手指抬起时带有轻微卡顿感。街头安静,偶尔有风吹动他破旧的衣角,整段氛围温暖而略显; model:jimeng-video-3.0; resolution=1080x1920
prompt:主体拿出银色雪花魔法棒,对着自己头顶挥舞出现很多银光细闪,变身冰雪女王,蓝色的公主裙和银色王冠闪闪发; model:jimeng-video-3.0
prompt:赛博朋克风格的城市,一个机器人脸上是像素风格的图片,做了一个后空翻,然后消失不见了; model:sora2; resolution=1080x1920, duration=10
prompt:门前有很多人走来走去; model:sora2; resolution=1080x1920, duration=10
价格表#