
赛道Hyper | PixVerse国内版上线:AI视频市场生变?
作者:周源
全球用户量领先的AI视频生成平台——PixVerse,于6月6日推出国内版产品“拍我AI”,同步上线网页端及移动端应用,并开放最新V4.5模型供用户使用。
V4.5模型在生成速度、画面精细度及多主体控制等方面实现了提升。
首先是专业运镜系统,集成20余种电影镜头模板(如希区柯克变焦和一镜到底等),通过深度学习分析经典电影镜头运动轨迹,实现AI自动化的专业运镜。
用户可调节焦距变化速度(0.1-10倍速)、镜头抖动幅度(0-5 级模拟斯坦尼康效果)等参数,生成具有电影质感的动态画面。
其次,多模态融合技术,支持最多8张图片输入,通过SE(3)等变网络,实现多图像空间关系解算,结合Transformer的时序注意力机制保证画面连贯性,自动生成包含起承转合的20秒完整片段。
所谓SE(3)等变网络,是一种在三维空间中,具有旋转和平移等变性质的神经网络,能自动学习对旋转和平移等变的特征表示,从而在各种三维相关的任务中取得更好的性能。
通俗点说,SE(3)等变网络的工具价值就是:给它“看”一个玩具汽车3D模型,正着放、倒着放、挪到左边右边,这个网络都能明白这是同一辆玩具汽车,还能自动抓住这个汽车最关键的特征,像轮子、车身形状这些。
这样一来,不管是用来给3D模型分类、分析蛋白质的结构,还是帮机器人在3D空间里找路,SE(3)等变网络都能比普通网络做得更好,从而更准确地完成任务。
通过多模态融合技术,用户可将人物、背景和道具图像结合,生成风格一致的叙事视频,提升复杂场景的创作自由度。
第三,优化复杂动作,针对高速运动、群体交互等动态场景,模型凭对抗训练,能优化动作流畅度,相比V4.0提升约30%,减少了扭曲与伪影,适合体育、战斗等对动态表现要求较高的场景。
海外有测试用户,成功使用单一图像生成《不可能的任务》(Mission:Impossible)风格的动作场景,验证了模型的多功能性。
第四,本地化或端侧适配,新增中文提示词支持、智能音效匹配及多语言界面(覆盖英语、中文等7种语言),并针对移动端做了计算图优化和模型轻量化,未来有望实现实时电影级视频创作。
PixVerse自2024年1月海外上线以来,已累计吸引全球超6000万用户,月活跃用户(MAU)突破1600万,居于AI视频生成领域前列;其爆款特效如“毒液变身”,在TikTok等社交平台累计播放量达数十亿次,并多次登顶美国、德国、巴西等国家的应用商店榜单。
啥叫“毒液变身”?
这是指爱诗科技旗下AI视频生成工具PixVerse V3推出的一款特效功能,用户上传人、动物的照片,甚至是水果等物体的图片,都能一键将其变身为毒液造型。
使用该特效时,用户可在PixVerse官网选择V3模型,点击“Effect”按钮,选择“毒液变身”特效并上传照片,然后等待生成即可。
生成的毒液变身视频效果丝滑,黑色的黏稠物质仿佛有生命般在物体表面流动,其独特的质感和光影效果,能让视频在海量内容中脱颖而出。
2025年初,V4.5版本上线后,其App在美国iOS总榜排名一度位列第四,成为广受欢迎的应用。
PixVerse是爱诗科技旗下专注于元宇宙场景下AI视觉创造的产品。爱诗科技是一家专注于AI视频生成技术研发与应用的公司。
2023年4月,字节跳动前AI Lab视觉技术负责人王长虎创立爱诗科技,团队核心成员由来自微软、字节跳动等顶尖企业的技术专家组成。
国内版“拍我AI”延续了海外市场的技术优势,同时针对中国用户习惯做了优化。
采用“App+网页端”双端策略,App端主打趣味化、低门槛体验,内置百余种创意模板(如宠物跳舞、喷火特效),用户上传一张照片,即可一键生成高质量短视频;网页端则面向专业创作者,提供精细的参数调节功能,支持多主体运动控制、动态运镜及智能音效匹配,适用于短剧制作、广告创意等高阶需求。
PixVerse母公司北京爱诗科技近期完成近3亿元A2至A4轮融资,由蚂蚁集团、北京市人工智能产业投资基金、国科投资等机构投资,资金将主要用于技术研发、算力扩展及人才团队建设,加速产品功能迭代与市场覆盖。
目前,全球AI视频生成领域呈现多元化竞争态势。
Runway Gen-4以人物一致性见长,Higgsfield AI的DoP I2V-01模型强调专业运镜,Kling和Sora则在长视频生成上占优。
国内市场方面,快手的可灵AI、抖音的即梦AI及PixVerse形成头部竞争格局,其中可灵AI凭借VideoTetris框架,支持最长2分钟视频生成;即梦AI依托字节跳动生态实现“60秒生成5秒视频”的极速体验,而PixVerse在影视级创作领域具有优势。
技术的迭代永无止境,尽管V4.5模型在技术上取得进展,但仍面临复杂多人场景稳定性不足、长视频生成能力有限(当前最长8秒)等问题。
此外,AI视频生成的高算力需求(如Sora模型训练算力需求是GPT-4的4.5倍)也对企业的成本控制提出挑战。
PixVerse国内版“拍我AI”的发布,意味着AI视频生成技术在中国市场的进一步渗透。
V4.5模型的技术优化、双端产品策略及企业级生态构建,为用户提供了高效的创作工具。AI视频生成正成为数字内容产业的重要工具,其影响将重塑内容生产、传播与消费的全链条。
还没有评论,来说两句吧...