IT之家 9 月 24 日音问,火山引擎认真发布了豆包视频生成-PixelDance、豆包视频生成-Seaweed 两款大模子夜夜撸改为什么,面向企业市集开启邀测,这也意味着字节跨越认真宣告贫窭 AI 视频生成。IT之家注:新款豆包视频生成模子当今正在即梦 AI 内测版小领域测试。
该模子救济高效的 DiT 交融估量单位、全新想象的扩散模子现实圭臬和深度优化的 Transformer 结构,不错收场更充分地压缩编码视频与文本,救济一致性多镜头生成,大要大幅训导视频生成的泛化才气。
官方先容称,不管是语义和会才气,多个主体通顺的复杂交互画面,已经多镜头切换的本色一致性,豆包视频生成大模子均达到业界先进水平。
足交telegram火山引擎总裁谭待示意夜夜撸改为什么,“视频生成有许多难关亟待冲突。豆包两款模子会捏续演进,在处理重要问题上探索更多可能性,加快拓展 AI 视频的创作空间和哄骗落地。”
谭待示意,豆包视频生成大模子救济多立场多比例的一致性多镜头生成,可哄骗在电商营销、动画西席、城市文旅、微脚本等限制。
此外,谭待示意,豆包大模子发布以来使用量爆发式增长。戒指 9 月,豆包言语模子的日均 tokens 使用量卓越 1.3 万亿,比拟 5 月初度发布时猛增十倍,多模态数据处理量也分手达到每天 5000 万张图片和 85 万小时语音。
此前视频生成模子大多只可完成简单教唆,豆包视频生成模子则能收场当然连贯的多拍手脚与多主体复杂交互。有创作家在抢鲜体验豆包视频生成模子时发现,其生成的视频不仅大要衔命复杂教唆,让不同东说念主物完成多个手脚教唆的互动,东说念主物面目、服装细节甚而头饰在不同运镜下也保捏一致,接近实拍效能。
据火山引擎先容,豆包视频生成模子基于 DiT 架构,通过高效的 DiT 交融估量单位,让视频在大动态与运镜中开脱切换,领有变焦、环绕、平摇、缩放、筹算随从等多镜头言语才气。豆包视频生成模子具备专科级光影布局和颜色长入,画面视觉极具好意思感和信得过感。
深度优化的 Transformer 结构,则大幅训导了豆包视频生成的泛化才气,救济 3D 动画、2D 动画、国画、瑕瑜、厚涂等多种立场,适配电影、电视、电脑、手机等各式缔造的比例,不仅适用于电商营销、动画西席、城市文旅、微脚本等企业场景,也能为专科创作家和艺术家们提供创作扶植。
告白声明:文内含有的对外跳转集合(包括不限于超集合、二维码、口令等式样),用于传递更多信息,检朴甄选时辰,扫尾仅供参考夜夜撸改为什么,IT之家通盘著作均包含本声明。