1 月 4 日消息,科技媒体 The Decoder 昨日(1 月 3 日)发布博文,报道称谷歌 DeepMind 联合哥伦比亚大学、加州大学圣地亚哥分校的研究人员,开发了一款名为 CAT4D 的 AI 系统,可以将普通视频转化为动态 3D 场景,降低了 3D 内容创作的门槛,为多个行业带来了新的可能性。CAT4D 系统利用扩散模型,将单视角拍摄的视频转换为多视角视图,并将其构建成动态 3D 场景,用户可以从不同角度观看视频中的主体,如同置身其中。IT之家附上演示图如下: 以往,实现类似效果需要多台摄像机同时录制同一场景,而 CAT4D 则简化了这一流程,只需普通视频素材即可,这项技术有望革新游戏开发、电影制作和增强现实等领域。在训练 AI 过程中,谷歌 DeepMind 团队发现没有太多现有数据,为了解决这个问题,团队混合真实世界的镜头与计算机生成的内容,训练数据包括静态场景的多视图图像、单视角视频和合成 4D 数据,通过
谷歌 DeepMind 推CAT4D:AI魔法突破次元壁,普通视频活变3D大片
2025-01-04 00:00:00来源: 砍柴网
赞
你的鼓励是对作者的最大支持
- 全球首个:中国AI机器植入系统落地,精准操刀人工耳蜗手术2025-01-04 00:00:00
- 提供陪伴,缓解孤独,AI玩具来了2025-01-04 00:00:00
- 科技圈AI速递:昨夜今晨科技热点一览丨2025年1月4日2025-01-04 00:00:00
- AI改变华强北了吗?2025-01-03 00:00:00
- 《人类简史》作者正与AI进行“秘密交易”? 赫拉利“讲出”流利中文背后,是妥协还是突破?2025-01-03 00:00:00