Fashion
谷歌的生成图像 AI 进行了升级
谷歌正在升级其图像生成技术,以与竞争对手保持同步。
在周二的谷歌 I/O 开发者大会上,谷歌宣布了 Imagen 3,这是该科技巨头 Imagen 生成式 AI 模型系列的最新产品。
DeepMind 的 CEO Demis Hassabis 表示,Imagen 3 与其前身 Imagen 2 相比,在准确理解转换为图像的文本提示方面更出色,生成的图像更“富有创意和细节”。此外,他说该模型产生的“干扰性人工痕迹”和错误更少。
“这也是我们迄今为止用于呈现文本的最佳模型,对于图像生成模型来说一直是一个挑战,”Hassabis 补充道。
为了缓解人们对潜在创造深度伪造视频的担忧,谷歌表示 Imagen 3 将使用由 DeepMind 开发的 SynthID 方法,为媒体应用不可见的加密水印。
Imagen 3 的私人预览注册可以在谷歌的 ImageFX 工具中进行,谷歌表示该模型将“即将”面向使用 Vertex AI 的开发者和企业客户,后者是谷歌的企业生成式 AI 开发平台。
通常谷歌不会透露其用于训练 AI 模型的数据来源 — 这次也不例外。这样做是有原因的。其中很多训练数据来自于网络上的公共站点,存储库和数据集。而其中一些训练数据,特别是未经内容创作者许可擅自抓取的受版权保护的数据,是知识产权相关诉讼的来源。
谷歌的网络发布者控件允许站长阻止公司从其网站上抓取数据,包括照片和视频。但谷歌并没有提供“选择退出”的工具,并且 — 与一些竞争对手不同 — 该公司没有承诺对权利持有人进行补偿,因为他们(在某些情况下并不知情)为训练数据集做出贡献。
缺乏透明度并不令人意外。但从像谷歌这样拥有资源的公司而言,这是令人失望的。
我们即将推出一个 AI 通讯!在此注册,即可从 6 月 5 日开始收到。