Open AI悄咪咪整了个大的,DALL·E 3发布了!相较于2代它有这些提升: ➜图像的生成质量有了非常大的提高,风格与Adobe Firefly类似。 ➜DALL·E 3可以准确地表示具有特定对象的场景以及它们之间的关系。 ➜在图像内以及手等人体细节中生成文本时,DALL·E 3 比 DALL·E 2 有了显着改进。 ➜DALL·E 3 是构建在GPT-3.5之上的,你不会写提示词不要紧,GPT-3.5会帮你优化你的提示,也可以通过对话来修改生成的图像。 ➜最后DALL·E 3将会在10月初向Plus用户和企业版用户提供,也会提供对应的API。
从图象质量和侧重点宣传点来看确实不像是要跟 Midjourney 或者 SDXL 进行竞争,更像是为了跟即将到来的谷歌多模态模型 DeepMind Gemini 做的准备,可以看作是 GPT4 即将开放多模态的前兆。