DALL·E3与Midjourney的AI绘画对决:谁将称霸地表?
9月21日,OpenAI发布了令人惊艳的DALL·E3,不仅在绘画能力上有了显著的提升,更让人惊讶的是,它居然能够“听懂”人类的语言。这一新功能的出现,无疑让DALL·E3在AI绘画领域的地位更加稳固,也引发了众多网友的热议和关注。
有网友迫不及待地晒出了用DALL·E3和Midjourney针对同一Prompt作画的结果对比。明显可以看出,DALL·E3在理解人类意图方面表现得更为出色,生成的图像也更准确、更符合人类的审美预期。这或许归功于OpenAI在这次更新中宣布的DALL·E3与ChatGPT的结合,使得DALL·E3能够更好地理解和执行人类的语言指令。
这一变化意味着,我们今后只要简单地向ChatGPT描述一下自己想要的图像,DALL·E3就能为我们生成一系列精美且风格各异的图片,无需再费心费力地调整和修改。这一强大功能的出现,无疑为AI绘画领域带来了新的突破。
然而,就在DALL·E3内测上线的消息传出后,网络上出现了各种关于Midjourney被“吊打”的言论。正当大家以为Midjourney会黯然失色时,它却带来了一个重磅消息:Midjourney将在今年内推出全新的V6版本,不仅会在图像生成的质量上有重大飞跃,还会增加社交功能。尽管今年我们可能无法看到Midjourney V6的3D和视频生成功能,但这已经足够引起人们的期待和好奇了。
当被问及如何看待OpenAI的DALL·E3时,Midjourney CEO David Holz的回应充满了信心和期待:“Midjourney将继续提供最高质量的图像。尽管这次比较中DALL·E3在图像质量方面并未遥遥领先,但它确实在遵循提示并呈现文本方面做得更好。”他的话无疑为Midjourney V6的推出增添了更多的期待和悬念。
虽然Midjourney V6还没有正式推出,但网上已经出现了各种关于版本更新内容的小道消息。无论是OpenAI的DALL·E3,还是Midjourney V6,它们都在不断地挑战和突破AI绘画的边界。这场地表最强作图AI的竞争,我们期待着谁能最终胜出。Midjourney决定从Discord环境中脱离出来,并着手打造一个独立网站。此外,他们还计划在自己的主页上集成一些用户友好的社交机制,以增加用户的互动性和参与感。
Midjourney团队也正在努力开发一款移动应用程序,以便吸引更多用户并扩大其影响力。据可靠消息,iOS用户可以在他们的设备上直接下载该应用程序,而Android用户则需要通过其他途径进行下载。对于那些喜欢在移动设备上浏览网页的用户,Midjourney网站也针对性地优化了网页版面,使其在移动设备上的显示效果更佳。
为了提高服务质量,Midjourney还将对自己的数据中心进行升级。这将使他们能够提供更快、更高效的服务,特别是在图像生成方面,速度的提升对于专业级和SVIP用户来说最为明显。然而,由于计算资源有限,该项升级可能无法立即对所有用户级别开放。
Midjourney还有一个新增的功能是“Turbo模式”,这个模式已经被所有级别的用户使用了。在Turbo模式下,性能比标准模式快四倍。用户可以通过添加命令–turbo或使用/turbo来激活Turbo模式。
许多网友预测,Midjourney V6将会有更多的新功能。其中最值得注意的是,Midjourney V6预计将能够生成分辨率为2048x2048的图像。这种分辨率的提高不仅能够增强图像内容的丰富性,而且还能实现以前无法完成的复杂设计和细节表现。
另一个被预测的功能是自然语言处理方面的提升。Midjourney V6预计将能够更好地理解用户的文本输入,从而与用户进行更准确、更详细的交流。这将进一步增强图像生成的准确性和丰富性。
此外,有传闻称Midjourney V6将具备视频生成功能,这将使静态图像无缝转换为动态和移动场景。视频将能够承载比图片更多的内容和情节,从而帮助创作者更好地表达自己的创意。
还有一个备受期待的功能是3D建模功能。虽然Midjourney在早期版本中对3D功能开发的延迟是由于缺乏3D物体的数据,但在未来的版本中,Midjourney可能会推出3D功能,这将使生成的图像更加立体化,几乎不存在质量损失。
最后,Midjourney也在开发一种新的微调控制功能,它能在不改变整个构图的情况下改变图像中的特定元素。这将为创作带来更大的灵活性,为创作者提供更多的调整空间,并将生成的图像推向新的高度。另外,更新的Midjourney V6有望在生成的图像中更准确地反映提示参数,这将使创作者对作品拥有更强的控制力。然而,关于拖放控制功能如DragGAN的传闻表明,这可能要等到Midjourney V7才能看到。