“请给我一个五彩斑斓的黑”,只需一行命令就能让AI画画,OpenAI的Dall-E被大神复现
2025-06-21 13:25:38 小编:六六导航站
OpenAI今年1月公布的Dall-E可谓艳惊四座,只需输入一段话,就能根据内容输出一幅画。连吴恩达老师都不禁点赞。比如让它设计一个“像牛油果一样的座椅”。
但是,OpenAI只在官网设置了几种固定模板,代码也没有开源,用户无法用AI设计出更多的图片。不过现在有个好消息,一位华人小哥Philip Wang已经复现了一个PyTorch版Dall-E,叫做Deep Daze。他使用了OpenAI的CLIP以及斯坦福大学的Siren,可以在个人电脑上运行。只需输入在命令行中输入一段描述,这个AI就能画出各式图片。比如在绿色山丘上的薄雾(mist over green hills):
或者是“草地上的碎盘子”(shattered plates on the grass):
你觉得实际效果如何?开发该项目的Philip Wang,就是在今年年初公布要复现Dall-E的那位大神,没想到不到3个月的时间,这个项目已经如此强大,在GitHub上已收获1.1k星。
安装与使用Deep Daze可直接通过pip安装:pip install deep-daze安装完成后,输入以下命令运行。imagine TEXT 其中imagine是命令,TEXT必须是一段不超过77个字符的英文描述,为可选参数,可加可不加。如果我们想生成文章开始那张山中薄雾的图片,就输入以下命令:imagine mist over green hills中可加入的参数有:—deeper,获取更高的图像质量;—num-layers,指定网络的层数……更多用法可以去GitHub项目主页查询。如果担心AI的想象力过于天马行空,可以指定一张图片,让AI在此图像基础上想象。这样就能保证图像不至于太过离谱。具体的命令如下:imagine ‘description’ —start-image-path /path/to/picture.jpg假设我们给AI一张披萨的图片,让它想象“上面铺满青椒的样子”。
那么我们将上述命令中的描述改成“A pizza with green pepper”。
你以为这就是Deep Daze的全部?其实,它还有一个更强大的完全体——故事模式。只需设置—create_story=True,就可以解锁该模式,取消77个字符的限制,项目作者将美国诗人罗伯特·弗罗斯特的诗《雪夜林边歇马》输入其中,得到了一段mp4视频。
到这里我有点想让AI画一下“五彩斑斓的黑”,但贫穷限制了我的操作。因为使用Deep Daze必须要安装CUDA,而且最好在不小于8GB显存的GPU上,才能获得不错的效果。而我现在根本买不起英伟达显卡。项目地址: https://github.com/lucidrains/deep-daze
“
- 猜你喜欢
-
MusicTGA-HR提示指令
-
RappingAI提示指令
-
Boomy提示指令
-
TwoShot提示指令
-
Weet提示指令
-
Muzaic Studio提示指令
-
-
HookGen提示指令
-
DadaBots提示指令
- 相关AI应用
-
Playlistable提示指令
-
Riffusion提示指令
-
WZRD提示指令
-
-
Cyanite.ai提示指令
-
Piano Genie提示指令
-
Synthesizer V提示指令
-
Cosonify提示指令
-
Musico提示指令
- 推荐AI教程资讯
- “请给我一个五彩斑斓的黑”,只需一行命令就能让AI画画,OpenAI的Dall-E被大神复现
- 天文学家搞医术,Science也挡不住
- 如何安全地吃掉悬崖边上的苹果?DeepMind&OpenAI给出3D版安全强化学习答案
- 腾讯5年研发投入超2200亿元!云计算已成核心收入来源之一,“AI将成业务发展倍增器”
- 马斯克对微软获GPT-3独家授权表示不满
- NASA科学家联名求撤稿:金星有生命迹象是大乌龙,12阶多项式拟合不靠谱
- 又双叒一清华系团队入局大模型创业!蚂蚁领投,主打多模态
- 陶哲轩发文缅怀John Conway:他是所有数学家构成的凸包中的一个极值点
- 腾讯联合国家天文台启动探星计划,用AI寻找脉冲星线索
- 宇宙中第一批恒星存在被证实!中科院最新成果,数据来自韦布望远镜