
最近两周徐可欣 拳交,“吉卜力画风”一霎就火了。 事情的运转是这么的,3月26日,OpenAI推出了基于GPT-4o大模子的高精度图像生告成能“4o Image Generation”,按照他们的说法,目下用户只需一句浮浅的笔墨形色,就能杀青紧密的告白或平面图的制作、行使界面的UI策画、LOGO或图片立场的切换等等。 收尾呢?悉数这个词互联网的东说念主,都在用它变身“赛博”。 不开打趣,小雷是真被这玩意给刷屏了,这两天一打开群聊,就能看到天高皇帝远的群友们在拿GPT-4o荒诞整活,有作念头像的,有作念神态包的,以至还有把“黄O正途东”形成吉卜力画风的,推特上的外洋网友玩得更是乐此不疲,看得我都有点心痒痒的。  (图源:X) 幸亏,近似的功能,国内大模子并不是莫得。 比如说字节卓著的SeedEdit,通常可以杀青“天然语意修图”,用户只需输入浮浅的天然谈话,便可对图像进行各样化剪辑操作。 最迫切的是,这功能可不需要你想方设法翻出去用,在字节卓著的豆包官网就径直能用,而况目下豆包的“图像生成”功能是齐备免费且不存在逼迫的,这一波以至能把开会员的钱也给径直省下来。 话不说多,咱们这边径直开整! 豆包这款家具,让东说念主东说念主都是宫崎骏 想体验这个功能的话,其实还蛮浮浅的等于了。 打开豆包网页版,在输入框底下就有「图片生成」,应该就能看到上传参考图的选项了,这里等于SeedEdit模子的进口。 fc2 巨乳要作念的事情很浮浅,上传图片,然后输入咱们想要转换的本色。  (图源:雷科技) 话未几说,先来看图。 领先,小雷这边采取了一张来自闻名音乐摄像带里的截图,让豆包和最近巨火的GPT-4o都试着“帮我换成吉卜力立场”。 这是原图:  (图源:Youtube) 这是豆包的制品:  (图源:豆包)徐可欣 拳交 这是GPT-4o的制品:  (图源:GPT) 对比下来,GPT-4o的一稔收复度更高,手部莫得变形,仅仅莫得保管原图比例;豆包天然举座构图、配色愈加逼近原图,关联词一稔有些微变化,手部有些变形,以至多了一只握着麦克风的手。 接着试一下公共都关注的名东说念主,比如说马斯克:  (图源:豆包) 譬如说乔布斯:  (图源:豆包) 再给乔布斯换个迪士尼立场:  (图源:豆包) 从收尾来看,豆包的调遣恶果可以说短长常锻真金不怕火。 临了,咱们试一试影视剧集里的名局面,此次就拿《和平使臣》内部约翰·塞纳扮演的克里斯多福·史姑娘的名局面作念例子:  (原图,图源:HBO Max)  (图源:豆包)  (图源:GPT) 此次差距其实愈加显明一些,GPT-4o以至把金属头盔保留了下来,身边的两名扮装也作念到了精确的画风转制,关联词图片比例有所修改,笔墨信息也莫得保留住来。 行为对比,豆包则是试图在整幅画面上进行对皆,干系词东说念主数一多起来,扮装的服装和形貌就没些许能对上的。 关联词,接着我就要说关联词了,豆包的恶果如故比Gemini 2.0要强上一大截的,谷歌这玩意天然扶植天然语意修图,关联词既不懂吉卜力立场是啥酷爱酷爱,也搞不明晰若何修改图片比例。  (图源:Gemini 2.0) 可恶的谷歌,不要给我看这一堆不知所谓的东西! 其实把念念路反过来,把画改成真正立场,豆包搞得也可以,我上传了一张刻在不少东说念主基因里的Meme图片,让它以此为原型,生成一张真正像片。  (图源:豆包) 嗯...只可说像是挺像的,等于没了那种冲击感。 若是再浮浅调治一下的话,就能作念出底下这种恶果:  (图源:豆包) 虽说脸型有点分歧,笑得亦然有点霸道,关联词这种冲破次元壁的作念法,还真就唯有AI大模子能够杀青。 豆包图片处分才气在线,但仍有较大考订空间 不外,东说念主东说念主都在用吉卜力画风,也带来了新一轮的版权问题。 毕竟早在2016年,宫崎骏评价AI动画本事时就直言:这是对人命自己的侮辱。 宫崎骏反对用本事代替手工创作,他觉得AI生成图像穷乏对人命力的敬畏,而在2025年的今天,本事力的进步,反而让公共对这件事情变得更堂堂皇皇了起来,如实是有点讪笑的。  (图源:Youtube) 既然如斯,咱们不妨调遣一下念念路,把它当成PS来用? 比如在策画行业里滚滚而至的梗,“让大象转个身”这种要求,咱们在豆包上能不成杀青呢?  谜底是“齐备可以,利害可以”。 可以看到,SeedEdit生成的大象后面短长常相宜逻辑的,耳朵的样子、脚部的位置、体魄的脸色都作念得荒谬可以,周围的环境也保持了高度的一致,很出丑出画面上有什么马虎。 不外近似海报的恶果,豆包就作念得不咋样了,和GPT-4o可以说一眼就能看出别离了。  (图源:豆包)  (图源:GPT) 只可说,豆包在审好意思这块,还真有挺多要学的方位。 临了,我也试了一下豆包臆造进行“图片生成”的恶果。 提醒词如下: 一位年青的印度女性,黑发扎着翻开的马尾辫,身穿玄色夹克,站在大学校园里,直视着镜头。该图像具有1990年代立场的电影静态好意思学,在阳光明媚的日子里拍下的特写肖像。  (图源:雷科技) 对比豆包,GPT-4o产出的图更有特写感;Midjourney V7产出的图片后光愈加天然,东说念主物脸部的肤色也相对愈加廓清,细节愈加丰富,画面焦点愈加廓清,但总的来说,三者都没啥肉眼可见的问题。 AI修图,爆发在即 不可否定,如今AI大模子在“绘画”上足以自食其力了。 关联词在图像剪辑限制,AI大模子依然是相对落伍的,无法进行精确剪辑一直是行业的老浩劫问题。 前些年,这类需求一般可以通过Stable Diffusion的ControlNet插件来杀青。 它可以赢得稀疏的输入图像,通过不同的预处分器调遣为逼迫图,进而行为Stable Diffusion扩散的稀疏条目,只需使用文本提醒词,就可以在保持图像主体特征的前提下放肆修改图像细节。  (图源:新浪微博,识别特征并进行再行绘图) 干系词土产货部署AI行使这事,和大部分小白是基本无缘的。 是以在插足本年后,包括GPT-4o、Gemini 2、Midjourney V7等先后上线了通过天然语意修图的功能。 个东说念主觉得,这种只需给定输入图像和告诉模子要作念什么的文本形色,然后模子就能遵照形色指示来剪辑图像的功能,以至可以被视为要紧突破,也曾被视为必备技巧的PS,如今似乎堕入了“可学可不学”的好意思妙处境。 天然了,目下这类模子在生成图少顷如故有一些问题存在的。 直到今天,豆包AI修图依然穷乏东说念主像前后的一致性,也穷乏图片本色的标的性,只须波及到东说念主物面部的修图,那么最终出来的图像和原图的各别会很夸张,豆包自己也很难判断你要修改的是图片里的哪个元素。  (图源:豆包) 倒是笔墨处分才气,相较以往有了一定晋升,目下SeedEdit在修图时也曾不会搪塞编造笔墨本色,关联词图片生成时的错字自得依然需要改善。 不管若何说,豆包SeedEdit算是弥补了国产大模子在语义AI修图行使这块的空缺。 可以料想的是,跟着AI图像剪辑本事的不休发展,改日手机、电脑都可能会集成这项功能,就像AI排斥、AI扩图那样走进寻常匹夫家。无论是小白如故大咖,每个东说念主都有契机减轻上手使用,让我方对好意思的相识可以更直不雅地展现出来。 修图有手就行?约略果真不是梦。
|