前两天给大家分享了我用AI制作的一篇漫画。
缘起是想趁春节假期,多练习和研究一下AI。
但如果只是漫无目的试玩几下工具,我觉得很快就会陷入无聊,无所适从,蜻蜓点水式就结束了。
所以我学习一样东西,会习惯先尽量设定一个目标或者成果物,在完成目标的过程中解决问题,这样会更投入,学习效果也更加综合。
然后我就冒出一个想法,这次试试把一部小说用AI做成漫画?

20年前的剧本
一开始曾想过用知名武侠小说练手,比如金庸、古龙的作品。
但我发现,他们的作品实在太深入身心,有巨多相关的影视、漫画,每一个情节的画面早已看过各种答案,导致先入为主了,描述的时候没有新的想象力,就好像在复述看过的电视剧情画面,没意思。
这时,我突然想起来,初中时的日记。
之前跟大家提到过,我那时候喜欢在日记本中写各种小说。
嚯,翻开一看,日记上的时间,竟然都过去整整20年了。
虽然当时写的非常幼稚拙劣,但毕竟是那个年纪的珍贵纪念。何不试试将自己20年前日记中写的文字,绘制成漫画版,纪念一下青春呢?
有点意思,就这么定了!
用AI做漫画,这个题材不新鲜。
很早就看到有这样的案例了,甚至还有了单独的工具应用。
但体验了一下,距离自己脑海中的那个画面,差距还是比较大。
所以我准备还是把整个小说拆成一段段的场景,然后用充分的提示词描述每一个场景中想要的画面、角色、角度、情绪,单独生成每一个镜头,做细一点,这样练的也深入一些。

GPT拍片
然后,我就打开GPT。
一开始也还没感觉,就尝试性地把这篇小说开篇的第一句话,输入到GPT中,收到了返回的第一幅图,也是这次作品的第一页开篇图。

这个结果,小小惊艳了一下我。
因为我的提示词其实写的蛮模糊的,但生成的这画面、质感,确实真不赖啊。
也让我对下来的制作,充满了期待。
结果,第二张图就翻车了。
这,明显就不是一个剧情线……
于是,只好开始逐步加提示词,把主线拉回来。
就这样,每加一点,就更好了一点。
后来我找到的一个写法就是,先描述小说中的场景,然后在场景后面加很多细节的「要求」,不断尝试。
甚至有的场景我加了七八个「要求」,就是为了尽量让画面接近理想中的样子。
不然,真的永远不知道可能在哪里会出现意料之外的结果。
比如你没描述蓝袍人的发型,主角突然就秃顶了……
(黑衣客:就挺秃然的……)
比如,你不小心用了比喻性的描述,像这个「滴着滚烫的血」,他就直接让血着火……
(霆锋,是你吗?)
比如,青石背后的妇人孩子,第一眼看这个图,我觉得还蛮精致,仔细一看,卧槽,这孩子怎么好像穿着羽绒服……
(观众:漫画也TM开始做植入广告了!)
比如,只描述说让人物把刀举起来,没具体说举到那个位置,他就敢直接举到脖子上……刚出场就自己抹了脖子……
(大侠:反正我有主角光环)
比如,我描述雪地中的三个大佬,为首一人有「魁梧」的身材,嗯,这真的很魁梧……
(掰掰,您是天津来的嘛?)
……
所以,如果你脑海中已经有画面了,就尽量把这个场景描述细致一些,尽量不用比喻,用直白的语言,越细越好,不然可能就会收到惊吓。
不过,有时候如果你也没想好怎么用一个画面去呈现,也不用逼迫自己,先用泛化的描述去生成,然后再优化,也有收到「惊喜」的时候。
因为生成的结果,很有可能会给你带来灵感,启发你怎么优化提示词。
比如要描述蓝袍人与黑袍军的大混战,画面怎么呈现,我也没想好。
但GPT生成的这个,我觉得表现方式就很可以。
(GPT:都是导演教的好)
同时,有些GPT的限制,也是意料之外的。
比如当我描述一些打斗、血相关的词语时,经常收到的都是「无法满足」。
但我这做的是武侠小说啊,不打架不流血还怎么快意恩仇……
所以就导致我换着法儿从侧面换词描述,比如,打斗的很多描述不行,换成「切磋」就可以……
一些血腥的场景不能描述,我只好用「黑色的液体」来描述(幸亏我画的是黑白漫画)……
此刻,我突然就共情了那些拍了电影但是过不了审核,然后只能硬改台词的导演……
不过,我感觉这个规律我还没有完全摸清。
因为有时候一个描述给到的提示说不能生成,有时候在另一个描述中又可以生成。只能根据实际情况灵活应对。
总而言之,你也不知道加哪个词会有效,就是不断测试,哪些提示词无效,就直接抛弃,哪些提示词有效,就继续沿用,逐渐经验就越来越多。
就这样,试着试着,
逐渐就把所有的场景都拍完了。
从生成的结果来看,有个感受,就是不论怎么换提示词去做限定,生成的武侠人物、场景,日式元素无法完全避免。
猜测可能是因为从AI学习的语料来说,日本的漫画数据基数量很大导致的。
演员
说到这里,就有一个大家非常关心的问题:
如何确保连续生成的图中,某一个人物角色能一直延续不变?
这是在作品发出后,各种留言私信问到最多的问题。


就像看电视剧,一个镜头换一个演员,当然就跳戏。
我用的是ChatGPT,所以首先必须得承认,GPT目前很难做到保持绝对的统一性。要真说统一性上,估计Stable Diffusion更好。
本次实操中我用的是ChatGPT,在一致性和延续性上,我主要有3个做法。
第一,换角度。
首先,设定人物的特征,比如着装、发型、胡须,让读者从这些特征识别,用这些细节描述让生成的人物尽量接近,同时多尝试几个动作的角度,比如侧脸、背影、俯拍。
就像导演让一个演员换不同的表演方式、以及摄影多拍几个不同的角度,找到效果最好(或者应该叫「最像」)的那一条。
俗称「咱们再保一条」……
比如那个大战之后跪坐在地上的场景,在秦导的连续「保一条」的要求下,蓝袍人足足换了20多种花式跪法,每次都要换不同的情绪、姿势和角度。
蓝袍人,也是老戏骨了。
(蓝袍人:真服了你个老6……)
第二,做裁剪。
我的很多裁剪,都是为了防止「穿帮」。
比如这一张蓝袍人追黑衣客的镜头,其实GPT生成的画面是可以的,但是生成的这个结果中,其实有个BUG:生成的黑衣客,没有帽子了。
如果直接用的话,与其他几个画面就连不上了,会跳戏。这个时候最简单的办法就是直接裁掉,形成一个追逐戏的特写。
第三,借助gen_id。
后来就这个问题,跟好友阿机讨论交流,他分享了一个国外博主的教程。
我先把原博放上来:
简单总结其原理,就是生成的每一张图都有一个gen_id,在首次设定的时候,就要求GPT每生成一张图,都要公布图片的gen_id,然后在后续生成系列图的时候,用gen_id让GPT严格追着某一张图继续往下生成。
我测试了一下,确实有一定效果。
比如你看以下这两张图,就是要求GPT用同一个gen_id,但是设定了不同的动作,生成的两张图中人物是不是延续性还可以?


但做测试的时候,还是会出现不稳定的情况,这个后续我再继续研究,有新经验再给大家分享。
PPT剪辑
其实,最初我的想法比较简单,就是给小说情节的每一段话,配一张图。
但是做到后面,感觉这样的呈现方式,没有起伏变化,没有节奏感,没有力量。
所以还是要有漫画书中那种分镜,增强画面的连贯和视觉动感。
虽然画漫画这个领域,我是个纯外行,但没吃过猪肉还没见过猪跑么……
所以我就靠我过去看过的漫画的一点直觉,对画面进行了镜头切分,拿不准的时候就从书架上翻翻漫画找找灵感。
拼接工具,用的是PPT。
为什么用PPT?
纯粹是操作上习惯了,直接用裁剪为形状对图片进行裁剪和拼接,用文本框加文字也灵活。
在拼分镜的时候,为了画面的连贯性,再思考中间要补什么镜头。
这个时候就非常准确地知道所需画面了,可以再去GPT继续生成即可。
比如,这一页中,原本我初步设想的画面,是只生成了❶黑衣客转身、❷蓝袍人追黑衣客、❺黑衣客拔剑准备进攻妇人,这样三个镜头。
但是直接❶❷❺这样连的话,画面跳跃太大,不连贯。而且画面中一直都是人物的正面,视觉语言上比较单调。
所以我又去新生成了两个画面,也就是❸蓝袍人追黑衣客时两人的背影特写、❹黑衣人即将抵达青石时的侧面特写。
这样连起来之后,视觉连贯性和镜头切换带来的丰富性,都好了很多,转场就不那么跳脱了。
然后部分画面加了特效,原理也很简单,也都是用PPT基础功能。
比如这一个蓝袍人的动感特写,就是加了一层渐变蒙版色块和效果线的素材。
然后漫画中字效的添加,其实一开始也是用PPT加的形状和字体。但是最后的效果总觉得差点意思,还是没忍住另存图片,用PS加了一道径向模糊。比如这个:
就这样,经过一番操作,
第一篇终于完成,共24P。
成片
前天推送的时候,导出成图片,上传小绿书,发现只能上传20张图。
这24P是连贯的,又不能删减,所以只好将其中个别几张做了拼接,影响了部分一些画面的观感。
可以再来这里复习一遍:
后记
可能有朋友看到这里,会有点失望。以为我有什么大招,可以用AI一键将一部小说生成一本漫画。
但看了我以上的分享,好像完全不是这么回事,还是有不少琐碎的细节。
就目前而言,AI固然高效,但可控性还不够,当前主要还是用在DEMO、概念、分镜等环节。未来AI肯定还会进化,那就让子弹先飞一会。
这两天看到Sora可以将文字生成长视频的消息,或许这次尝试了绘制武侠漫画,下次,就可以再试试做成武侠电影了吧。
虽然铺天盖地的新闻中,关于AI的发展,似乎让人很焦虑,但是我跟很多朋友都认为,AI的发展,其实对有想法、有创意、有积累、工作流更全面的人,是更利好的。

原先需要多个工序一起通力合作才能完成的成果,比如一条创意广告,你只有好创意不行,你得找美术帮你画,你得找文案帮你写,你得找摄影团队帮你拍,最终这个创意才有机会实现出来。
现在AI的出现,给出了另一种可能,就是你创意和想法足够好,想的足够全,那么,执行部分没有那么高的门槛了,你不用花很多时间去反复给其他人讲解你的思路,不用为了修改打磨而去解决别人的情绪问题,效率自然会提高。
20年前,我在初中的课堂上,在日记本上悄悄写的小说,有一天用这样的方式重逢,把脑海中那些画面都逐一呈现了出来,有意思。
这次一开始其实只是想练习AI,但是逐渐就进入到了创作的心流状态,经常不小心就搞到了半夜两三点,完全忘了时间。
在这个过程中,感觉真的跟这些角色在一起拍一部戏,即将完工的时候,甚至感觉跟这些角色都有感情了,就像一群老朋友。
完成制作时,甚至有点不舍,沉默许久。
那一刻,我脑海中有一个「杀青」的画面。
然后我打开GPT,输入文字,生成了最后一张图:

专注于分享个人副业赚钱项目,提供详细教程软件工具素材资源等,让每个人找到最适合自己的副业项目。

本文由东尚互联发布,转载联系作者并注明出处:https://www.9m9n.xyz/xiangmu/1211.html