如何用AI画一部武侠漫画？画完后，我沉默了。

作者：中尚互联 • 更新时间：2024-04-08 •阅读 • 生成海报 ·平台稳定运行:

前两天给大家分享了我用AI制作的一篇漫画。

缘起是想趁春节假期，多练习和研究一下AI。

但如果只是漫无目的试玩几下工具，我觉得很快就会陷入无聊，无所适从，蜻蜓点水式就结束了。

所以我学习一样东西，会习惯先尽量设定一个目标或者成果物，在完成目标的过程中解决问题，这样会更投入，学习效果也更加综合。

然后我就冒出一个想法，这次试试把一部小说用AI做成漫画？

20年前的剧本

一开始曾想过用知名武侠小说练手，比如金庸、古龙的作品。

但我发现，他们的作品实在太深入身心，有巨多相关的影视、漫画，每一个情节的画面早已看过各种答案，导致先入为主了，描述的时候没有新的想象力，就好像在复述看过的电视剧情画面，没意思。

这时，我突然想起来，初中时的日记。

之前跟大家提到过，我那时候喜欢在日记本中写各种小说。

嚯，翻开一看，日记上的时间，竟然都过去整整20年了。

虽然当时写的非常幼稚拙劣，但毕竟是那个年纪的珍贵纪念。何不试试将自己20年前日记中写的文字，绘制成漫画版，纪念一下青春呢？

有点意思，就这么定了！

用AI做漫画，这个题材不新鲜。

很早就看到有这样的案例了，甚至还有了单独的工具应用。

但体验了一下，距离自己脑海中的那个画面，差距还是比较大。

所以我准备还是把整个小说拆成一段段的场景，然后用充分的提示词描述每一个场景中想要的画面、角色、角度、情绪，单独生成每一个镜头，做细一点，这样练的也深入一些。

GPT拍片

然后，我就打开GPT。

一开始也还没感觉，就尝试性地把这篇小说开篇的第一句话，输入到GPT中，收到了返回的第一幅图，也是这次作品的第一页开篇图。

这个结果，小小惊艳了一下我。

因为我的提示词其实写的蛮模糊的，但生成的这画面、质感，确实真不赖啊。

也让我对下来的制作，充满了期待。

结果，第二张图就翻车了。

这，明显就不是一个剧情线……

于是，只好开始逐步加提示词，把主线拉回来。

就这样，每加一点，就更好了一点。

后来我找到的一个写法就是，先描述小说中的场景，然后在场景后面加很多细节的「要求」，不断尝试。

甚至有的场景我加了七八个「要求」，就是为了尽量让画面接近理想中的样子。

不然，真的永远不知道可能在哪里会出现意料之外的结果。

比如你没描述蓝袍人的发型，主角突然就秃顶了……

（黑衣客：就挺秃然的……）

比如，你不小心用了比喻性的描述，像这个「滴着滚烫的血」，他就直接让血着火……

（霆锋，是你吗？）

比如，青石背后的妇人孩子，第一眼看这个图，我觉得还蛮精致，仔细一看，卧槽，这孩子怎么好像穿着羽绒服……

（观众：漫画也TM开始做植入广告了！）

比如，只描述说让人物把刀举起来，没具体说举到那个位置，他就敢直接举到脖子上……刚出场就自己抹了脖子……

（大侠：反正我有主角光环）

比如，我描述雪地中的三个大佬，为首一人有「魁梧」的身材，嗯，这真的很魁梧……

（掰掰，您是天津来的嘛？）

……

所以，如果你脑海中已经有画面了，就尽量把这个场景描述细致一些，尽量不用比喻，用直白的语言，越细越好，不然可能就会收到惊吓。

不过，有时候如果你也没想好怎么用一个画面去呈现，也不用逼迫自己，先用泛化的描述去生成，然后再优化，也有收到「惊喜」的时候。

因为生成的结果，很有可能会给你带来灵感，启发你怎么优化提示词。

比如要描述蓝袍人与黑袍军的大混战，画面怎么呈现，我也没想好。

但GPT生成的这个，我觉得表现方式就很可以。

（GPT：都是导演教的好）

同时，有些GPT的限制，也是意料之外的。

比如当我描述一些打斗、血相关的词语时，经常收到的都是「无法满足」。

但我这做的是武侠小说啊，不打架不流血还怎么快意恩仇……

所以就导致我换着法儿从侧面换词描述，比如，打斗的很多描述不行，换成「切磋」就可以……

一些血腥的场景不能描述，我只好用「黑色的液体」来描述（幸亏我画的是黑白漫画）……

此刻，我突然就共情了那些拍了电影但是过不了审核，然后只能硬改台词的导演……

不过，我感觉这个规律我还没有完全摸清。

因为有时候一个描述给到的提示说不能生成，有时候在另一个描述中又可以生成。只能根据实际情况灵活应对。

总而言之，你也不知道加哪个词会有效，就是不断测试，哪些提示词无效，就直接抛弃，哪些提示词有效，就继续沿用，逐渐经验就越来越多。

就这样，试着试着，

逐渐就把所有的场景都拍完了。

从生成的结果来看，有个感受，就是不论怎么换提示词去做限定，生成的武侠人物、场景，日式元素无法完全避免。

猜测可能是因为从AI学习的语料来说，日本的漫画数据基数量很大导致的。

演员

说到这里，就有一个大家非常关心的问题：

如何确保连续生成的图中，某一个人物角色能一直延续不变？

这是在作品发出后，各种留言私信问到最多的问题。

就像看电视剧，一个镜头换一个演员，当然就跳戏。

我用的是ChatGPT，所以首先必须得承认，GPT目前很难做到保持绝对的统一性。要真说统一性上，估计Stable Diffusion更好。

本次实操中我用的是ChatGPT，在一致性和延续性上，我主要有3个做法。

第一，换角度。

首先，设定人物的特征，比如着装、发型、胡须，让读者从这些特征识别，用这些细节描述让生成的人物尽量接近，同时多尝试几个动作的角度，比如侧脸、背影、俯拍。

就像导演让一个演员换不同的表演方式、以及摄影多拍几个不同的角度，找到效果最好（或者应该叫「最像」）的那一条。

俗称「咱们再保一条」……

比如那个大战之后跪坐在地上的场景，在秦导的连续「保一条」的要求下，蓝袍人足足换了20多种花式跪法，每次都要换不同的情绪、姿势和角度。

蓝袍人，也是老戏骨了。

（蓝袍人：真服了你个老6……）

第二，做裁剪。

我的很多裁剪，都是为了防止「穿帮」。

比如这一张蓝袍人追黑衣客的镜头，其实GPT生成的画面是可以的，但是生成的这个结果中，其实有个BUG：生成的黑衣客，没有帽子了。

如果直接用的话，与其他几个画面就连不上了，会跳戏。这个时候最简单的办法就是直接裁掉，形成一个追逐戏的特写。

第三，借助gen_id。

后来就这个问题，跟好友阿机讨论交流，他分享了一个国外博主的教程。

我先把原博放上来：

简单总结其原理，就是生成的每一张图都有一个gen_id，在首次设定的时候，就要求GPT每生成一张图，都要公布图片的gen_id，然后在后续生成系列图的时候，用gen_id让GPT严格追着某一张图继续往下生成。

我测试了一下，确实有一定效果。

比如你看以下这两张图，就是要求GPT用同一个gen_id，但是设定了不同的动作，生成的两张图中人物是不是延续性还可以？

但做测试的时候，还是会出现不稳定的情况，这个后续我再继续研究，有新经验再给大家分享。

PPT剪辑

其实，最初我的想法比较简单，就是给小说情节的每一段话，配一张图。

但是做到后面，感觉这样的呈现方式，没有起伏变化，没有节奏感，没有力量。

所以还是要有漫画书中那种分镜，增强画面的连贯和视觉动感。

虽然画漫画这个领域，我是个纯外行，但没吃过猪肉还没见过猪跑么……

所以我就靠我过去看过的漫画的一点直觉，对画面进行了镜头切分，拿不准的时候就从书架上翻翻漫画找找灵感。

拼接工具，用的是PPT。

为什么用PPT？

纯粹是操作上习惯了，直接用裁剪为形状对图片进行裁剪和拼接，用文本框加文字也灵活。

在拼分镜的时候，为了画面的连贯性，再思考中间要补什么镜头。

这个时候就非常准确地知道所需画面了，可以再去GPT继续生成即可。

比如，这一页中，原本我初步设想的画面，是只生成了❶黑衣客转身、❷蓝袍人追黑衣客、❺黑衣客拔剑准备进攻妇人，这样三个镜头。

但是直接❶❷❺这样连的话，画面跳跃太大，不连贯。而且画面中一直都是人物的正面，视觉语言上比较单调。

所以我又去新生成了两个画面，也就是❸蓝袍人追黑衣客时两人的背影特写、❹黑衣人即将抵达青石时的侧面特写。

这样连起来之后，视觉连贯性和镜头切换带来的丰富性，都好了很多，转场就不那么跳脱了。

然后部分画面加了特效，原理也很简单，也都是用PPT基础功能。

比如这一个蓝袍人的动感特写，就是加了一层渐变蒙版色块和效果线的素材。

然后漫画中字效的添加，其实一开始也是用PPT加的形状和字体。但是最后的效果总觉得差点意思，还是没忍住另存图片，用PS加了一道径向模糊。比如这个：

就这样，经过一番操作，

第一篇终于完成，共24P。

成片

前天推送的时候，导出成图片，上传小绿书，发现只能上传20张图。

这24P是连贯的，又不能删减，所以只好将其中个别几张做了拼接，影响了部分一些画面的观感。

可以再来这里复习一遍：

后记

可能有朋友看到这里，会有点失望。以为我有什么大招，可以用AI一键将一部小说生成一本漫画。

但看了我以上的分享，好像完全不是这么回事，还是有不少琐碎的细节。

就目前而言，AI固然高效，但可控性还不够，当前主要还是用在DEMO、概念、分镜等环节。未来AI肯定还会进化，那就让子弹先飞一会。

这两天看到Sora可以将文字生成长视频的消息，或许这次尝试了绘制武侠漫画，下次，就可以再试试做成武侠电影了吧。

虽然铺天盖地的新闻中，关于AI的发展，似乎让人很焦虑，但是我跟很多朋友都认为，AI的发展，其实对有想法、有创意、有积累、工作流更全面的人，是更利好的。

原先需要多个工序一起通力合作才能完成的成果，比如一条创意广告，你只有好创意不行，你得找美术帮你画，你得找文案帮你写，你得找摄影团队帮你拍，最终这个创意才有机会实现出来。

现在AI的出现，给出了另一种可能，就是你创意和想法足够好，想的足够全，那么，执行部分没有那么高的门槛了，你不用花很多时间去反复给其他人讲解你的思路，不用为了修改打磨而去解决别人的情绪问题，效率自然会提高。

20年前，我在初中的课堂上，在日记本上悄悄写的小说，有一天用这样的方式重逢，把脑海中那些画面都逐一呈现了出来，有意思。

这次一开始其实只是想练习AI，但是逐渐就进入到了创作的心流状态，经常不小心就搞到了半夜两三点，完全忘了时间。

在这个过程中，感觉真的跟这些角色在一起拍一部戏，即将完工的时候，甚至感觉跟这些角色都有感情了，就像一群老朋友。

完成制作时，甚至有点不舍，沉默许久。

那一刻，我脑海中有一个「杀青」的画面。

然后我打开GPT，输入文字，生成了最后一张图：

以上就是本次的分享，足足4000字的复盘，希望能给你带来一些启发。

专注于分享个人副业赚钱项目，提供详细教程软件工具素材资源等，让每个人找到最适合自己的副业项目。

本文由东尚互联发布，转载联系作者并注明出处：https://www.9m9n.xyz/xiangmu/1211.html

如何利用剪映app把一张静态照片制作成动态短视频？（方法+全

« 上一篇

一天搞几千的点歌台项目

下一篇 »

联系我们

在线咨询：

微信号：airzwk

工作日：9:30-18:30，节假日休息