您的位置首页二次元

二次元美少女捆绑二次元图库接口

来源：互联网
|
2023-05-14
|
0 条评论
|
T小字　 T大字

　　因而进一步的，能够经由过程“底图形式”去束缚人物的行动表达大概情节表达，再配上一样的人物特性枢纽词形貌，便能够输出该人物动漫剧情般的“性命周期”，她不再活在一幅图中

二次元美少女捆绑二次元图库接口

　　因而进一步的，能够经由过程“底图形式”去束缚人物的行动表达大概情节表达，再配上一样的人物特性枢纽词形貌，便能够输出该人物动漫剧情般的“性命周期”，她不再活在一幅图中。作甚“底图”掌握，以下所示：

　　在 outpainting 的加持下，不只可觉得一幅单调的图加有限的布景，更能够极大拓展 AI 艺术出图的尺寸，在 SD 生态普通出图为几百像素，远远不克不及满意大尺寸海报的需求，而 outpainting 手艺便能够极大扩大 AI 艺术原生出图的尺寸。一样关于二次元漫画，以至能够在一幅图中展示一切“参演职员”的形色百态。

　　AI 艺术更加间接的是一场新消耗变化，但以将来为结局，其势必是一场新手艺变化，这是自十多年前挪动互联网反动以来久违的一幕，闪开源生态扑灭的这星星之火燃遍新十年创业的每一个角落。与区块链引领的加密变化稍有差别，AIGC（AI 艺术所归属的大类）带给人们的镇静感其实不来自纯金融和财产预期（“多巴胺”），更多的是发自人类心里素质的对极新将来的盼望，那是一种真实的“内啡肽”。

　　除上述对主体的锻炼，Dreambooth 最常被用来“记着”画风，即锻炼 style。上述博主（“地球土著座一亿”）用了十张夏阿教师的画，经由过程 dreambooth “记着”了他的画风，结果比照以下。

　　当你输入一个模子中没有的观点，比方天生一个“Simon 的白天梦 up 主的照片”，由于 sd 模子没有见过我，天然不克不及天生我的照片。可是留意，实在 sd 模子中是具有天生我的照片的一切要素的的才能，究竟结果我只是一个一般的中国手艺宅，模子中该当有很多亚洲人的特性能够用于分解。那这时候候给出几张我的照片（坐标也能够经由过程编码图片得到），比照方才说的笔墨提醒，锻炼 textual inversion，实际上是报告模子“我是谁”，从而得到按照我的笔墨提醒得到一个更精确的坐标。因而二次元美少女绑缚，锻炼完后，我们会发明并没有天生新的模子 ckpt 文件，而是获得了一个几十 k 巨细的 .pt 文件，然后下次启动 stable diffuison webui 的时分就可以够挂载这个文件，当我下次再输入“Simon 的白天梦 up 主的照片”这段笔墨的时分，模子就会读取这个 .pt 文件里边的精确坐标，并和别的笔墨形貌包罗的坐标交融，然后天生更契合笔墨形貌的图片。

　　这就是所谓的穿插留意力掌握（Cross-Attention Control）手艺，连 StabilityAI 开创人也不由为这项手艺点赞：“在相似手艺协助下，你能够去缔造任何你胡想的事物。”

　　Textual Inversion 的劣势是轻量级、简朴上手。它能够对主体（object）停止锻炼，让 AI 记着这个“人”或“物”，也能够对画风（style）停止锻炼，好比能够记着某位活着艺术家的画风然后让 AI 以此画风来画任何事物；锻炼出的模子文件能够间接挂载到 SD 模子框架中，相似 Linux 开放时期不竭完美的静态毗连库，因而对 SD 也是友爱的。但优势是，结果较为粗拙，今朝还没有有能够进入贸易化产物结果的模子呈现，社区更多等待赐与了别的一项手艺——Dreambooth。

　　在搜刮引擎中搜刮本人想要的画面，便会显现契合主题的配图及其对应的 prompt。另有不间接给 prompt 搜刮，而是指导用户一步步构建 prompt 的提醒性东西——

　　如上图，可按照网站提醒，一步步构建出一幅“斑斓的面目面貌”。在这些东西的加持下，即使从未打仗过 AI 艺术的用户，在短短几天内也能逐步摸清构建 prompt 的精华。

　　不只需求形貌人物，更是要对人物的二次元细节停止描写，以至还要加一些有助于画质加强的辞汇，这一系列操纵被网友戏称为“咒语”，就像要进入一个二次元天下普通，起首你要学会“念咒”。幸亏社区力气是有限的，连续呈现了许多“宝典”，如《元素法典》元素法典——Novel AI 元素邪术全收录doc/DWHl3am5Zb05QbGVs和元素法典第二卷——Novel AI 元素邪术全收录/doc/DWEpNdERNbnBRZWNL，将二次元的“心法口诀”公诸于众，且全民共创，这很“二次元”。

　　此中提到了多种手艺，如操纵 inpainting 修正细节，用 outpainting 向外扩大，用 dreambooth 做动画配角，用 Deforum 不竭天生改动、用 coherence 停止持续性掌握、用 flowframe 补帧等等。更做二次元漫画一样，也是一项体系性工程。

　　手艺，永无尽头，则 AI 艺术，永无尽头。最初，以 StabilityAI 首席信息官 Daniel Jeffries 的一段话做完毕——

　　别的一项手艺 outpainting二次元美少女绑缚，被誉为“有限画布”，最早出如今 Dalle2 的贸易产物系统中，其时也是震动众人。简朴来说，将一张需求扩大的图上传给 AI，outpainting 便会在这张图的周围扩大出“有限的”画布，至于添补甚么内容，也完整交给用户本人输入的 prompt 决议，有限画布，有限设想空间。以下操纵 outpainting 为一幅典范名画添补了大批布景，发生了使人欣喜的结果。现在 SD 生态也具有了本人的 outpainting 手艺，开源地点——

　　社区也在操纵 Textual Inversion 为二次元模子丰硕其尚不克不及绘制的形象，好比许多国产动漫脚色，如秦时明月。只需有正当的数据集，手艺都是现成的，经由过程算力让人物形象在 AI 的天下“凝集”。

　　DreamFusion 有着较好的 3D 结果，也被 SD 生态嫁接到了 SD 完成中，开源地点——

　　再分享别的一个出名博主“大谷 Spitzer”利用 Textual Inversion 停止“分镜设想”的案例。我们在上面提到要做二次元漫画离不开牢固仆人公形象，所谓分镜设想即是可否用 AI 绘制出共同且边幅连结持续性的动漫脚色。大谷用 Textual Inversion + 便宜数据集锻炼了 6、7 种差别的边幅作为面部基因。以后在输入给 AI 的笔墨中，便可经由过程改动锻炼好的几个边幅 tag 的比例权重，交融出理想里不存在，同时在系列图片里长相能够连结分歧的脚色。以下两幅图即是差别比例权重下呈现的两位“仆人公”，而关于统一名仆人公，能够经由过程 AI 让其出如今林林总总的场景。好比“太空之声”里的女孩是统一个形象的差别故事表达，而“都会捕快”里的仆人公肤色更深、形象健硕，真的像一位捕快。

　　记着主体更大的意义是，能够对主体停止“属性修正”。好比当 AI 记着了输入的“小汽车”后，便能够为所欲为地对其色彩停止变动，而其他特性连结分歧。再回到二次元漫画谁人话题，这类精准属性掌握手艺也是其枢纽鞭策手艺之一。

　　除间接以图片停止反推外，另有一种东西如 Prompt Extend，能够一键加长 Prompt，能够将一个小白用户输入的“太阳”一键加长到带有丰硕艺术润饰的“大神级”形貌，东西地点——

　　固然上述都是基于如今 AI 模子的开展所提出的“让步”手腕，实践上我们在画二次元漫画时该当寻求绝对的仆人公分歧性（真恰是统一小我私家物）和更加精准的行动掌握、布景掌握以至数目掌握和心情掌握等等，而这些都需求借助更加先辈的手艺，即以下所要报告的模子锻炼和以穿插留意力为代表的精准掌握手艺。

　　说到了精准掌握，它不是某一项手艺二次元美少女绑缚，穿插留意力是其一，另有许多帮助性手腕为其效劳，最为盛行和贸易成熟的是 inpainting 和 outpainting 手艺。这是传统设想范畴的观点，AI 艺术也担当了过来。当前 SD 也推出了 inpainting 功用，可翻译为“涂抹”，即关于画面中分歧意的部门停止“涂抹”，然后 AI 会在涂抹区从头天生想要交换的内容，详细见下图操纵。

　　Dreambooth手艺最早来自谷歌论文，此为论文中的案例，一只理想小狗有限艺术分镜

　　跟着二次元模子的胜利盛行，人们也愈来愈盼望更多相似的模子呈现，以处理八门五花的创作需求二次元美少女绑缚。一其中间化的贸易平台便需求做出一个大而全的产物以逢迎用户需求，但面临指数级的市场增加，这明显是不睬想的。最好处理法子即是交给一个去中间化的自构造生态，像迸发二次元模子一样完成模子的“出现”，去处理人们日趋增加的创作需求。这便出格需求一种开放模子的力气，而 SD 在开源的地方便将这类力气完整交给了一切人，每一个人都能够去得到算法模子，都能够去锻炼本人的模子。因而，创作有限，模子出现！

　　在这个项目 demo 中，能够改动仆人公“小猫”的坐骑，能够给布景画一道彩虹，可让拥堵的路上变无暇阔。在以下相似的研讨项目中，还能够做到让仆人公竖大拇指、让两只鸟 kiss、让一个香蕉变两个。

　　能够经由过程文本形貌天生“在风声中吹口哨”、“警报器和嗡嗡作响的引擎靠近后走远”等特别声音结果。

　　二次元模子关于画特定形象的人物非常善于，好比在以下的持续出图中，我们大抵能够以为都是一个“仆人公”（称之为白小苏苏）在变 Pose 大概换装。由于我们赐与 AI 的形貌中对该人物停止了极其详尽的描写，就像牢固了她的基因普通，加上二次元模子自己关于人物的勾勒（平图）相对实在人物就“集约”一些，只需主要人物特性分歧，便能够鉴别为统一小我私家。

　　在给 AI 输入“一幅斑斓的花树画，作者 Chiho Aoshima，长镜头二次元图库接口，超理想主义”，就可以霎时获得一个长如许的花树视频，时长 13 秒。这个 text-to-3D 项目叫 dreamfields3D二次元图库接口，现已开源——

　　“2022 年，可称为被 Diffusion 开启的 AI Art 元年。接下来的三至五年内，AI Art 将会往愈加自在的标的目的开展，好比展示出更强的耦合性，可被用户定制的空间更大，也就是说更切近“客观创作”的历程，艺术作品中也会分化和表现出愈来愈详尽的用户设法。Google 近期上线的 DreamBooth AI 曾经展示出了这一特性。“

　　凭仗着对底层根底模子更加深度地改良，Dreambooth 也被称为“核弹级手艺”。同 textual inversion 一样，dreambooth 也能够锻炼主体、记着主体，好比输入几张本人的照片（家里的小狗），dreambooth 就会记着照片中的物体长甚么样，然后就可以把这个物体作为枢纽词套用到任何场景微风格中，“一键完成有限分镜”。

　　假如说 SD 为 AI 艺术翻开了第一扇窗户，那末明天这些五花八门、极具创意的“大千”模子则为 AI 艺术翻开了第一扇大门。特别在 Dreambooth 模子生态中，有可以完成迪士尼风的模子、有当下 MJ 生态最火的机甲风模子……

　　由本来做 AIGC 天生小说内容的贸易实体 Novel 推出，基于 SD 算法框架和 Danbooru 二次元图库数据集停止锻炼和优化，被外网称为“最强二次元天生模子”。撤除手部细节，NovelAI 的出图质量可谓上乘。最大的功绩来自 Danbooru，是一个二次元图片堆图网站，会标注画师名、原作、脚色，和像笔墨形貌一遍画面内容的具体 tag（能够会具体到脚色的发型发色、表面特性、打扮、姿式心情、包罗一些其他可辨认内容的水平），而这些对分散模子的锻炼尤其主要，省去了大批的野生挑选标注事情。Danbooru 的贸易定位也给了 NovelAI “无隙可乘”：按照搜刮成果内容量来看，这个网站是其他用户自觉保留（比方在推上有一些热度的绘画作品）并上传上去的，以是在日本不断有这个网站无受权转载的争议。关于此次 AI 进修素材库的工作，Danbooru方面也有做出回应：与包罗NovelAI 在内的 AI 作画网站没甚么干系，且不承认他们的举动。

　　给 AI 上传右边的“粗制图”，是为底图，底图卖力勾画画面的大致构造，但未对人物细节停止描写，随后由 AI 将人物特性细节停止“添补”，便会呈现统一仆人公摆出差别 Pose 的漫画剧情。

　　一样以二次元漫画这个最终寻求为例，当需求给女仆人公增长一名帅气的男士时，便能够在她中间地区停止涂抹，然后附上一段蛮横总裁的枢纽词 prompt，AI 便会给女主一段“姻缘”。

　　不管是轻量级的 Textual Inversion，仍是重量级的 Dreambooth，抑或介于两者之间的如 Hypernetwork（超收集模子）和 Aesthetic Gradient（审美梯度）等二次元图库接口，包罗更多的原生模子锻炼方法：模子交融、微调（Fine Tuning）等，都是现阶段输出愈加可贸易化新模子的利器。短短一个月工夫便曾经出现出了大批在观点考证阶段的垂直模子，花团锦簇。

　　开放模子的呈现赐与了降维处理统统困难的方法，真正完成了“缔造”二字。与此同时，也不克不及疏忽一些帮助手艺的开展二次元图库接口，仍是拿二次元漫画为例，我们难免要对一些更细节的绘制表示停止掌握。以下，我们期望保存汽车和树木布景，但改动在它上面的“仆人公”；大概将一幅理想照片停止漫画气势派头的变革，以做漫画叙事布景设想。

　　不管是【Imagic】仍是【Prompt-to-Prompt】，精准掌握手艺关于完成 AI 画图的自立可控非常主要二次元图库接口，也是构建二次元漫画系统比力主要的手艺意向之一，今朝尚处于行业研讨前沿。

　　出名博主“Simon 的白天梦“在微博分享了本人利用 SD 的 Textual Inversion 手艺锻炼的“黏菌卫星图”案例。起首需求筹办锻炼数据集，大要一万张卫星舆图；我们都晓得 SD 模子自己要末只能零丁出都会卫星图，要末只能出黏菌图；博主经由过程 Textual Inversion 再次锻炼以后，胜利地把都会卫星图肌理和黏菌的微观构造交融在了一同。

　　因为 dreambooth 会将锻炼对模子的影响锁定在某一种物体的种别内，以是锻炼的时分不只需求形貌的笔墨、对应图片，还需求报告模子你锻炼的物体的种别（锻炼完利用的时分，也要同时在 prompt 中包罗种别和 token 枢纽字），而且用锻炼前的模子师长教师成一系列这一品种物体的正则化图片（regularization image）用于后续和你给的图片做半监视锻炼。以是，天生正则化图片要耗损分外的图片（普通要 1K+，可是能够用他人天生好的）；锻炼的时分由于是调解全部模子（即使只是模子中的部门参数），对算力和工夫请求也比力高。我在当地一块 3090 上锻炼时显存占用到达 23.7G，锻炼 10K 张 10000epoch 需求 4 个半小时。—— Simon 的白天梦

　　以 NovelAI Diffusion、Waifu Diffusion、trinart 等为代表的二次元模子以其惊人的“平图”结果极大地拓展了 SD 模子和生态的设想空间二次元美少女绑缚，其近乎可贸易化的利用体验也开拓了“万物皆可垂直”的垂直模子先河，补偿了像 SD 这类大通用模子在个体美学范畴的“力有未逮”。固然在这个过程当中也是伴跟着诟病、质疑和鞭挞，但贸易与手艺该当一分为二去对待。

　　但从正面意义来看，NovelAI 确实也在手艺上给 SD 带来了新的空间，就连 StabilityAI 的老板 Emad 也在推特上宣扬到：“NovelAI 的手艺事情是对 SD 极大的提拔，包罗手指修复、随便分辩率等等。”敌手艺感爱好的能够看一看官方博客novelai-improvements-on-stable-diffusion-e10d38db82ac中对 SD 的改良事情，大抵是修正了 SD 模子架构及锻炼历程。

　　“我们要成立一个布满生机、活泼、智能内容划定规矩的天下，一个布满生机、你能够与之互动的数字天下，配合缔造的内容，那是你的。参加到这股大潮吧，你将不再只是在将来的收集上冲浪、被动地消耗内容。你将缔造它！“

　　图片滥觞：量子位《Text-to-3D！修建学小哥自称编程菜鸟，攒了个AI作画三维版，仍是彩色的》

　　（备注：夏阿是诞生于扬州二次元美少女绑缚，假寓于南京的 80 后插画师。因 2014 年常常在网上公布“穿越”“混搭”“搞笑”类的国画作品，深受网友喜欢而“走红”。）

　　因为当前最大的开源生态是以 SD 为导向，因而本文所议论的手艺意向皆来自于 SD 大生态。MJ 在算法素质上与 SD 同宗同源且大同小异，其枢纽为不竭退化的数据集和美学算法加强，等待 MJ 开源的那一日，与众人同享其普惠万物的力气。

　　AI 艺术从 AI 作图开端，也称之为 text-to-image，但时至昔日，艺术其实不范围于图片，AI 艺术也不范围于 AI 作图，更多的 text-to-X 开端预示着将来 AI 艺术的新形状。最为出名的有：

　　全部 AI 艺术最枢纽的是 prompt，特别关于新人用户，可否得到好的 prompt 是其可否得到优良出图的枢纽地点，因而许多产物化的 AI 东西城市在用户输入 prompt 这方面停止改良。除大批能够获得枢纽词的搜刮引擎网站外，逆向反推成了一项主要帮助手腕。所谓逆向反推，即给出一张图片，可所以实在天下的，也能够来自 AI 天生，逆向反推手艺便能够输出可以绘制该画面的 prompt。固然在实践结果中，没法反推出天生结果如出一辙的 prompt，但这赐与了许多新人用户获得带有庞大艺术润饰的 prompt 的路子。以下名为 guess 的逆向反推东西为一张图片反推出枢纽词，其开源地点——

　　另有如 3DiM, 能够从单张 2D 图片间接天生 3D 模子；英伟达开源 3D 模子天生东西，GET3D——

免责声明：本站所有信息均搜集自互联网，并不代表本站观点，本站不对其真实合法性负责。如有信息侵犯了您的权益，请告知，本站将立刻处理。联系QQ：1640731186