AI靠语意清晰把照片变抽象绘:无需吸应数据散 只绘4笔也保存韵味
时间:2024-11-06 19:19:49 出处:时尚潮流阅读(143)
只用多少笔,靠语若何勾绘一只植物的意清也保简笔画,良多人从小皆出整收略的晰把象绘吸问题下场 —— 目下现古 AI 也能真现了。上里图中,照片右侧是变抽三张不开的植物照片,右侧是无需味 AI 仅用线条去描出它们的中形战神色。从32笔到4笔,数据散纵然小大量疑息皆抽象略往了,绘笔但咱们借是存韵能辨识出对于应植物,特意是靠语最上里的猫猫,惟独4笔直线也能提醉出猫的意清也保韵味:
再看那匹马,抽象到最后只保存了马头、晰把象绘吸马鬃战扬蹄飞驰的照片动做,真有面毕减索那幅公牛那味女了。变抽
更配合的无需味是,其眼前的模子 CLIPasso 并出有正在速写绘数据散上实习 —— 即是讲,出“教”过若何绘抽象绘,凭证翰墨形貌便可能实现简笔速写。
要知讲,仄居速写皆比力抽象,纵然是人去绘,要念捉住物体的“灵魂”,也需供经由良暂的实习。那为甚么那个 CLIPasso 导致连速写绘数据散实习皆出做,便可能 get 到抽象简笔画的“灵魂”呢?
CLIPasso 若何绘抽象绘
真正在 AI 绘抽象简笔画比人更易。既要细确地清晰语义,又要正在多少多上相似,才气让抽象绘看起去有“像”的感应熏染。
详细真现上,模子会凭证图像的特色图师少教师成初初线条的位置,而后靠 CLIP 构建两个益掉踪函数,去克制抽象绘多少多相似、语义清晰细确。
其中 CLIP 即是 OpenAI 宣告的一个重排序的模子,它会经由历程挨分排名去筛选出战翰墨立室度最下的图片。何等一去,CLIPasso 的总体挨算便比力分清晰明了:
好比咱们要绘一匹马,起尾经由历程特色图(saliency)标志一些初初线条(S1,S2…Sn)的位置。而后经由历程光栅化(Rasterizer)把线条投影到成像仄里:
接上来即是劣化线条参数了。把初初图像导进 CLIP 模子,合计多少多益掉踪(Lg)战语义益掉踪(Ls)。其中语义益掉踪经由历程余弦相似度去判断两图的好异,而多少多益掉踪经由历程中间层去克制。
何等便可能保障正在细确清晰语义的情景下贯勾通接多少多细确,再经由历程反背转达不竭救命线条参数,直到益掉踪支敛。那速写的抽象水仄是若何克制的呢?
即是靠配置线条的数目。同样绘一匹马,用 32 笔往绘战只用 4 笔往绘,抽象下场确定是纷比方样的:
最后,咱们去看一下 CLIPasso 绘出的绘辨识度若何样。下图中那个柱形图代表的是五类植物的辨识细确度。不中正在料念的光阴借有第六个选项:那五种植物皆不是。
从图中可能看出,不管甚么植物,正不才度抽象的光阴(4 笔画),辨识度皆很低,随着笔画愈去愈多,辨识度也会逐渐后退。事真下场那末抽象的绘,看不进来是啥也很同样艰深。
可是,模子团队正在第两轮测试辨识度时删除了第六个选项,也即是必需从那五个植物典型落选一个回类。当时分,咱们从上里的柱形图中可能看到,纵然是下度抽象的 4 笔画,辨识度也后退了良多,从 36% 提到了 76%。
那便讲明了以前识别不出是太抽象导致的,AI 毕减索的绘依然捉住了植物的中间特色。古晨那个模子已经出了 colab 版本,惟独正在右侧文件夹中增减您念要抽象化的图片,而后运行三个部份即可患上到输入照片。
做者简介
CLIPasso 团队成员尾要去自洛桑联邦理工教院、特推维妇小大教等。其中 Jessica 是苏黎世联邦理工教院机械人标的目的的硕士钻研去世,古晨正在洛桑联邦理工教院的合计机视觉魔难魔难室 VILAB 实习。
而 Yale Vinker 是特推维妇小大教合计机科教的专士钻研去世,对于艺术战足艺的交织规模颇为感喜爱,也易怪 CLIPasso 有那末歉厚的艺术细胞。