※ 引述《clothg34569 (提拉)》之铭言:
: 搞乱Tagging对他伤害才真的大
: 这样在Trainging时 同一张金发的图片可能Tag会是金发或者褐发
: 那他就很难学说哪个才是真正的金发
: 结论 : 污染Tag比污染图片实际多了
: AI工程师大概有超过一半的时间是在和Data Cleaning奋斗...
污染 tag 也没有用, stable diffusion 的 tag 是用 CLIP ViT-L/14 图转文出来的
训练过程的图片并不需要带 tag
==
换句话说就是生图的时候用 Danbooru 上面的 tag 去下不一定有用
因为图转文模型对图片的“理解”并不是那些 tag
应该要拿你喜欢的图去喂 CLIP interrogator 看他会拆出什么文字才对
不想被训练/不想被看到的图很简单,不要贴出来,自己珍藏就好了 (ㄎ