출처: https://qiita.com/john-rocky/items/08bfffb1d0ca2a5f3637
화제의 이미지 생성 AI StableDiffusion 이지만, 자주 SNS로 보는 것 같은 고화질 고품질 리얼리스틱한 인물 화상을 생성하기에는 그만한 요령이 필요하다.
이 글에서는 어떤 단어를 사용하여 고품질의 이미지를 생성할 수 있는지 예를 소개한다.
StableDiffusion을 사용해 보려면 WebUI가 유용하다. 아래 링크에서 사용법을 알 수 있다.
https://github.com/AUTOMATIC1111/stable-diffusion-webui
예를 들어 소녀의 이미지를 원한다고 가정한다.
단지 "girl"을 입력하면 아래와 같은 이미지가 나온다.
나쁘지는 않지만 조금 CG 같다. 좀 더 사진 같은 이미지를 원한다다.
girl
그런데, 여기서 아래와 같이 "best quality" 나 "high resolusion" 등 고화질을 연상시키는 단어를 싫어할 정도로 넣는다.
조금 놀랄지도 모르지만
쉼표로 구분하여 이렇게 많은 단어를 넣는 것이 우선 한 가지 요령이다.
girl,RAW photo, best quality,realistic, photo-realistic, best quality ,masterpiece,an extremely delicate and beautiful, extremely detailed,2k wallpaper, Amazing, finely detail, 8k wallpaper,huge filesize , ultra-detailed, highres, extremely detailed,realistic, 8K, Ultra-High Definition, highest quality, ultra high resolution, (realistic:1.4), High quality texture,
그러면 위와 같이 선명하고 사실적인 이미지가 생성된다.
하지만 여전히 조금 그림처럼 보인다.
이미지에 포함하지 않으려는 단어를 넣는다.
이번에는 그림 같은 느낌을 지워서 사진에 가깝게 하고 싶기 때문에 그림을 연상시키는 단어를 부정적인 프롬프트에 넣는다.negative
EasyNegative, paintings, sketches, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, ((monochrome)),
이제 꽤 사진에 가까워진다. 이 부정적인 프롬프트가 매우 중요하다.
(extremely detailed eyes and face)
고품질의 역의 의미를 나타내는 단어를 네거티브로 넣고 안 되도록 한다.negative
worst quality, low quality, normal quality, jpegartifacts, signature, watermark, blurry, cropped, poorly draw, poorly draw, worst quality, low quality, lowres,
아래와 같은 형태로 하면 강조하고 싶은 단어에 가중치를 붙일 수 있다.
(detailed clothes:1.2)