0. IT 기술 트렌드/>> MidJourney, Stable Diffusion

AI 창작 시대! 지금 당장 배워야할 Stable Diffusion Web UI 최신 설치 및 사용법 완벽 가이드

블록메타 2023. 1. 25. 17:59
조코딩 

이번 시간은 스테이블 디퓨전 웹 UI에 대한 완벽 가이드 부분을 준비했습니다. 

 

목차

 

1. Stable Diffusion Web UI 소개(배경/원리)

2. 환경별 세팅 방법(브라우저/윈도우/맥)

3. 메뉴 및 기능 소개

4. 실전 활용 방법 (txt2img, img2img, 의인화 등)

 

구독 좋아요 눌러주시고 끝까지 시청 부탁드립니다. 

 

1. Stable Diffusion Web UI 소개

처음 듣는 분도 있을 것 같아서 간단히 소개해 드리겠습니다. 

요즘 이렇게 그림 그리는 AI, 만화 그려주는 AI 는 한번쯤은 들어보셨을 텐데요 

 

이런 인공지능들은 대부분 디퓨전 모델이라는 방식을 이용하고 있는데요 

 

Diffusion 모델의 간단한 원리에 대해서 알아보도록 하겠습니다. 

 

인공지능을 학습시킬 때 원본 이미지와 이걸 설명하는 프롬프트를 주고 여기에 이렇게 이미지가 점점 흐려지는 노이즈를 추가하는 과정을 거친 다음에 

 

이 노이즈에서 다시 역으로 노이즈를 해독하면서 이걸 디노이징이라고 하는데 디노이징을 거쳐서 다시 원본 이미지로 돌아가는 이 과정을 인공지능에 학습을 시킵니다. 

 

그러면 이렇게 학습을 하고 나면 이제는 원본 이미지가 없어도 그냥 노이즈로부터 특정 프롬프트를 주고 원본 이미지가 없는데도 다시 원본 이미지를 만들어달라고 하면 이 디노이징 과정을 거쳐서 데이터가 없는 새로운 이미지를 생성할 수 있게 되는 것입니다. 

 

그래서 이렇게 텍스트를 넣어서 이미지가 나오는 디퓨전 모델이 굉장히 잘 되니까 많은 기업들이 뛰어들어서 이런 모델을 만들었습니다. 

그 중에서 스테빌리티 AI라는 기업에서 디퓨전 모델을 만들고 이걸 그냥 무료로 공개하였습니다. 

 

그래서 Hugging Face라는 곳에 올려두었는데 여기 가면 누구나 무료로 스테빌리티 AI에서 만든 디퓨전 모델인 스테이블 디퓨전 모델을 다운받을 수가 있습니다. 

 

그래서 너도 나도 스테이블 디퓨전을 다운받아서 

파인튜닝이라고 이 모델을 목적에 맞게 추가 학습시키는 과정을 거치니까 만화 그려주는 모델, 가구 그려주는 모델, 3D 애니메이션 그려주는 모델 등등 용도에 따른 엄청나게 다양한 모델이 탄생하게 되었습니다. 

 

그런데 이런 모델이 아무리 많아도 직접 돌리려면 개발자라면 이렇게 이걸 감사는 코드를 만들어서 여기에 텍스트를 입력시켜서 이미지를 뽑아내는 이런 코드를 직접 개발할 수도 있겠지만 코딩을 잘 모르시는 분들은 이걸 하기가 쉽지 않겠죠.

그래서 누구나 쉽게 이런 모델을 사용할 수 있도록 UI라고 텍스트 입력 창이나 버튼 같은 걸 만들어서 이걸 누르면 안에 내부적으로 코드가 동작하도록 해서 누구나 쉽게 이 인공지능을 사용할 수 있는 웹사이트, 어플리케이션 등이 많이 탄생을 하였는데요 

 

그래서 이런 UI들 중에 요즘 가장 많이 사용되는 것이 Automatic1111이라는 분이 만든 Stable Diffusion Web UI라는 도구가 가장 많이 사용되고 있습니다. 

 

이거는 무료 오픈 소스로 공개되어서 누구나 다운받아서 무료로 쓸 수 있고요

 

이런 화면을 만들어두어서 그냥 안에 인공지능 모델만 넣어놓으면 코딩을 몰라도 텍스트 입력하고 이런 버튼들 눌러가면서 생성을 하면 인공지능 기반 이미지 생성을 할 수 있는 도구입니다. 

 

이름은 아마 처음에 스테이블 디퓨전 모델 전용으로 만드느라 스테이블 디퓨전 웹 UI라고 이름을 정했을 텐데 지금은 꼭 스테이블 디퓨전 모델이 아니더라도 다양한 모델들을 집어넣어서 이 UI를 통해서 사용할 수 있습니다. 

 

그래서 이번 영상에서는 이 UI를 사용하는 방법을 상세하게 배워보도록 하겠습니다. 

 

 

2. 환경별 세팅방법(브라우저/윈도우/맥)

 

다음으로 이 웹 UI를 환경별로 세팅하는 방법을 알아보도록 하겠습니다. 

 

환경별로 셋팅하는 방법이 모드 다른데요.

먼저 어떤 환경이든 상관없이 브라우저만 있으면 돌아가는 방법을 알려드리고 위니도우에 설치하는 방법, 맥에 설치하는 방법 이렇게 순서대로 알려 드리겠습니다. 

 

먼저 인터넷 브라우저를 열어서 이 주소로 접속을 해줍니다. 

 

https://github.com/AUTOMATIC1111/stable-diffusion-webui

 

GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI

Stable Diffusion web UI. Contribute to AUTOMATIC1111/stable-diffusion-webui development by creating an account on GitHub.

github.com

주소는 본문과 댓글에도 남겨놓도록 하겠습니다. 

 

접속하시면 이런 화면이 나오게 되는데요 

참고로 이 페이지는 업데이트가 엄청나게 자주 됩니다. 

 

여기로 들어오셔서 스크롤을 쭉 내리다 보시면 Installation 이라고 써진 부분이  있을 텐데요 여기서부터 설치하는 방법이 나오는 곳입니다. 

각가 환경별로 설치하는 방법이 나와 있는데  가장 위에 Use Online Services라고 설치 없이 온라인에서 이용할 수 있는 방법에 대한 링크가 여기 나와 있습니다.

이 링크로 들어가줍니다. 

 

그러면 여기서 온라인으로 이용할 수 있는 Google Collab과 PaperSpace 링크가 있는데요  여기서 어떤 것을 이용해도 큰 상관은 없지만 The Last Band이라는 분이 관리하는 이 링크를 이용해 보도록 하겠습니다. 

이게 막히면 다른 것을 이용하셔도 전체적인 진행 방법은 큰 차이는 없습니다. 

 

이 링크를 클릭하시면 Google Collab이라는 서비스와 연결이 되는데요

 

* Google Colab : 

구글에서 온라인으로 파이썬 실행할 수 있는 컴퓨터 빌려주는 환경 

Google Collab은 파이썬 코드를 온라인 환경에서도 실행할 수 있게 구글에서 컴퓨터를 빌려주는 서비스인데요 이런 코드들을 여러분의 컴퓨터가 아닌 구글이 빌려주는 컴퓨터에서 실행을 함으로써 여러분이 좋은 성능의 컴퓨터가 없어도 심지어 스마트폰에서도 이 코드를 실행을 하실 수가 있습니다.   이 서비스를 이용하기 위해서는 구글 로그인이 필요한데요 

 

구글 드라이브랑 연동하는 코드도 들어있는데요 이 코드는 여러분의 구글 드라이브에 들어갈 수 있는 권한을 제공해주는 코드이기 때문에 혹시나 여러분의 구글 드라이브에 있는 자료가 해킹당하거나 하는 위험성이 있을 수 있기 때문에 가급적이면 여기서 사용하는 구글 아이디는 구글 드라이브에 중요한 자료가 없는 아이디로 진행을 해주시기 바랍니다. 

 

로그인 하신 후 드라이브로 복사를 눌러서  이 코드를 복사를 해줍니다. 

 

이 코드의 사본 파일이 내 구글 드라이브에 저장이 되서 이 코드를 실행을 시킬 수 있게 되었는데요 

그리고 위에 메뉴 중에 런타임에 들어가서  런타임 유형 변경을 눌러서 하드웨어 가속기를 GPU를 선택해서 저장을 눌러줍니다. 

 

그러면 콜랩 실행 환경이 GPU와 연결이 되어 인공지능을 돌리 수가 있게 되었는데요 그리고 이제 코드를 실행을 해줍니다. 

코드를 실행할 때는 코드가 있는 칸을 눌러서 왼쪽에 있는 셀 실행 버튼을 누르면 실행이 됩니다. 

 

처음 실행할 때는 이렇게 연결 중이라고 뜨면서 

 

시간이 좀 걸립니다. 

 

그리고 이 첫 번째 코드는 구글 드라이브와 연결하는 코드이기 때문에 이런 메시지가 뜨는데 구글 드라이브에 연결을 해줍니다. 

그러면 로그인 화면이 뜨고 로그인을 해줍니다.  스크롤을 내려서 허용을 눌러줍니다. 

 

그러면 이렇게 구글 드라이브와 연결이 됐고 왼쪽 파일을 눌러 보시면 

 

내 구글 드라이브랑 잘 연동이 된 것을 확인할 수 있습니다. 

 

다음으로 순차적으로 하나씩 코드를 실행해 줄 텐데요. 

이때 이렇게 하나의 코드 블록이 automatic1111의 레포지토리를 설치한다라고 제목만 나와 있고 코드는 표시가 안 나와 있고

코드를 누르면 코드를 볼 수 있습니다. 이것도 그냥 얖에 이 재생 버튼만 누르면 실행이 됩니다. 

 

실행이 완료되면 체크 표시가 나오게 됩니다. 

 

다음으로 모델을 다운받거나 불러올 수 있는데요 

 

세가지 방법중에 하나로 진행이 가능합니다. 

 

먼저 첫번째 방법은 별도로 다운받아 둔 모델이 없다면 여기서 다운을 받아주는 방법인데요  처음 하시는 분들은 그냥 이것만 작성해서 실행하시면 되고  이미 다운받은 모델이 있어서 그걸 활용하고 싶으신 분들은 구글 드라이브에 내 모델을 올려놓고 

올려놓은 이 모델, 이 파일의 경로를 여기에 입력을 해 주시면 됩니다. 

이거를 그대로 복사해서 위쪽에 붙여 놓고 내 드라이브의 가장 상위 경로에 올려놓으셨다면 파일 이름만, 이 파일 이름 대신 내 파일의 이름으로 교체를 해 주시면 됩니다. 

 

세 번째 방법은 내 드라이브가 아니라 외부 다른 아이디의 드라이브에 있다면 다른 아이디에 있는 이 모델 파일에 마우스 우 클릭해서 공유를 누르고 링크가 있는 모든 사용자로 바꾼 다음에 

 

이 링크를 복사해서 여기에 넣으면 다른 구글 드라이브에 있는 모델 파일도 가져올 수 있습니다. 그런데 처음 하시는 분들이 많을 것 같아서 이 두 갠 비워두고 첫번째 옵션으로 진행하도록 하겠습니다. 

 

모델 버전을 선택을 해 주고 저는 1.5버전을 선택을 해 보겠습니다. 

그리고 토큰을 입력해 줘야 되는데요 

이 토큰이 뭐냐면 아까 말씀드린 hugging Face라는 사이트에서 모델을 다운받아 오는 거기 때문에 여기 회원 가입을 하고 토큰을 생성해 줘야 됩니다.

 

 

huggingface.co 로 들어가 주세요.  여기서 오른쪽 위에 Sign Up 버튼을 눌러서 회원 가입을 진행해 줍니다. 

회원가입 후 오른쪽 셋팅 메뉴로 들어가 줍니다. 

 

Access Tokens 을 눌러서 New token을 선택합니다. 

그리고 이름을 자유롭게 지어 주시고 Role은 write르 선택하고 Generator Tokens를 눌러 줍니다. 

 

그러면 이렇게 토큰 번호가 생성이 되는데요  오른쪽에 있는 복사 버튼을 누르면 이 토큰을 목사를 하실 수 있고 이 토큰을 구글 콜랩에 있는 토큰 입력란에 붙여 넣기로 입력을 해 줍니다. 

 

실행을 하시면 모델이 다운받아 집니다. 

 

그 다음 코드 블럭도 아무것도 체크하지 않고 실행을 시켜 줍니다. 

 

스크롤을 내려 보시면 이렇게 Running on Local URL 하고 어떤 주소가 나오게 되는데요 

이 주소에 들어가 보시면  사이트가 나오고 Click to Continue를 누르게 되면 

 

 

이렇게 Web UI를 사용할 수 있는 환경으로 들어오게 됩니다. 

 

여기서 위쪽에 Model.ckpt 이거를 선택해서 특정 모델을 사용 할 수가 있습니다. 

 

 

이렇게 이미지를 생성하시면 내 구글 드라이브에 저장이 되게 되는데요 

 

여기에서 생성한 이미지를 확인하실 수 있습니다. 

 

콜랩의 단점은 아무래도 구글 콜랩에 의존을 하는 거다 보니까 중간 중간 연결이 끊길 수가 있습니다. 

그러면 다시 실행을 해서 모델 다운로드는 이미 받아놨으면 이걸 생략하고 나머지 과정을 다시 실행해서 똑같이 다른 서버를 또 켜야 됩니다.  이렇게 콜랩처럼 계속 꺼지는 환경이 싫으신 분들을 위해 윈도우 PC에서 직접 설치하는 방법도 알려드리도록 하겠습니다. 

 

2. 환경별 설정/세팅방법 - 윈도우 설치 방법

2. 환경별 설정/세팅방법 - 맥 설치 방법

 

 

3. 메뉴 및 기능 소개 - 전체 메뉴 간단 소개 

이제 설치가 완료 됐으니 web ui의 메뉴와 기능들에 대해서 소개를 해 드리겠습니다. 

web ui에서 사용할 수 있는 주요 기능들을 하나씩 설명해 드리도록 하겠습니다. 

 

 

먼저  stable diffusion checkpoint는 다운로드 받은 모델들 ckpt 파일들을 여기서 클릭해서 선택을 할 수 있는 곳입니다. 

기본적인 스테이블 디퓨전 모델 말고도 이거를 다양하게 파인튜닝한 여러 가지 모델들을 변경해서 사용하실 수 있습니다. 

 

먼저 전체적인 메뉴를 설명해 드리면 첫번째 탭은 text 2 img 라고 텍스트를 입력해서 이미지를 뽑아내는 과정이 담겨 있고 

두번째 탭은 img 2 img 라고 해서 이미지를 넣고 그거를 변형시켜서 새로운 이미지를 만들어 내는 탭입니다. 

 

Extras탭은 어떤 이미지를 넣고 그 이미지의 scale 사이즈를 키우거나 특정 사이즈에 맞추거나 이미지 처리를 담당하는 곳이고요  png info는  여기에 생성한 이미지를 끌어 왔을 때 

 

exif라고 어떤 설정으로 만들었는지를 여기에 넣으면 확인하실 수 있습니다. 

 

다음으로 체크포인트 머저는 모델을 섞는 과정을 할 수 있는 곳인데요. 일반적인 스테이블 디퓨전 말고도 변형된 굉장히 다양한 모델들이 있는데 그것을 선택해서 적당히 몇 대 몇의 비율로 섞어서 새로운 모델을 만드실 수 있습니다. 

 

트레인 탭에서는 인베딩 하이퍼 네트워크 이런 방법들로 훈련을 시켜서 원하는 목적에 맞게 변형을 시킬 수 있고요  settings에서는 필요한 다양한 설정들을 할 수 있고  extensions에서는 지금 이렇게 있는 기능들 말고 다양한 추가 기능을 설치할 수 있는 것인데요  

 

available에서 로드를 해보면 지금 설치 가능한 다양한 익스텐션들이 나와 있습니다.  대표적으로 드림부스 이게 굉장히 파인튜닝에 좋은데 이런 것들을 추가해서 이 웹 UI 안에서 손쉽게 파인튜닝을 진행할 수 있는 그런 익스텐션도 있고요  

그 외에도 정말 다양한 익스텐션들이 있어서 계속 새로운 기능들이 개발되고 이걸 편리하게 설치해서 사용할 수 있는 구조가 되었습니다. 

그래서 나중에 주요 익스텐션들은 설치해서 다루는 방법까지 알아보도록 하겠습니다. 

그러면 먼저 txt2img 부터 각각 메뉴들이 어떤 역할을 하는 것인지 알아보도록 하겠습니다. 

 

프롬프트는 기본적으로 생성하길 원하는 문장을 입력해주는 곳이고 네가티브 프롬프트는 원하지 않는 문장 

예를 들어 ugly나 bad finger 이런 것처럼 피하고 싶은 부분들을 여기에 기록을 해주면 이게 마이너스 효과가 납니다. 

 

다음으로 sampling steps은 noise에서 denoise로 갈 때 거칠 스텝의 수인데요

기본이 20으로 되어 있는데 이게 낮을수록 좀 그림이 뭉개지는 경향이 있고 이게 높을수록 좀 더 디테일한 경향이 있습니다. 

 

다음으로 sampling method는 어떤 방법을 쓸지 정해주는 것이고요 

sampling method에 따라서 이런 식으로 크게 차이는 없지만 조금씩 바뀌기는 합니다. 

 

width, height는 각각 결과물의 너비와 높이를 나타냅니다. 

 

기본적으로 512짜리 이미지들로 학습이 됐기 때문에 512 정사각형이 가장 잘 나오긴 합니다. 

 

그리고 체크할 수 있는 옵션들이 있는데 restore faces를 누르면 이미지를 생성하고 얼굴이 이상하게 나온 거를 한번 보정해주는 역할을 합니다. 

그리고 tiling 옵션은 이 이미지들을 타일로 여러 개 배치를 했을 때 괜찮게 나올 수 있도록 만들어주는 것이고요 

Highres fix는 찾아보니까 512 x 512 보다 더 큰 이미지를 생성할 때 머리 위에 또 머리가 생긴다든지 아니면 이상한 요소들을 방지해주는 역할을 한다고 합니다. 

 

다음으로 배치 카운트는 이 이미지를 생성하는 횟수이고 배치 사이즈는 한번 생성할 때 몇 개를 생성할 건지를 정해주게 됩니다. 

결국 결과값은 이 두 개 값의 곱으로 나타나게 됩니다. 

 

2개짜리 이미지가 5번 생성이 되서 총 10개의 이미지가 만들어지는 것입니다. 

다음으로 CFG Scale은 이미지가 얼마나 그 프롬프트를 정확하게 따라갈 건지를 정해주는 수치인데요 이게 낮을수록 프롬프트랑 큰 상관없이 만들어지지만 대신에 좀 창의적인 이미지가 나올 수 있겠죠. 이게 높을수록 프롬프트에서 명령하는 대로 나오게 됩니다. 

 

다음으로 seed값은 이렇게 이미지를 생성했을 때 이 이미지가 마음에 든다고 한다면 아래쪽이 이 이미지에 대한 생성 정보가 나와 있는데 여기에 seed 값이 있는데요 

 

특정 원하는 그림의 seed를 복사해서 넣으면 이 그림 스타일과 유사하게 다시 생성을 할 수가 있습니다. 

그래서 다시 한번 생성을 해도 기존 그림과 똑같이 나왔죠 

 

그래서 이런 스타일로 여러 개 만들어 보고 싶다면  seed를 설정하고 배치 사이즈를 늘려서 생성을 하면 특정 seed와 유사한 이미지들을 여러 개 생성을 할 수 가 있습니다. 

 

다음으로 아래쪽에 script가 있는데 이건 뭐냐면 지금은 세 가지가 있습니다. 

 

 

먼저 Prompt matrix는 이걸 선택하게 되면 여거 가지 프롬프트를 실험해 보고 싶을 때  기호를 구분해서 입력을 하게 되면 결과가 이런 식으로 일러스트레이션이란 단어가 없을 때, 일러스트레이션 단어가 있을 때

시네마틱 라이팅이 없을 때, 있을 때 각각의 케이스들에 대해서 표의 형태로 비교를 해 볼 수가 있습니다. 

 

다음으로 Prompts from file or textbox는 이거를 클릭하면 여기에 프롬프트가 적힌 파일을 끌어올 수가 있는데요 

메모장에 어떤 프롬프트를 입력하고 이 파일 자체를 끌어다가 여기에 넣으면 이렇게 안에 있는 텍스트가 여기에 나오는 것을 확인할 수 있습니다. 

그리고 이런 다양한 옵션들을 테스트할 때 좋은 옵션이 있는데요 

x/y plot 을 선택하게 되면 x축, y축을 정해서 다양한 옵션들을 시험을 해 볼 수 있습니다. 

 

예를 들어서 캠플링 스텝과 CFG 스케일이 어떤 영향을 미치는지 보고 싶으시다면 x축에 Steps 를 선택하고

x values 를 20,30,40 이런 식으로 설정을 하고  y축을 CFG 스케일로 놓고 이거를 7,8,9 이런 식으로 설정을 해서 Generate를 하면 이렇게 표의 형태로 x축에 스텝수가 20,30,40일때 어떻게 변화하는지 또 CFG 스케일이 7,8,9일 때 어떻게 변화하는지를 이렇게 표 형태로 확인할 수 있습니다. 

 

 

그래서 x축, y축을 다양한 변수로 바꿔서 테스트를 해 보시면 그 변화에 따라 어떤 식으로 이미지가 나오는지 여러번 실험을 해 보실 수 있습니다. 

 

추가로 프롬프트 관련해서 오른쪽에 이 그림을 누르면 랜덤하게 어떤 작가가 봍게 됩니다.  랜덤하게 작자를 붙이고 싶을때 이 아이콘을 눌러 주시면 됩니다. 

 

두번째 아이콘은 생성한 이미지의 프롬프트를 불러올 때 사용하면 다시 이 프롬프트를 불러올 수 있습니다. 

save style은 예를 들어서 이런 긍정적인 키워드들을 쭉 입력해 두고 Save style을 눌러서 positive라고 입력을 해 두면 이런 긍정적인 단어들을 그냥 스타일에서 저장한 positive를 선택하고 밑에 있는 Apply버튼을 누르면 아까 저장했던 스타일의 단어들이 한 번에 붙게 됩니다.  자주 사용하는 단어들은 스타일로 묶어서 저장해 두고 불러와서 사용하면 좋겠죠. 

 

4. 실전 활용 방법 (txt2img, img2img, 의인화 등)

이 강의는 라이브로 진행한 것을 편집하고 추가로 중간중간 새로 업데이트 된 부분을 삽입을 하였습니다. 함께 보시죠.

 

가장 기본적인 기능,텍스트로부터 이미지를 생성하는 것을 함께 해 보겠습니다. 

 

효과적인 프롬프트를 사용하기 위해서 책까지 나왔습니다. 

달리 프롤프트북이라고 해서 이 명령어를 어떻게 하면 좀 더 효율적으로 쓸까 라는 걸 굉장히 고민을 하셔서 이렇게 만들어낸 프롬프트북입니다. 

 

We are living in the future라고 합니다. 

진짜 미래에 사는 것 같은 느낌을 얻으실 수 있습니다. 

 

이거 돌려보시면 진짜 깜짝 놀랍니다. 

 

Prompt라는게 문장인데 이게 여러 가지 스타일로 문장을 썼는데 어떻게 하니까 좀 효과적이더라 라는 게 나와서 소개를 드리는데 

추가로 최근에 OpneArt라는 곳에서 스테이블 디퓨전 전용 프롬프트북도 발간을 하였습니다. 

 

그래서 이걸 참고하시면 좀 더 스테이블 디퓨전에 맞는 프롬프트 작성 방법을 배우실 수 있습니다. 

 

너무 기니까 좀 간략하게만 소개를 드리겠습니다. 

 

Emotional prompt에서 light, paceful  밝다 평화롭다 이런 말인데 아무튼 이러면 확실히 이 네 개 그림 차이 보이시나요?

 

이런 거를 이제 이런 단어들을 넣으면 표현할 수 있다는 겁니다. 

 

그래서 이걸 다 복사해 가지고 프롬프트에 넣어버리면 굉장히 밝은 이미지가 나옵니다. 

내가 생각하는 것에 맞는 단어를 골라서 넣어야 생각하는 이미지대로 나옵니다. 

 

아트적인것을 만들때는 Looks, vibes, punks, waves 이런게 되게 중요한데 잘 넣으면 됩니다. 

 

내가 사진을 얻고 싶은데 어디에 어떤 사진을 얻고 싶냐? 나는 얼굴 정면 완전 가까운 걸 얻고 싶다면 Extreme close-up 이런 거 쓰면 가까워지고 이런식으로 정말 구체적으로 그 특정 부위를 나는 이미지를 만들고 싶다 하면 구체적인 명령어를 쓰면 됩니다. 

 

전체적으로 설명드리면 상세하게 하나하나씩 이 사람 내가 원하는 이미지는 어떤 이미지인지를 많이 쓰면 많이 쓸수록 정확하게 나옵니다. 

이게 약간 처음 말씀드린 거서럼 약간 운빨도 있어요.

 

운빨도 있다는 것은 잘 나온것도 있고 안 나오는 것도 있기 때문에 확률을 높이려면 어떻게 해야 되냐면 당연히 운빨일 때는 주사위를 많이 굴리면 좋겠죠. 

 

그렇기 때문에 여기 배치 사이즈랑 카운트가 있습니다. 

카메라 이름이나 렌즈 이름을 같이 써서 쓰면 좀 더 진짜 카메라로 찍은 것처럼 이미지가 나옵니다. 

Shutter speed라는 건데 사진이 빛을 깜빡할 때 잡는 거니까 그때 셔터 스피드가 굉장히 빠르면 1000분의 1 이러면 이런 이미지를 얻을 수 있는데 아무튼 이런 셔터 스피드까지 정하면 이런 이미지도 얻을 수 있습니다. 

 

또 자주 쓰는게 Realistic image, Heperrealistic, 8K 이런 거 많이 씁니다. 

 

책은 일독을 권합니다. 

 

Highly Detailed, Superrealism, Trending on Twitter,Trending on Pinterest  이런것도 많이 쓴다고 합니다. 

설명해 주는 곳이 많습니다. 

 

그래서 여러 사람들의 의견을 참고해보면 좋을것 같아요 계속 공유를 하고 있으니 다른 유튜브 블로그 들을 참고하면 도움이 될것 같습니다. 

여러분이 직접 돌려보시고 꿀팁들을 얻어가면서 이런 키워드들을 여러분도 공유해주시면 좋을 것 같아요

이런 키워드 쓰니까 좀 더 사실적으로 나오더라 좀 더 아트적으로 나오더라

 

그래서 또 좋은 사이트 하나 소개해 드리면 exika.art 라는게 있는게 있습니다.  여기가 굉장히 유용합니다. 

 

 

exika 여기서는 스테이블 디퓨전으로 생성한 이미지들이 어떤 프롬프트로 만들었냐 라는 것을 다 써놨습니다.  

 

이렇게 나온 이미지를 개선하는 방법도 있습니다. 이 부분도 나중에 알려 드리겠습니다. 

 

해외에서 유명한 분들 그분들이 얼굴이 많을 것 같아서 일론 머스크를 넣어 보겠습니다. 

 

이 사진을 고치는 것을 알려드리도록 하겠습니다.

 

Restore faces를 선택을 하면 한번 더 얼굴을 개선하는 부분을 얻을 수가 있습니다. 

일단 이 이미지가 나왔으면 Send to img2img 버튼을 선택하면  img2img 탭으로 이미지가 옮겨 집니다. 

 

 

img2img는 이미지를 바탕으로 새로운 이미지를 만들때 사용합니다. 

 

Denoising strength 가 있는데 클 수록 기존 이미지와 달라지고 작으면 작을수록 기존 이미지랑 비슷합니다 .

약간의 디테일만 고치고 싶다면 Denoising strength를 낮춰줍니다. 

 

이런식으로 디테일하게 이미지를 수정할 수 있습니다. 

 

이제 inpaint 이라는 기능을 알려 드리겠습니다.  Send to inpaint 버튼을 선택하면 이 사진이 inpaint 라는 탭으로 가게 됩니다. 

컴퓨터에 있는 이미지를 드래그 해서도 사용할 수 있습니다.  만약 선글라스를 씌우고 싶다면 한다면 

inpaint라는게 이 이미지안에 특정 부분을 바꾸겠다는 것입니다. 

 

영향을 받을 만한 곳을 선택해 줍니다. 

Photorealistic photo of Elon Musk wearing sunglasses 를 프롬프트에 입력후 Generate 버튼을 선택합니다. 

 

 

생성이 되었습니다. 

어떤 스타일의 선글라스이며 색이 뭐며 이런걸 쓰면 좀 더 정확하게 나오긴 하겠죠.

조금 더 손을 봐야 되면 인페이트로 보내겠습니다. 

 

원래 이미지에서 바뀐 이미지를 보시면 바뀐것을 확인하실 수가 있습니다. 

 

 

계속 여러번 수정할 수 있습니다. 

 

outpaint 도 사용할 수 있습니다. 데모만 보여 드리면 원래 이미지에서 외부 벽을 찍으면 없는 배경 이미지를 만들어 줍니다.  ai가 배경을 생성해 내는 겁니다. 

인페인트,아웃페이트를 잘 이용하면 웬만한 이미지들은 수정할 수 있습니다. 

 

또 많은 분들이 기대하셨던 의인화를 어떻게 하는 거냐면 함께 해보도록 하겠습니다. 

 

우아꾸님 대표적인 캐릭터인 와뚜 캐릭터를 가지고 사람화 했더니 굉장히 자연스럽게 잘 나왔죠. 이런 것도 만들 수 있고 조코딩 로고도 해봤습니다. 

 

 

 

조코딩 아이콘으로 의인화를 했더니 남주혁 이미지의 영향인지 이런 느낌으로 나왔습니다. 

제 사진을 넣고 여성의 얼굴이렇게 했더니 이렇게 나왔습니다. 

 

 

 

Denosing strength을 높이면 의인화 할 정도로 바뀌겠죠. 원리가 그게 다 입니다. 

 

이제 상상하는 이미지는 다 만드실 수 있습니다. 

 

이거를 이제 사람에 맞게 프롬프트를 작성하면 됩니다. 사람에 맞게 작성한다는 건 저는 어떻게 했냐면 

아이돌을 쓰면 잘생긴 얼굴이 나옵니다.   photo of a Korean idol face 를 먼저 프롬프트에 사용했고, 하나씩 붙여 나가면서 작업을 했습니다. 

 

우선 photo of a Korean idol face 만 사용시에는 여성분으로 나옵니다. 

 

Photo of a Korean boy idol face 를 입력했습니다. 우선 큰 그림을 잡고 하나씩 진행합니다. 

 

lexica 홈페이지 프롬프트를 참고해서 좀 더 넣어 보았습니다. 

 

큰 틀에서 한번 쫙 뿌려서 보고 여기서 이런저런 점들이 반영이 안됐었을때 하나씩 추가를 합니다. 

그리고 강조하는게 있습니다. ()괄호를 쓰면 강조고 []를 쓰면 약하게 하는겁니다. 

 

 

여러번 반복해서 더 나은 문구도 바꾸어주고 색상도 넣어주고 좀 더 정확하게 나오겠죠.

 

포토샵에서 플러그인이 있습니다. 

 

 

 

 

Reference

https://www.youtube.com/watch?v=emObTucGMOA