AI 그림 입문: 스테이블 디퓨전과 미드저니 제로베이스 완전 가이드

AI 그림 입문: 스테이블 디퓨전과 미드저니 제로베이스 완전 가이드

2025. 12. 5.
13분 읽기
0회 조회
AI 그림 입문: 스테이블 디퓨전과 미드저니 제로베이스 완전 가이드

튜토리얼 개요#

본 튜토리얼은 AI 그림에 대한 경험이 전혀 없는 초보자를 위해 상세한 입문 가이드를 제공하는 것을 목표로 하며, 현재 가장 인기 있는 AI 그림 도구인 Stable Diffusion과 Midjourney를 중점적으로 소개합니다. 튜토리얼의 목표는 독자가 AI 그림의 기본 원리와 조작 방법을 빠르게 습득하여 고품질의 이미지 작품을 독립적으로 생성할 수 있도록 돕는 것입니다.

본 튜토리얼은 AI 그림에 관심이 있지만 관련 경험이 부족한 초보자에게 적합합니다. 디자이너, 아티스트, 또는 단순히 AI 기술에 대한 호기심이 많은 사람이라도 본 튜토리얼을 통해 AI 그림의 기본 기술을 배울 수 있습니다.

본 튜토리얼을 통해 다음과 같은 내용을 학습할 수 있습니다.

  • AI 그림의 기본 개념과 원리 이해.
  • Stable Diffusion과 Midjourney의 설치, 구성 및 기본 조작 숙달.
  • 프롬프트(Prompt)를 사용하여 AI가 원하는 이미지를 생성하도록 유도하는 방법 학습.
  • AI 그림 작품의 품질을 향상시키기 위한 일반적인 이미지 처리 기술 습득.
  • AI 그림의 윤리적 문제와 발전 추세 이해.

환경 설정부터 프롬프트 작성, 후처리까지 단계별로 안내하여 놀라운 AI 예술 작품을 창작할 수 있도록 도와드립니다. 프로그래밍이나 예술적 기초 지식이 없더라도 쉽게 시작할 수 있습니다.

사전 준비#

AI 그림 여정을 시작하기 전에 몇 가지 준비 작업이 필요합니다. 여기에는 필요한 도구, 환경 구성 및 몇 가지 기본 지식 습득이 포함됩니다. 이러한 준비 작업을 통해 이후 학습 과정을 더욱 원활하게 진행할 수 있습니다.

필요한 도구#

  • 컴퓨터: 최소 8GB 메모리를 권장하며, 그래픽 카드는 NVIDIA GPU(최소 4GB VRAM)가 있는 것이 Stable Diffusion 실행에 매우 중요합니다. Midjourney는 Discord에서 실행되므로 컴퓨터 사양 요구 사항이 낮습니다.
  • Stable Diffusion: Stable Diffusion 설치 패키지(일반적으로 WebUI 버전, 예: AUTOMATIC1111의 Stable Diffusion web UI)를 다운로드해야 합니다.
  • Midjourney: Discord 계정을 등록하고 Midjourney 공식 서버에 가입해야 합니다.
  • 이미지 처리 소프트웨어: Photoshop, GIMP 등 생성된 이미지를 후처리하는 데 사용됩니다.
  • VPN (선택 사항): 해당 지역에서 특정 웹사이트 또는 서비스에 대한 액세스가 제한된 경우 VPN을 사용해야 할 수 있습니다.

환경 구성#

  • Python 설치: Stable Diffusion은 Python 환경에 의존하므로 Python 3.10 버전을 설치하는 것이 좋습니다.
  • Git 설치: GitHub에서 Stable Diffusion WebUI를 다운로드하는 데 사용됩니다.
  • CUDA Toolkit 설치 (선택 사항): 컴퓨터에 NVIDIA GPU가 있는 경우 CUDA Toolkit을 설치하면 Stable Diffusion 실행 속도를 크게 향상시킬 수 있습니다.
  • Stable Diffusion 모델 다운로드: SD v1.5, SDXL 등 Stable Diffusion 모델 파일을 다운로드해야 합니다. 이러한 모델 파일은 일반적으로 크기가 크므로 다운로드가 완료될 때까지 기다려야 합니다.
  • Stable Diffusion WebUI 구성: 다운로드한 모델 파일을 올바른 폴더에 넣고 컴퓨터 사양에 따라 WebUI 시작 매개변수를 수정합니다.

기본 지식#

  • 프롬프트 (Prompt): 프롬프트는 AI가 이미지를 생성하도록 유도하는 데 중요한 역할을 하며, 생성하려는 이미지의 내용, 스타일 및 세부 사항을 간결하고 명확하게 설명해야 합니다.
  • Stable Diffusion 매개변수: 샘플링 방법, 샘플링 단계, CFG Scale 등 Stable Diffusion의 일반적인 매개변수를 이해하면 이미지 생성 과정을 더 잘 제어할 수 있습니다.
  • 이미지 처리 기초: 해상도, 색상 모드, 레이어 등 기본적인 이미지 처리 개념을 이해하면 후처리를 더 잘 수행할 수 있습니다.
  • Discord 사용: 서버 가입, 메시지 보내기, 명령어 사용 등 Discord의 기본 조작에 익숙해지는 것은 Midjourney를 사용하기 위한 전제 조건입니다.

핵심 개념 설명#

AI 그림의 핵심 개념을 이해하는 것은 이 기술을 마스터하는 데 중요합니다. 다음은 반드시 숙지해야 할 기본 개념이며, Stable Diffusion과 Midjourney의 작동 원리를 더 잘 이해하는 데 도움이 될 것입니다.

확산 모델 (Diffusion Model)#

확산 모델은 Stable Diffusion의 핵심 기술입니다. 정방향 확산 과정을 통해 이미지를 점진적으로 무작위 노이즈로 변환한 다음 역방향 확산 과정을 통해 노이즈에서 이미지를 재구성합니다. 이 과정은 이미지를 조각으로 부수고 조각을 다시 맞추는 것과 유사합니다. Stable Diffusion은 대량의 이미지 데이터를 학습하여 노이즈에서 이미지를 재구성하는 능력을 습득했습니다.

프롬프트 엔지니어링 (Prompt Engineering)#

프롬프트는 AI가 이미지를 생성하도록 유도하는 데 중요한 역할을 합니다. 좋은 프롬프트는 생성하려는 이미지의 내용, 스타일 및 세부 사항을 명확하게 표현할 수 있습니다. 프롬프트 엔지니어링은 프롬프트를 설계하고 최적화하여 AI가 이미지를 생성하는 과정을 제어하는 것을 의미합니다. 여기에는 적절한 키워드 선택, 키워드 순서 조정, 수식어 사용 등이 포함됩니다.

샘플링 방법 (Sampling Method)#

샘플링 방법은 Stable Diffusion이 노이즈에서 이미지를 재구성하는 방법을 결정합니다. 서로 다른 샘플링 방법은 서로 다른 이미지 효과를 생성합니다. 일반적인 샘플링 방법으로는 Euler a, DPM++ 2M Karras 등이 있습니다. 각 샘플링 방법에는 장단점이 있으며, 특정 이미지 생성 요구 사항에 따라 선택해야 합니다.

샘플링 단계 (Sampling Steps)#

샘플링 단계는 Stable Diffusion이 역방향 확산을 수행하는 횟수를 나타냅니다. 샘플링 단계가 많을수록 이미지의 세부 사항이 풍부해지지만 계산량과 생성 시간도 늘어납니다. 일반적으로 20-50단계가 적절한 범위입니다.

CFG Scale#

CFG Scale(Classifier-Free Guidance Scale)은 AI가 프롬프트를 따르는 정도를 제어합니다. CFG Scale이 클수록 AI는 프롬프트의 요구 사항에 따라 이미지를 생성하지만 이미지 왜곡을 초래할 수도 있습니다. 일반적으로 7-12가 적절한 범위입니다.

잠재 공간 (Latent Space)#

Stable Diffusion은 픽셀 공간에서 직접 이미지를 생성하는 것이 아니라 저차원 잠재 공간에서 이미지를 생성합니다. 이렇게 하면 계산량을 크게 줄이고 이미지 생성 효율성을 높일 수 있습니다. 잠재 공간은 이미지의 압축된 표현으로 이해할 수 있으며, 이미지의 주요 특징을 유지하면서 중복 정보를 제거합니다.

텍스트-이미지 (Text-to-Image)#

텍스트-이미지는 텍스트 설명을 입력하여 AI가 해당 이미지를 생성하도록 하는 것을 의미합니다. Stable Diffusion과 Midjourney는 모두 텍스트-이미지 모델입니다. 텍스트-이미지 기술은 AI 그림의 핵심이며, 간단한 텍스트 설명을 통해 다양한 이미지 작품을 만들 수 있습니다.

1단계: Stable Diffusion WebUI 설치 및 구성#

이 장에서는 Stable Diffusion WebUI를 로컬에 설치하고 구성하는 방법을 자세히 설명하여 Stable Diffusion을 원활하게 실행하고 AI 그림 여정을 시작할 수 있도록 합니다. AUTOMATIC1111의 Stable Diffusion web UI를 예로 들어 설명합니다.

Stable Diffusion WebUI 다운로드#

  1. Git 설치: Git을 아직 설치하지 않은 경우 먼저 Git을 다운로드하여 설치하십시오. Git은 GitHub에서 Stable Diffusion WebUI를 다운로드하는 데 사용되는 버전 제어 시스템입니다.

  2. 리포지토리 복제: 명령줄 터미널을 열고 다음 명령을 입력하여 Stable Diffusion WebUI 리포지토리를 로컬에 복제합니다.

    git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
    

    이렇게 하면 현재 디렉토리에 stable-diffusion-webui라는 폴더가 생성되고 WebUI의 모든 파일이 해당 폴더에 다운로드됩니다.

  3. WebUI 디렉토리로 전환: cd 명령을 사용하여 WebUI 디렉토리로 전환합니다.

    cd stable-diffusion-webui
    

종속성 설치#

  1. 설치 스크립트 실행: WebUI 디렉토리에서 webui-user.bat (Windows) 또는 webui.sh (Linux/macOS) 스크립트를 실행합니다. 이 스크립트는 Python 환경, 다양한 Python 라이브러리 등 Stable Diffusion WebUI에 필요한 종속성을 자동으로 설치합니다.

    • Windows: webui-user.bat을 두 번 클릭하여 실행합니다.
    • Linux/macOS: 터미널에 sh webui.sh를 입력하고 Enter 키를 누릅니다.

    이 과정은 네트워크 속도와 컴퓨터 사양에 따라 시간이 걸릴 수 있습니다. 스크립트가 완료될 때까지 기다려 주십시오.

모델 파일 다운로드#

  1. 모델 다운로드: Hugging Face 등 웹사이트에서 sd-v1-5-full-ema.ckpt 또는 sd_xl_base_1.0.safetensors와 같은 Stable Diffusion 모델 파일을 다운로드합니다. 이러한 모델 파일은 일반적으로 크기가 크므로 다운로드가 완료될 때까지 기다려야 합니다.
  2. 모델 파일 배치: 다운로드한 모델 파일을 stable-diffusion-webui/models/Stable-diffusion 디렉토리에 넣습니다.

WebUI 시작#

  1. 시작 스크립트 실행: webui-user.bat (Windows) 또는 webui.sh (Linux/macOS) 스크립트를 다시 실행합니다. 이렇게 하면 Stable Diffusion WebUI가 시작됩니다.

    • Windows: webui-user.bat을 두 번 클릭하여 실행합니다.
    • Linux/macOS: 터미널에 sh webui.sh를 입력하고 Enter 키를 누릅니다.
  2. WebUI 액세스: 브라우저를 열고 http://127.0.0.1:7860을 입력하여 Stable Diffusion WebUI에 액세스합니다.

주의 사항#

  • VRAM 부족: 컴퓨터 VRAM이 부족하면 오류가 발생할 수 있습니다. --lowvram 또는 --medvram 옵션을 추가하여 VRAM 사용량을 줄이는 등 WebUI 시작 매개변수를 수정해 볼 수 있습니다.
  • 네트워크 문제: 종속성 및 모델 파일을 다운로드할 때 네트워크 문제가 발생할 수 있습니다. VPN을 사용하거나 미러 소스를 변경하여 문제를 해결해 볼 수 있습니다.
  • WebUI 업데이트: Stable Diffusion WebUI를 정기적으로 업데이트하면 최신 기능을 얻고 버그를 수정할 수 있습니다. git pull 명령을 사용하여 WebUI를 업데이트할 수 있습니다.

2단계: Midjourney 빠른 시작#

Midjourney는 Discord 기반 AI 그림 도구로 사용하기 매우 쉽고 편리합니다. 이 장에서는 Midjourney를 빠르게 시작하여 첫 번째 AI 예술 작품을 생성하는 방법을 소개합니다.

Discord 계정 등록 및 Midjourney 서버 가입#

  1. Discord 계정 등록: Discord 계정이 없는 경우 Discord 공식 웹사이트(https://discord.com/)를 방문하여 계정을 등록하십시오.
  2. Midjourney 서버 가입: Midjourney 공식 웹사이트(https://www.midjourney.com/)를 방문하여 "Join the Beta" 버튼을 클릭하고 지침에 따라 Midjourney의 Discord 서버에 가입하십시오.

Midjourney를 사용하여 이미지 생성#

  1. 초보자 채널 입장: Midjourney 서버에서 "#newbies"로 표시된 채널을 찾습니다. 이러한 채널은 초보자를 위해 특별히 제공되며 여기에서 이미지 생성을 시도할 수 있습니다.
  2. /imagine 명령어 사용: 채팅 상자에 /imagine를 입력한 다음 프롬프트를 입력합니다. 예: /imagine 산과 호수가 있는 아름다운 풍경
  3. 생성 대기: Midjourney는 프롬프트에 따라 4개의 이미지를 생성합니다. 이 과정은 몇 분 정도 걸릴 수 있습니다.
  4. 이미지 선택 및 확대: 생성된 4개의 이미지 아래에 U1, U2, U3, U4 버튼이 있으며, 각각 첫 번째, 두 번째, 세 번째, 네 번째 이미지를 확대하는 데 해당합니다. 해당 버튼을 클릭하여 원하는 이미지를 확대합니다.
  5. 변형 수행: 생성된 4개의 이미지 아래에 V1, V2, V3, V4 버튼도 있으며, 각각 첫 번째, 두 번째, 세 번째, 네 번째 이미지에 대한 변형을 수행하는 데 해당합니다. 해당 버튼을 클릭하면 Midjourney는 선택한 이미지와 유사한 4개의 새 이미지를 생성합니다.

일반적인 명령어#

  • /imagine: 프롬프트에 따라 이미지를 생성합니다.
  • /info: 남은 생성 횟수를 포함하여 Midjourney 계정 정보를 봅니다.
  • /help: Midjourney 도움말 문서를 봅니다.
  • /settings: 스타일, 품질 등 Midjourney의 매개변수를 설정합니다.

주의 사항#

  • 무료 평가판: Midjourney는 무료 평가판을 제공하지만 무료 평가판 횟수는 제한되어 있습니다. Midjourney를 계속 사용하려면 구독을 구매해야 합니다.
  • 프롬프트 기술: 프롬프트가 자세할수록 생성된 이미지가 예상에 더 부합합니다. 다양한 키워드, 수식어 및 스타일 설명을 사용하여 프롬프트를 최적화해 볼 수 있습니다.
  • 커뮤니티 상호 작용: Midjourney의 Discord 서버는 활발한 커뮤니티입니다. 여기에서 다른 사용자와 경험을 교환하고 작품을 공유하며 새로운 기술을 배울 수 있습니다.

3단계: 프롬프트 작성 기술#

프롬프트는 AI 그림의 영혼입니다. 좋은 프롬프트는 AI가 놀라운 작품을 생성하도록 유도할 수 있지만, 형편없는 프롬프트는 실망스러운 결과를 초래할 수 있습니다. 이 장에서는 AI 그림을 더 잘 제어하는 데 도움이 되는 몇 가지 프롬프트 작성 기술을 소개합니다.

프롬프트 구조#

일반적인 프롬프트는 일반적으로 다음과 같은 부분으로 구성됩니다.

  • 주체 (Subject): 묘사하려는 주요 대상(예: 사람, 동물, 풍경 등).
  • 환경 (Environment): 주체가 있는 환경(예: 실내, 실외, 도시, 시골 등).
  • 스타일 (Style): 이미지 스타일(예: 사실적, 만화, 유화, 수채화 등).
  • 조명 (Lighting): 이미지 조명 효과(예: 일출, 일몰, 야간, 스포트라이트 등).
  • 세부 사항 (Details): 이미지 세부 설명(예: 색상, 재료, 질감 등).
  • 아티스트 (Artist): 특정 아티스트 스타일 모방(예: 반 고흐, 모네, 다빈치 등).

프롬프트 작성 기술#

  • 간결하고 명확한 언어 사용: 너무 복잡하거나 모호한 단어는 사용하지 마십시오.
  • 구체적인 설명 사용: "소파에 앉아 있는 고양이" 대신 "빨간색 소파에 앉아 있는 검은색 고양이"와 같이 구체적인 설명을 사용하십시오.
  • 수식어 사용: 수식어를 사용하면 프롬프트의 표현력을 높일 수 있습니다. 예: "편안한 빨간색 소파에 앉아 있는 귀여운 검은색 고양이"
  • 가중치 사용: 가중치를 사용하여 특정 키워드의 중요성을 강조할 수 있습니다. 예를 들어 Stable Diffusion에서 (키워드:1.5)를 사용하여 키워드 가중치를 늘릴 수 있습니다.
  • 부정적 프롬프트 사용: 부정적 프롬프트를 사용하면 AI가 원하지 않는 콘텐츠를 생성하지 않도록 할 수 있습니다. 예를 들어 Stable Diffusion에서 negative prompt: blurry, ugly, distorted를 사용하여 흐릿하거나 추하거나 왜곡된 이미지가 생성되지 않도록 할 수 있습니다.
  • 다른 작품 참조: 다른 예술 작품이나 사진 작품을 참조하여 영감을 얻고 이를 프롬프트로 변환할 수 있습니다.
  • 계속 시도하고 조정: 프롬프트 작성은 계속 시도하고 조정하는 과정입니다. 생성된 이미지 효과에 따라 프롬프트를 계속 최적화해야 합니다.

예시#

다음은 프롬프트의 예입니다.

  • 긴 머리를 가진 젊은 여성의 초상화, 사실적, 부드러운 조명, 상세한 얼굴, Artgerm과 Alphonse Mucha 스타일
  • 밤의 미래 도시, 네온 조명, 사이버펑크 스타일, 상세한 건축물, Syd Mead 스타일
  • 가을 숲의 풍경화, 생생한 색상, 인상주의 스타일, Claude Monet 스타일
  • 고양이의 귀여운 만화 캐릭터, 큰 눈, 웃는 얼굴, 다채로운 배경

프롬프트 도구#

  • Lexica.art: 영감을 얻는 데 도움이 되는 강력한 프롬프트 검색 엔진입니다.
  • PromptBase: 프롬프트를 구매하거나 판매할 수 있는 프롬프트 마켓플레이스입니다.

4단계: 일반적인 매개변수 조정 및 최적화#

Stable Diffusion에는 수많은 매

AI 그림 입문: 스테이블 디퓨전과 미드저니 제로베이스 완전 가이드 | EndTo.AI