IT 및 모바일 기기/IT 소식

노벨 AI 이미지 생성기 V3 업데이트 소식 사용 후기

Stadrem 2023. 11. 23. 09:16
반응형

Image Generation - NovelAI

 

NovelAI - The AI Storyteller

With a glazed stare, you watch and ponder what you see in the orb: random images from all around the world. You gaze into the globe and contemplate what these images mean to you. A forest, an ocean, a desert, a mountain range... you spend countless hours s

novelai.net


NovelAI Diffusion 3.0

 

  Novel AI 이 회사는 참... 특이하네요. V2가 나온 지 1달 밖에 안됐는데 벌써 V3가 나왔습니다. 심지어 이건 V1과 V2(스테이블 디퓨전 기반)와 다르게 SDXL(스테이블 디퓨전 XL 기반) 버전이라서 생성 성능이 매우 향상되었습니다.

  잠깐 만져본 결과, 손가락이 훨씬 잘 뽑히고 전체적인 디테일이 매우 좋아졌습니다.

 

  설정은 위와 같습니다. 일단 V3 버전을 선택(기본값) 하고, [Sampler] 항목에서 SMEADYN를 켜줍니다. 그리고 이건 개인적인 추천인데 Prompt Guidance Rescale을 0.7로 올리는 편이 좋습니다. 이 옵션의 값이 0이면 배경이 자꾸 어둡게 나오는데, 이걸 해결해 줄 수 있습니다.

 

  참고로 이미지 컨트롤 툴을 사용할 수 없습니다. SD 기반으로 만든 기능이라 SDXL에 적용되게 하려면 약간의 개발 기간이 필요하다고 하네요. 다행인 것은 인페이트 기능은 작동합니다. 인페인팅도 성능이 향상되서 매우 잘 작동됩니다.

 


출력물 비교

좌: V1 / 중: V2 / 우: V3

a dignified man, boy, star and night background, ray tracing, Realistic lighting, {{{focusing face, head}}}

 

  그림체에는 취향 차이가 있긴 하지만, V1은 못 써먹을 물건이고, V2는 좀 과장돼있고 그럴싸해 보이지만 프롬프트를 제대로 인식하지 못하고, V3는 프롬프트를 매우 정직하게 받아들이고 디테일이 안정적입니다. 다만 너무 정직하게 받아들여서 1girl, 1boy등의 인원 수 프롬프트를 사용하지 않으면 배경만 튀어나옵니다. a dignified man라는 단어를 구글에서 검색해 보면 좀 나이 든 사람이 주로 검색되는 걸로 봐서는 퀄리티는 둘째치고 V3가 올바르게 이미지 생성된 건 맞습니다.


샘플러에 따른 그림체 변화

좌: DPM++2M / 중: Euler / 우: Euler Ancestral

 

  V2도 그렇지만, V3로 넘어와서는 Sampler 설정에 따른 그림체 변화가 꽤나 심합니다. 취향 차이인데, 밝은 컬러는 DPM++2M이 나은 편이고 오일 페인팅 같은 느낌은 Euler가 내기 쉬운 것 같습니다. 동일한 프롬프트, 동일 시드를 사용했음에도 저런 차이가 납니다. 그냥 본인이 여러 가지 눌러서 취향에 맞추는 것이 좋습니다.


다양한 그림체

좌: 애니메 스타일 / 중: 고전 화풍 / 우: 반실사 스타일

 

  애니메 스타일은 별다른 프롬프트 없이 기본적으로 나오는 스타일입니다. 고전 화풍은 oil paining, Victorian Era를 넣고, 관련된 작가인 Alphonse Mucha, Edward hopper, Francois Boucher 프롬프트를 넣으면 됩니다. 그리고 완전 실사풍을 만드는 건 실패했습니다. Photorealistic, Hyperrealistic 프롬프트를 넣어봤지만, 우측 이미지 수준 밖에 나오질 않습니다. 뭐 이것만 해도 괜찮지만요.

 

역동적인 그림

 

  당연히 자세가 역동적일수록 신체 묘사에 오류가 나거나 손가락이 제대로 묘사가 안되곤 합니다. 다만 V1이나 V2보단 확실히 안정적으로 변했고, 강력한 인페인팅 기능을 사용하면 제대로 나올 때까지 수정해 볼 수 있습니다.

 

캐릭터

좌: 알하이탐 / 중: 푸리나 / 우: 라이오슬리

 

  유명 캐릭터들은 정보가 확실히 있는지 제대로 생성되고, 이번 연도에 공개돼서 자료가 별로 없어야 할 캐릭터도 나옵니다. 물론 같은 게임사, 비슷한 연도에 공개된 캐릭터여도 인기가 별로 없으면 제대로 된 구현이 되지 않습니다. 확실히 유명하고 자료가 많은 캐릭터가 제대로 뽑힙니다.

  3번째 이미지의 라이오슬리 같은 경우 큰 틀의 의미에서 라이오슬리의 형태가 나오긴 하지만 복장이나 컬러가 많이 틀립니다. 인기가 별로 없는 캐릭터는 좀 슬프네요.


Novel AI V3 장점 / 단점

장점

  • 자유로운 해상도 설정
  • 무검열
  • 빠른 생성
  • 적은 프롬프트로 높은 퀄리티 보장

단점

  • 자연어에 대한 이해도가 좋지 않아서 여전히 프롬프트로 명령
  • 실사 스타일 생성 못함
  • 비용
  • 네거티브, 프롬프트 연구를 해야 높은 퀄리티 생성 가

  개인적으로 Opus를 결제하고 기본 해상도에서 무제한으로 생성하는 것을 추천하지만, 한 달에 약 3.2만 원 정도입니다. 업무용이라면 Bing을 쓰는 게 나을 수 있는데, 애니메 스타일 그림은 이제 노벨 AI V3가 훨씬 잘 뽑습니다. 본인의 활용 용도에 따라서 결정하면 됩니다.

 

반응형