본문 바로가기
IT 및 모바일 기기/IT 소식

그림 그려주는 AI 미드저니(Midjourney) 사용 후기 단점

by Stadrem 2022. 10. 11.
반응형

https://www.midjourney.com/

 

Midjourney

An independent research lab exploring new mediums of thought and expanding the imaginative powers of the human species.

www.midjourney.com

  예전부터 이러한 AI가 그러주는 프로그램들은 존재하긴 했습니다. 다만 예전에 나왔던 프로그램들은 AI의 수준이 낮기에 수준 낮은 퀄리티의 그림이나 추상화 정도나 나오곤 했습니다. 이번에 조금 발전된 형태의 프로그램이 나왔기에 한번 사용해 봤습니다.

  상단에 링크를 누르면 위와 같은 이미지가 나오는데 Join the beta를 누르면 디스코드로 연결됩니다. 디스코드에 가입하거나 기존 아이디로 로그인하면 됩니다.

Midjourney 기본 사용법

  위와 같이 미드저니 채널에 입장하게 됩니다. 사용법이 굉장히 번거로운데, 좌측 메뉴에서 newbie-숫자로 되어있는 채널을 클릭하여 입장합니다.

  들어가 보면 이미 다른 유저들이 열심히 이미지 굴리면서 채팅창이 쭉쭉 올라가는 모습을 볼 수 있는데, 기본적으로 체험판을 사용하면 본인이 만든 이미지는 공개되어서 다른 유저들도 볼 수 있게 됩니다.

  사용법은 하단 채팅창에 /imagine를 입력하고

  Prompt라고 적힌 파란 선 박스 안에 본인이 원하는 키워드를 입력하면 됩니다. 영어로요. 우측처럼 입력하면 됩니다.

  문장은 잘 못 알아들으니 단어 단위로 작성해야 잘 알아먹습니다. 소설 쓰듯이 텍스트로 써서 입력하니 못 알아먹고 온갖 기괴한 이미지만 뱉어냈습니다. 최대한 간략하고 짧게 써야 합니다.

  대략 1분~30초 정도 기다리면 본인의 키워드에 맞는 이미지가 생성됩니다. 디스코드 알림이 켜져 있다면 알림음이 울립니다.

  특이한 건 1번의 명령어에서 4개의 이미지가 생성됩니다. 위 이미지를 보면 총 9개의 버튼들이 있습니다.

  U라고 되어있는 것은 Upscale, 즉 해당 번호의 이미지만 해상도를 2배 높여줍니다.

  V라고 되어있는 것은 Variations, 해당 번호의 이미지를 바탕으로 4개의 추가 이미지를 생성합니다.

  마음에 드는 이미지가 있다면 바로 U를 누르면 되고, 구도나 화풍은 마음에 드는데 일부 부족하다 싶으면 V를 눌러서 추가로 보면 됩니다.

  우측에 혼자 있는 새로고침 버튼은 지금 생성한 이미지를 제외하고 키워드를 바탕으로 재생 성하는 버튼입니다.

  U를 누르면 위 이미지처럼 다른 형태의 버튼들이 보입니다.

  Make Variations는 이 이미지로 4개의 추가 이미지를 생성합니다.

  Upscale to Max는 한 번 더 해상도를 높여주는 거고

  Light Upscale Redo는 다른 알고리즘으로 새로 작업하는 건데 별 차이점을 모르겠습니다.

Midjourney 유저 커뮤니티

  디스코드 채널에 가입된 상태에서 미드져니 홈페이지에 입장하면 본인이 제작한 이미지들이 계정에 저장되어 있고, 다른 유저들의 이미지를 살펴볼 수 있습니다.

  커뮤니티 피드에 가보면 많은 추천을 받은 이미지들이 전시되어 있고 해당 이미지의 키워드들도 공개되어 있습니다. 필요하면 커뮤니티 피드를 둘러보며 키워드 사용법을 알아보는 것도 좋을 듯합니다.

  본인이 키워드로 제작한 이미지들은 기본적으로 여기를 통해서 모두에게 공개되어 있습니다. 기본적으로 공개를 거부할 순 없고, 요금제에 가입된 상태에서 +20 달러를 추가로 지불해야 비공개를 설정할 수 있습니다.

Midjourney의 단점

  미드져니의 잘 만들어진 이미지들만 공유되어 돌아다니는데, 그러한 이미지가 만들어지기까지 수많은 재시도가 존재합니다. 50번, 100번을 시도해도 원하는 이미지가 생성된다는 보장이 없습니다. 그렇게 되면 본인의 시도만 소비되는 것이죠.

  사용법에서 설명했던 베리에이션, 업 스케일을 수차례 반복하여 원하는 이미지가 나올 때까지 돌리고 돌립니다. 실패의 결과물들이 위 이미지 같은 형태들이고요.

  약점으로는 메이저 단어? 가 아닌 것은 대체로 못 알아먹습니다. 많이 쓰는 단어들은 학습이 잘 되어있기에 괜찮은 이미지가 생성되지만 잘 쓰이지 않는 단어들은 굉장히 미흡하게 작동합니다. 특히 제가 느꼈던 것은 공룡, 한국, 전신, 행동 등의 키워드. 공룡을 그려달랬더니 머리가 앞뒤로 붙어있거나, 전신을 그려달랬더니 머리와 다리가 붙어있고, 한복을 그려달랬더니 중국식 복장이 나오는 둥 아직 한참 많이 부족해 보입니다.

  의심 가는 점은 구글에서 수집한 이미지를 토대로 합성하는 시스템인지 가끔 도장 인장이나 주소 워터마크, 서명들도 같이 찍혀 나옵니다. 대다수 뭉개져서 망정이지 또렷하거나 특정되는 인장(워터마크)이라면 저작권 위반으로 고소당해도 할 말이 없습니다.

  체험판은 25번의 시도를 제공받습니다. 만일 좀 더 해보고 싶다면 최소 10달러를 내야 더 많은 이미지를 생성해 볼 수 있습니다. 이 10달러도 200회의 제한이 걸려있고 사실상 무제한을 원한다면 30달러를 내야 합니다.

  유료 옵션 중에 30달러에 '무제한' 생성 가능도 사실 'Fast' 모드가 900회 제공되고 이후부터는 속도가 느린 'Relax' 모드를 강제하게 됩니다. 스마트폰으로 비교하자면, 5G 요금제의 10GB를 모두 소모했으니 이후부터는 1mpbs로 속도를 제한한다와 동일한 뜻입니다.

  900회면 많지 않으냐 할 수 있는데 200회 정도는 반나절 만에 소모 가능합니다. 일단 이미지가 원하는 대로 생성되지도 않고 예시로 보여준 이미지처럼 얼굴이 박살 나거나 기괴한 형태가 95% 정도이고 그중 5%를 골라내서 베리에이션이나 업 스케일 하며 다듬어야 합니다. 그래서 이미지 생성이 한 번에 3번씩 가능하고 베리에이션을 3개씩 돌리며 검토하다 보면 2시간 내로 200회 바닥납니다. 실제로 제가 베이직 요금제 결제한 당일에 200회가 바닥났으니까요.

참고: Midjourney는 공개 커뮤니티에 게시될 때마다 다른 사람들이 귀하의 이미지와 프롬프트를 사용하고 리믹스할 수 있도록 하는 공개 커뮤니티입니다. 기본적으로 이미지는 공개적으로 볼 수 있고 다시 혼합할 수 있습니다. 위에서 설명한 대로 귀하는 Midjourney에게 이를 허용하는 라이선스를 부여합니다. 개인 요금제를 구매하는 경우 이러한 공개 공유 기본값 중 일부를 우회할 수 있습니다.
https://midjourney.gitbook.io/docs/billing

  문제는 미드저니의 규정이 꽤 치명적으로 작용할 것 같습니다. 지금 당장은 '재미'로써 이미지를 생성하지만, 본인이 개인 용도로 쓰고 싶을 정도로 잘 나온 이미지가 생성된다 하더라도 해당 이미지를 생성할 때 사용한 키워드와 원본 이미지를 커뮤니티에 게시되어버리니까요.

  그러니까 미드저니의 라이선스 규정에 따라서 생성된 이미지는 상업적으로 쓸 수 있지만(유료 이용자 한정) 미드저니 내에서 복제 및 재배포와 관련된 저작권이 없습니다. 무슨 말이냐면 누구든 공개된 키워드 비슷한 이미지를 재생성할 수 있습니다. 생성된 원본 이미지를 바리에이션화 시킬 수도 있고요.

  무조건적인 공개와 관련된 것도 꽤나 거슬리는데, 유료회원은 개인 채팅을 통해서 이미지를 만들 수 있기에 공개 채널에서 자신의 이미지가 드러나는 것을 막을 순 있지만, 유저가 생성된 모든 이미지는 커뮤니티, 개발자들에게 무조건 공개됩니다.

  약간 다행인 것은 완전 비공개를 원하는 유저를 위해 각 요금제 +20달러를 추가로 지불하면 비공개 옵션이 제공됩니다. 그러나 커뮤니티에만 비공개이고 개발자에게는 그대로 드러납니다. 개발자가 해당 이미지로 성능을 개선하든 조리돌림을 하든 뭘 하든 유저 입장에서는 할 수 있는 것이 없습니다. 어떤 용도로 사용되는 지도 모르고요. 사실상 미드져니를 통해 생성된 이미지는 공공재 취급입니다.

  요금제의 서비스 내용보다는 저작권과 관련된 것이 미드저니의 발목을 잡을 듯합니다. 규정상 미드저니 내에서 재배포와 복제에 관해서 엄청나게 관대한데 이러면 누가 돈을 들여서 시간을 들여서 이미지를 만들어내냐는 거죠. 제가 느낀 바로는 유저가 유료로 AI 학습을 도와주는 격으로 보입니다. 그리고 미드저니의 AI 학습이 웹에 올라온 이미지들을 통해 학습되어 해당 이미지들을 모아놓고 합성하는 것으로 보이는데 만일 원본 이미지라는 것이 증명되면 어떻게 대처할지 궁금하네요.


결론

체험판만 사용해 보겠다: 적극 추천

똥 손이라 대충이라도 만든 이미지가 필요하다: 추천

재미로 한두 달 정도 해보겠다: 추천

개인적인 이미지가 필요하다: 비추천

상업적 목적으로 쓰겠다: 적극 비추천

 

그나마 잘 나온 이미지 한 장. 정면 / 상반신만 나오는 이미지를 유독 잘 그린다. 다른 행동과 동작에 관한 키워드를 전혀 인식 못 하는데 AI 학습이 깊게 파고들지 않은 것 같음.

반응형

댓글