Chat GPT 후속 비주얼 쳇GPT(GPT-4)출시임박 소식 - 사진과 영상까지 인식이 가능

2023년 03월 15일 by 도리포1
728x90

화제를 일으켰던 Chat GPT(쳇 gpt)에 이어 후속으로 출시되는 ChatGPT- gpt4가 이번 주에 나온다는 발표가 있습니다. 텍스트만 인식뿐만 아니라 사진은 물론 영상까지 그동안 사람만 인식이 가능했던 영역까지 인공지능이 가능하게 된다고 하는데, 간단히 살펴보겠습니다.


Chat GPT 후속 비주얼 쳇 GPT(GPT-4) 출시임박 소식 - 사진과 영상까지 인식이 가능

썸네일
Chat GPT 후속 비쥬얼 챗GPT(GPT-4)출시임박 소식

 


비주얼 쳇 GPT(GPT-4)의 능력은 어디까지일까?  

멀티모달(Multimodal) 개념의 비주얼 Chat GPT 

gpt-4-고양이gpt-4-개
gpt-4-개스케치gpt-4-검은색
Chat GPT 후속 비쥬얼 챗GPT(GPT-4)출시임박 소식 - 사진과 영상까지 인식이 가능

 

최근 루머로 전해지고 있는 GPT-4의 언어학습량을 나타내는 비교 그림입니다.  gpt3와 GPT-4의 비교 사진입니다 

gpt-4가 gpt-3에 비해서 훨씬 더 많은 언어를 학습했다고 볼 수 있습니다

 

관련 기사에 따르면,

코스모스 1 즉, '비주얼 Chat GPT' 모델은 사진을 인식할 수 있는 이미 멀티 모달의 개념을 갖고 있으며, 텍스트뿐만 아니라 사진은 물론 영상까지 인식이 가능하다는 점입니다.

 

미국 샌프란시스코에 위치하고 있고, 1억 명 이상의 개발자들이 함께 소프트웨어의 미래를 형성해서, 오픈 소스 커뮤니티에 기여하고 있는  ‘GitHub’ (Git 저장소)에 소개되고 있는 비주얼 쳇 GPT의 능력이 어느 정도인지 유추해 볼 수 있는 데모 영상이 소개되고 있습니다. 

  • 처음에 고양이 사진을 달라고 하면 고양이 사진을 보여주고,
  • 다음엔, 고양이를 강아지로 바꿔 달라고 하고,
  • 또다시 강아지를 조금 더 이제 그 윤곽선만 남게 하고,
  • 윤곽선만 남은 강아지에서 검은색 강아지를 그려달라고 하는 데모

 


마이크로소프트 코스모스 1  사이트를 통해본 '비주얼 Chat GPT '

관련 사이트 바로가기 => Git Hub 

https://github.com/microsoft/visual-chatgpt

 

코스모스 1  논문에서 보면, 코스모스 원은 텍스트뿐만 아니라 비주얼적인 면도 이해할 수 있다고 설명하고 있고, 오리와 토끼를 함께 닮은 사진을 놓고, 인공지능에게 질문을 하고, 답변을 하는 부분을 볼 수 있습니다.

 

뿐만 아니라 사진을 보여주고, 새의 종류를 알아맞히는 모습도 소개되고 있는데, 모두 그냥 이미지를 보고 단순하게 물어봤을 때는 대답이 틀릴 수가 있지만 저희가 디테일하게 물어보면 물어볼수록 정답에 가까워진다는 것을 알 수 있습니다.

 

그래서, 결국  비록 인공지능이 많은 걸 알고 있고 엄청난 데이터를 학습이 되어 있다고 해도 사용하는 것은 우리인데,  우리가 어떤 프롬프트를 주느냐에 따라서 나오는 결과물이 천차만별이라는 것입니다. 즉,  자세한 프롬프트를 사용해야 좋은 퀄리티의 결과물을 얻으실 수가 있습니다

 

곧 출시될 비주얼 쳇 GPT (GPT-4)는 과연  현행 GPT-3.5와  얼마나 많은 차이를 보이게 될 것인지? 많이 궁금하고, 기다려집니다.

 

특히, 이번에 나올 gpt-4는 멀티모달(Multimodal)이라는 개념이 핵심으로 보입니다.  즉, 서로 다른 언어끼리도 소통이 가능하다는 것이어서, 예를 들어, 영어를 한글과 같이 다른 언어를 통해서도 대화가 가능하다는 의미입니다.

 

 

마무리

이상으로 이번 주에 나온다는 루머가 있는  Chat GPT(쳇 gpt) 후속작  비주얼 챗GPT(ChatGPT- gpt4)에 대해 간단히 알아봤습니다.

 

텍스트만 인식뿐만 아니라 사진은 물론 영상까지 그동안 사람만 인식이 가능했던 영역까지 인공지능이 가능하게 된다고 하는데, 얼마나 또 사람들을 놀라게 할까요? 벌써부터 기다려집니다. 끝.

728x90