Chat GPT 후속 비주얼 쳇GPT(GPT-4)출시임박 소식 - 사진과 영상까지 인식이 가능

목차 (Content)

728x90

화제를 일으켰던 Chat GPT(쳇 gpt)에 이어 후속으로 출시되는 ChatGPT- gpt4가 이번 주에 나온다는 발표가 있습니다. 텍스트만 인식뿐만 아니라 사진은 물론 영상까지 그동안 사람만 인식이 가능했던 영역까지 인공지능이 가능하게 된다고 하는데, 간단히 살펴보겠습니다.

Chat GPT 후속 비주얼 쳇 GPT(GPT-4) 출시임박 소식 - 사진과 영상까지 인식이 가능

썸네일 — Chat GPT 후속 비쥬얼 챗GPT(GPT-4)출시임박 소식

비주얼 쳇 GPT(GPT-4)의 능력은 어디까지일까?

멀티모달(Multimodal) 개념의 비주얼 Chat GPT

gpt-4-개스케치 — Chat GPT 후속 비쥬얼 챗GPT(GPT-4)출시임박 소식 - 사진과 영상까지 인식이 가능

gpt-4-검은색 — Chat GPT 후속 비쥬얼 챗GPT(GPT-4)출시임박 소식 - 사진과 영상까지 인식이 가능

최근 루머로 전해지고 있는 GPT-4의 언어학습량을 나타내는 비교 그림입니다. gpt3와 GPT-4의 비교 사진입니다

gpt-4가 gpt-3에 비해서 훨씬 더 많은 언어를 학습했다고 볼 수 있습니다

마이크로소프트 코스모스 1 사이트를 통해본 '비주얼 Chat GPT '

관련 사이트 바로가기 => Git Hub

https://github.com/microsoft/visual-chatgpt

코스모스 1 논문에서 보면, 코스모스 원은 텍스트뿐만 아니라 비주얼적인 면도 이해할 수 있다고 설명하고 있고, 오리와 토끼를 함께 닮은 사진을 놓고, 인공지능에게 질문을 하고, 답변을 하는 부분을 볼 수 있습니다.

뿐만 아니라 사진을 보여주고, 새의 종류를 알아맞히는 모습도 소개되고 있는데, 모두 그냥 이미지를 보고 단순하게 물어봤을 때는 대답이 틀릴 수가 있지만 저희가 디테일하게 물어보면 물어볼수록 정답에 가까워진다는 것을 알 수 있습니다.

그래서, 결국 비록 인공지능이 많은 걸 알고 있고 엄청난 데이터를 학습이 되어 있다고 해도 사용하는 것은 우리인데, 우리가 어떤 프롬프트를 주느냐에 따라서 나오는 결과물이 천차만별이라는 것입니다. 즉, 자세한 프롬프트를 사용해야 좋은 퀄리티의 결과물을 얻으실 수가 있습니다

곧 출시될 비주얼 쳇 GPT (GPT-4)는 과연 현행 GPT-3.5와 얼마나 많은 차이를 보이게 될 것인지? 많이 궁금하고, 기다려집니다.

특히, 이번에 나올 gpt-4는 멀티모달(Multimodal)이라는 개념이 핵심으로 보입니다. 즉, 서로 다른 언어끼리도 소통이 가능하다는 것이어서, 예를 들어, 영어를 한글과 같이 다른 언어를 통해서도 대화가 가능하다는 의미입니다.

마무리

이상으로 이번 주에 나온다는 루머가 있는 Chat GPT(쳇 gpt) 후속작 비주얼 챗GPT(ChatGPT- gpt4)에 대해 간단히 알아봤습니다.

텍스트만 인식뿐만 아니라 사진은 물론 영상까지 그동안 사람만 인식이 가능했던 영역까지 인공지능이 가능하게 된다고 하는데, 얼마나 또 사람들을 놀라게 할까요? 벌써부터 기다려집니다. 끝.

728x90

저작자표시 비영리 변경금지 (새창열림)

'IT정보' 카테고리의 다른 글

구글바드 사용법,구글 바드(Googlebard ) 쳇gpt 차이점 (0)	2023.04.23
아이폰15 출시일,디자인,C타입 포트,울트라 루머 총정리 (0)	2023.03.20
미드저니 사용법 명령어 프롬프트 무료 저작권 & 미드저니 사이트 (0)	2023.03.04
챗GPT vs 노션AI 인공지능 챗봇을 이용한 블로그 작성 비교 체험 리뷰 (1)	2023.02.26
쳇gpt 한글 자동 번역해주는 'ChatGPT 자동 번역기'<프롬프트 지니> (0)	2023.02.18