', { cookie_domain: 'rachelchun.tistory.com', cookie_flags: 'max-age=0;domain=.tistory.com', cookie_expires: 7 * 24 * 60 * 60 // 7 days, in seconds }); GPT-4o, o1, 4.1... 샘 올트먼도 인정한 오픈AI '네이밍 카오스', 완벽 정리해 드립니다
 

GPT-4o, o1, 4.1... 샘 올트먼도 인정한 오픈AI '네이밍 카오스', 완벽 정리해 드립니다

반응형

 

 
 
이제는 전 세계인의 일상에 깊숙이 자리 잡은 챗GPT. 그 놀라운 성능 뒤에는 오픈AI가 쉼 없이 개발해 온 강력한 AI 원천 모델들이 있습니다. 하지만 하루가 멀다 하고 새로운 모델이 등장하면서, 이제는 어떤 모델이 무엇을 의미하는지 파악하기조차 어려워지고 있습니다. "GPT-4o는 뭐고, o1은 또 뭐지?"라는 궁금증을 가져보셨다면, 제대로 찾아오셨습니다. 오픈AI의 CEO 샘 올트먼마저 "놀림 받아도 싸다"고 인정한 '네이밍 카오스'의 모든 것을 알기 쉽게 정리해 드리겠습니다.
 
 

 

GPT란 무엇인가? 기본부터 차근차근

먼저 가장 기본적인 'GPT'라는 이름의 의미부터 짚고 넘어가야 합니다. GPT는 'Generative Pre-trained Transformer'의 약자입니다. 직역하면 '사전 학습된 생성형 트랜스포머'라는 뜻입니다.
 

  • Transformer(트랜스포머): 2017년 구글이 처음 개발한 딥러닝 신경망 모델로, 문장의 맥락과 관계를 파악하는 데 탁월한 성능을 보입니다. 현재 대부분의 거대언어모델(LLM)이 이 트랜스포머 아키텍처를 기반으로 합니다.
  • Pre-trained(사전 학습): 인터넷의 방대한 텍스트 데이터를 미리 학습시켜 언어에 대한 기본적인 이해도를 갖추게 했다는 의미입니다.
  • Generative(생성형): 학습한 내용을 바탕으로 새로운 텍스트나 콘텐츠를 '생성'해낼 수 있다는 뜻입니다.

 
즉, GPT는 '트랜스포머 구조를 사용해 방대한 데이터로 미리 학습시킨 생성형 AI'라고 이해할 수 있습니다.
 

 
 

숫자의 시대: GPT-1부터 GPT-3.5까지

오픈AI의 모델명은 처음에는 매우 직관적이었습니다. 마치 아이폰 13, 14, 15처럼 숫자로 세대를 구분했죠.
2018년 GPT-1을 시작으로 GPT-2, GPT-3 순으로 발전했습니다. 우리가 2022년 11월 혜성처럼 등장한 챗GPT를 통해 처음 만난 모델은 바로 GPT-3.5였습니다. 여기서 소수점(.5)은 다음 세대로 넘어가기 전, 기존 모델(GPT-3)의 성능과 안정성을 대폭 개선한 '중간 단계' 또는 '개선판' 모델임을 의미합니다. 여기까지는 이해하기 어렵지 않았습니다.
 
 

 
 

알파벳의 등장: 복잡성의 시작, GPT-4o와 o1

혼란은 GPT-4 이후, 이름에 알파벳이 붙기 시작하면서 본격화되었습니다. 특히 두 개의 'o'가 등장하며 사용자들을 혼란에 빠뜨렸습니다.
 

1. GPT-4o: '모든 것'을 의미하는 옴니(Omni)

지난 5월 공개된 GPT-4o의 'o'는 '옴니(omni)'를 의미합니다. '모든', '전체'를 뜻하는 접두사처럼, 이 모델이 텍스트(글)뿐만 아니라 오디오(음성), 이미지, 비디오 등 다양한 형태(양식)의 데이터를 실시간으로 처리할 수 있는 '멀티모달' AI의 완전체에 가까워졌음을 의미합니다. 사용자와 음성으로 대화하고, 카메라로 본 것을 설명해 주는 등 공상과학 영화 같던 기능들이 바로 이 GPT-4o 덕분입니다.
 

2. o1: '최적화'를 의미하는 추론 모델 (다른 'o'입니다!)

그런데 지난해 9월, 오픈AI는 복잡한 문제 해결에 특화된 추론 모델 'o1'을 선보였습니다. 여기서 사용자들은 큰 혼란을 겪었습니다. 이 모델의 'o'는 옴니(omni)가 아니라 '최적화(optimization)'를 의미하는 것으로 추정되며, GPT-4o와는 전혀 다른 계열의 모델이기 때문입니다. 즉, 이름은 비슷해 보이지만 하나는 '다재다능한 범용 모델'이고, 다른 하나는 '논리적 추론에 특화된 전문 모델'인 셈입니다.
 

 
 

혼돈의 정점, '네이밍 카오스'와 CEO의 인정

정수(GPT-3, 4), 소수점(3.5, 4.1), 그리고 각기 다른 의미를 가진 알파벳(4o, o1)까지 뒤죽박죽 섞이면서, 테크 업계에서는 이를 '네이밍 카오스(Naming Chaos)'라고 부르기 시작했습니다. 상황의 심각성은 오픈AI의 수장인 샘 올트먼도 인정했습니다.
그는 지난 15일 자신의 소셜미디어(X)를 통해 "(우리의 모델 네이밍에 대해) 놀림을 받아도 싸다. 올여름까지 모델 네이밍을 개선하겠다"고 공식적으로 밝혔습니다. 최고 경영자가 직접 명명법의 문제를 인정하고 개선을 약속한 것입니다.
 
 

 

미래는 단순해질까? GPT-5에 거는 기대

그렇다면 이 혼란은 어떻게 정리될까요? 해답은 곧 출시될 차세대 모델 'GPT-5'에 있을 것으로 보입니다. 오픈AI는 GPT-5부터는 앞서 언급된 'o1'과 같은 추론 특화 모델을 별도로 출시하는 대신, 추론 기능을 기본 모델에 통합할 것이라고 예고했습니다.
이는 앞으로 모델 체계가 다시 'GPT-5', 'GPT-6'와 같이 직관적인 숫자 중심으로 단순화될 수 있음을 시사합니다. 사용자들이 더 이상 복잡한 알파벳의 의미를 공부하지 않아도, 어떤 모델이 최신이고 가장 강력한지 쉽게 파악할 수 있게 될 것이라는 기대감이 커지고 있습니다.
 
 

결론: 혼돈 속에서도 혁신은 계속된다

오픈AI의 모델 이름은 분명 혼란스러웠습니다. 하지만 그 혼란의 이면에는 텍스트, 이미지, 음성을 아우르는 '옴니' 모델부터 복잡한 추론을 해결하는 '전문' 모델까지, AI 기술을 다양한 방향으로 빠르게 발전시키려는 치열한 노력이 있었습니다. 이제 그 성장통을 끝내고 GPT-5라는 새로운 시대를 준비하는 만큼, 앞으로는 사용자들이 더 쉽게 이해하고 활용할 수 있는 직관적인 체계가 마련되기를 기대해 봅니다. 이름은 바뀌어도, 세상을 바꾸는 기술의 발전은 계속될 것입니다.

반응형