본문 바로가기

chatgpt 기술탐구

Sparks of Artificial General Intelligence: Early experiments with GPT-4

반응형

펌 ㅣ Sparks of Artificial General Intelligence: Early experiments with GPT-4

마이크로소프트에서 그동안 GPT-4를 가지고 꼼꼼하게도 많은 실험을 했군요. 이를 정리한 무려 100페이지가 넘는 논문입니다. 결론은 GPT-4 는 이른바 AGI(범용 인공지능)의 단초이다.

논문 초록 (DeepL 번역)
인공지능(AI) 연구자들은 다양한 영역과 작업에서 놀라운 능력을 발휘하는 대규모 언어 모델(LLM)을 개발 및 개선하여 학습과 인지에 대한 우리의 이해에 도전하고 있습니다. OpenAI가 개발한 최신 모델인 GPT-4는 전례 없는 규모의 컴퓨팅과 데이터를 사용하여 훈련되었습니다.

이 논문에서는 OpenAI가 아직 활발하게 개발 중이던 초기 버전의 GPT-4에 대한 조사 결과를 보고합니다. 저희는 (이 초기 버전의) GPT-4가 이전의 AI 모델보다 더 일반적인 지능을 보여주는 새로운 LLM 코호트(예: ChatGPT 및 Google의 PaLM)의 일부라고 주장합니다.

이러한 모델의 향상된 기능과 의미에 대해 논의합니다. GPT-4는 언어에 대한 숙달을 넘어 수학, 코딩, 시각, 의학, 법률, 심리학 등을 아우르는 새롭고 어려운 과제를 특별한 지시 없이도 해결할 수 있음을 입증했습니다.

게다가 이러한 모든 작업에서 GPT-4의 성능은 인간 수준의 성능에 놀라울 정도로 근접하며, ChatGPT와 같은 이전 모델을 크게 능가하는 경우가 많습니다. GPT-4의 기능의 폭과 깊이를 고려할 때, 저희는 이를 인공 일반 지능(AGI) 시스템의 초기(아직 불완전한) 버전으로 합리적으로 볼 수 있다고 생각합니다.

GPT-4에 대한 탐구에서 우리는 그 한계를 발견하는 데 특히 중점을 두었으며, 다음 단어 예측을 넘어서는 새로운 패러다임을 추구해야 할 필요성을 포함하여 더 심층적이고 포괄적인 버전의 AGI로 발전하기 위해 앞으로의 과제에 대해 논의합니다. 마지막으로 최근의 기술 도약이 사회에 미치는 영향과 향후 연구 방향에 대한 성찰로 마무리합니다.

논문 https://arxiv.org/abs/2303.12712

320x100