오픈AI, ‘GPT-5.4’ 공개…추론·코딩·문서작업 성능 강화

		0
자료=오픈ai/ 그래픽=박종규 기자

오픈AI(OpenAI)가 새로운 AI 모델 'GPT-5.4'를 공개했다. 이번 모델은 추론 능력과 코딩, 업무 자동화 기능을 통합한 최신 모델로, 전문 업무 환경에서의 활용성을 크게 강화한 것이 특징이다.

오픈AI는 5일(현지시간) 챗GPT, API, 코드 개발 플랫폼 코덱스(Codex)를 통해 GPT-5.4를 출시했다고 밝혔다. 챗GPT에서는 'GPT-5.4 Thinking' 형태로 제공되며, 복잡한 작업에서 최대 성능을 원하는 사용자를 위해 'GPT-5.4 Pro' 버전도 함께 공개됐다.

GPT-5.4 모델은 이날부터 챗GPT 유료 가입자들에게 제공됐다. 기존 GPT-5.2 사고 모델은 오는 6월 5일까지만 운영한다.

GPT-5.4는 기존 모델에서 발전한 추론 능력과 코딩 성능, 에이전트 기반 자동화 기능을 하나의 모델에 통합했다. 특히 이전 모델인 GPT-5.2 대비 더 적은 토큰을 사용하면서도 문제 해결 속도와 정확도를 높인 것이 특징이다.

이번 모델은 문서 작성, 스프레드시트 분석, 프레젠테이션 제작 등 전문 업무 환경에서의 활용성을 크게 강화했다. 오픈AI가 공개한 평가 결과에 따르면 44개 직군의 지식 기반 업무 수행 능력을 측정하는 GDPval 벤치마크에서 GPT-5.4는 83.0%의 비교 평가에서 전문가 수준 이상의 결과를 기록했다. 이는 GPT-5.2의 70.9%보다 크게 개선된 수치다.

스프레드시트 분석 능력도 향상됐다. 투자은행 신입 분석가 수준의 모델링 작업을 평가한 내부 테스트에서 GPT-5.4는 평균 87.3%의 점수를 기록해 GPT-5.2(68.4%)보다 높은 성능을 보였다. 프레젠테이션 제작 평가에서도 인간 평가자들이 GPT-5.4 결과물을 68% 비율로 더 선호한 것으로 나타났다.

사실 정확성도 개선됐다. 사용자들이 사실 오류를 지적한 프롬프트를 기반으로 한 테스트에서 GPT-5.4는 GPT-5.2보다 개별 주장 오류 가능성이 33% 낮고, 전체 응답에 오류가 포함될 확률도 18% 감소한 것으로 분석됐다.

개발자를 위한 기능도 강화됐다. GPT-5.4는 컴퓨터 사용 기능을 기본적으로 지원하는 첫 범용 모델로, 에이전트가 실제 컴퓨터 환경에서 작업을 수행할 수 있도록 설계됐다. 예를 들어 웹 브라우저를 탐색하거나 소프트웨어를 조작하고, 키보드와 마우스 입력을 통해 복잡한 작업을 수행할 수 있다.

벤치마크 테스트에서도 이러한 성능이 확인됐다. 데스크톱 환경 조작 능력을 평가하는 OSWorld-Verified 테스트에서 GPT-5.4는 75.0% 성공률을 기록해 GPT-5.2(47.3%)를 크게 앞섰으며 인간 평균(72.4%)보다도 높은 성능을 보였다.

웹 브라우저 작업을 평가하는 WebArena-Verified 테스트에서도 GPT-5.4는 67.3% 성공률을 기록해 GPT-5.2(65.4%)보다 개선된 성능을 나타냈다.

시각 인식 능력도 강화됐다. GPT-5.4는 최대 100만 토큰 컨텍스트를 지원하며, 고해상도 이미지 분석 기능을 통해 최대 1024만 픽셀 수준의 이미지까지 처리할 수 있다. 이를 통해 문서 인식과 이미지 이해, 화면 상호작용 정확도가 향상됐다는 설명이다.

오픈AI는 "GPT-5.4는 복잡한 업무 수행을 보다 정확하고 효율적으로 처리할 수 있도록 설계된 모델"이라며 "개발자와 기업이 실제 업무를 자동화하는 AI 에이전트를 구축하는 데 중요한 기반이 될 것"이라고 밝혔다.

정아름 기자newjjar@gmail.com