AnthropicAI모델

Anthropic, Claude Sonnet 4.5 출시 — 코딩·에이전트 SWE-bench 77.2% 달성

Anthropic이 2025년 9월 Claude Sonnet 4.5를 출시했습니다. SWE-bench Verified에서 77.2%를 기록하며 GPT-5 Codex를 앞서고, 30시간 이상 복잡한 작업을 지속 수행하는 에이전트 능력이 특징입니다.

Anthropic이 2025년 9월 29일 Claude Sonnet 4.5를 공개했습니다. 코딩, 에이전트, 컴퓨터 사용(Computer Use) 능력에서 Claude 4 패밀리 내 최고 수준의 성능을 기록했습니다.


SWE-bench Verified에서 77.2%를 달성하며 GPT-5 Codex(74.5%)를 앞섰습니다. 또한 단일 작업에서 30시간 이상 지속 실행하는 장기 에이전트 능력을 입증했습니다.


주요 벤치마크

  • SWE-bench Verified: 77.2% (업계 최고)
  • 30시간 이상 복잡한 에이전트 작업 지속 수행
  • GPT-5 Codex 대비 코딩 성능 우위

  • 함께 발표된 것

  • Claude Agent SDK: 메모리·권한·서브에이전트 조율 도구
  • Claude Code 체크포인트: 작업 저장·롤백 기능
  • VS Code 네이티브 확장 출시
  • #Claude Sonnet 4.5#SWE-bench#코딩AI#에이전트SDK
    출처 및 참고 기사