[AI News #07] 앤트로픽, Claude 3.5 Sonnet 출시

🗞️ AI News

[AI News #07] 앤트로픽, Claude 3.5 Sonnet 출시

Prometheus_ai 2024. 7. 2. 15:17

클로드 3.5 소네트 출시

Claude 3.5 Sonnet for sparking creativity

인공지능 언어 모델 개발 기업 앤트로픽이 2024년 6월 21일, 클로드 3.5 제품군의 첫 번째 모델인 클로드 3.5 소네트(Claude 3.5 Sonnet)를 출시했습니다.

클로드 3.5 소네트는 이전 버전인 클로드 3 오퍼스 대비 2배 빠른 속도로 작동하며, 비용은 5분의 1 수준으로 저렴해진 것이 특징입니다. 이 모델은 앤트로픽의 제품군 중 중간급 모델로, 더 강력한 모델인 오퍼스와 경량 모델인 하이쿠도 순차적으로 출시될 예정입니다.

주요 특징 및 성능

클로드 3.5 소네트는 대학원 수준의 추론, 학부 수준의 지식, 코딩 숙련도 등의 벤치마크에서 이전 버전 및 경쟁사보다 높은 성능을 사용자에게 제공합니다. 입력된 문장의 뉘앙스, 유머, 복잡한 명령어 및 의도된 의미를 분석하여 사용자가 필요로 하는 출력을 생성할 수 있으며 자연스럽고 공감할 수 있는 어조로 고품질 콘텐츠를 작성하는 데에 탁월합니다. 특히 코딩 능력이 뛰어나 정교한 추론 및 문제 해결 기능을 통해 독립적으로 코드를 작성, 편집 및 실행할 수 있어 '코딩 AI 에이전트' 수준으로 활용할 수 있습니다.

GPQA, MMLU, HumanEval, DROP, MGSM, MATH, GSM8K 등 대규모 언어 모델의 성능을 측정하기 위해 설계된 벤치마크에서 높은 점수를 받았습니다. 결과적으로는 벤치마크 8개 중 7개, 비전 벤치마크 5개 중 4개 분야에서 'GPT-4o'나 '제미나이 1.5 프로', '라마 3 400B' 등 첨단 모델을 능가했습니다. 대학원 수준의 추론 능력(GPQA)는 59.4%로 GPT-4o(53.6%)를 크게 앞섰고, 코딩 능력(HumanEval) 역시 92.0%로 GPT-4o(90.2%) 대비 1.8% 포인트 높았습니다. 또한, 멀티 모달 과제 수행에서도 차트 이해도와 문서 이해도 부문에서 각각 90.80%, 95.2%의 점수를 받아, 85.7%, 92.8%를 기록한 GPT-4o를 앞섰습니다.

이미 클로드 3 오퍼스 모델이 강력한 비전 기능을 갖추고 있었지만, 벤치마크 결과 클로드 3.5 소네트 모델은 이전 모델을 뛰어넘어 비전 기능을 갖춘 앤트로픽의 가장 강력한 모델이 되었습니다. MathVista 및 AI2D와 같은 벤치마크에서 높은 점수를 기록하며 시각적 분석과 관련된 작업에 효과적인 성능을 보인다는 것이 입증되었습니다.

대규모 언어 모델의 중요한 기능 중 하나인 안전성과 개인정보 보호 측면에서도 클로드 3.5 소네트 모델은 주목할 만합니다. 이 모델은 사용자 데이터를 사용하거나 유해한 결과물을 생성하지 않는 등의 규칙이 있는 영국 AISI 및 미국 AISI와 같은 기관의 테스트를 통과했다는 점이 밝혀졌습니다. 또한, Anthropic 팀은 Thorn의 아동 안전 전문가로부터 피드백을 받아 Claude 3.5 Sonnet 모델을 미세 조정하고 분류기를 업데이트했다고 전해집니다.

이용 금액 및 방법

클로드 3.5 소네트 모델은 클로드.ai와 클로드 iOS 앱을 통해 무료로 이용할 수 있지만, 클로드 프로 및 팀 요금제를 사용하는 사용자에게는 더 높은 요금 한도를 제공합니다. 클로드 3.5 소네트( API )는 입력 토큰 100만 개당 3달러, 출력 토큰 100만 개당 15달러를 청구합니다.

Claude 3.5 소네트 모델은 Claude.ai, Claude iOS 앱, Anthropic API, TextCortex, Amazon Bedrock 및 Google Cloud의 Vertex를 통해 액세스할 수 있습니다. Claude Pro 이상의 요금제를 사용 중인 경우 원하는 대로 Claude 3.5 Sonnet 모델을 체험하고 해당 기능을 활용할 수 있습니다.

클로드 3.5 소네트 모델에 액세스하는 대화형 고급 방법은 ZenoChat( TextCortex)을 통해 체험하는 것입니다. ZenoChat을 사용하면 클로드 3.5 소네트를 포함한 최첨단 LLM을 사용하여 다양한 기능과 사용자 지정 옵션으로 결과물을 생성할 수 있습니다. 따라서 각기 다른 강점을 가진 LLM을 활용하여 특정 작업을 완료하고 ZenoChat을 최대한 효율적으로 사용할 수 있습니다.

새로운 기능: 아티팩트

앤트로픽은 2024년 6월 21일에 새로운 모델과 함께 '아티팩트(Artifacts)'라는 기능도 선보였습니다.

아티팩트란 웹에서 클로드가 생성한 콘텐츠를 프로젝트와 작업 절차에 원활하게 통합할 수 있도록 지원하는 일종의 작업 공간입니다. 사용자들은 아티팩트를 통해 클로드가 생성한 결과물을 실시간으로 확인하면서 편집, 구축할 수 있습니다. 예를 들어, 클로드가 이메일을 작성해 주면, 아티팩트를 통해 확인하고 해당 이메일을 텍스트 편집기로 복사하지 않고 클로드 앱 내에서 직접 수정할 수 있습니다. 또 클로드가 코드를 생성해 주면, 아티팩트에서 실행 결과를 확인하고 클로드 앱 내에서 직접 수정할 수 있는 것입니다.

과거에는 AI가 출력하는 결과물만 받아 들었지만, 이제는 사용자가 그 과정을 옆에서 보고 조정할 수 있게 된 겁니다. 이는 사용자와 AI 간의 격차를 줄이고, AI 작동에 관여할 수 있는 중요한 수단으로 꼽히고 있습니다. 아티팩트는 일종의 인간과 AI의 '협업 공간'인 셈입니다.

Claude 3.5 Sonnet for vision

기대효과

클로드 3.5 소네트는 이미지 인식 능력을 갖춘 멀티 모달 모델로, 불완전한 이미지에서 텍스트를 정확하게 전사할 수 있어 텍스트보다 이미지, 그래픽, 일러스트레이션에서 더 많은 정보를 얻을 수 있는 소매, 물류, 금융 서비스 등의 분야에서 핵심 기능으로 활용될 수 있습니다.

앤트로픽은 클로드 3.5 소네트를 통해 인공지능 언어 모델의 새로운 기준을 제시하고, 다양한 분야에서 더욱 효율적이고 창의적인 작업을 가능하게 할 것으로 기대됩니다. 벤처비트는 그동안 오픈AI와 구글이 첨단 모델의 성능 경쟁에 매달린 사이, 앤트로픽은 AI의 유용성과 사용자 경험에 초점을 맞췄다고 긍정적인 평가를 했습니다.

Reference

- 클로드 3.5 소네트 리뷰(성능 및 벤치마크)

- 앤트로픽 '클로드 3.5 소네트' 출시... 'GPT-4o' 제치고 최강 모델 탈환

대학생 인공지능 연합 동아리 Prometheus

2024년 6월 28일

Editor : 김민지