앤쓰로픽(Anthropic) 가장 최신 Ai 모델 토토사이트 세션3.5 소넷(Sonnet)에 대한 성능을 소넷 공식 페이지에 있는 내용으로 정리했다.

클로드(Claude) 3.5 모델 제품군의 첫 번째 제품인 Claude 3.5 소넷(Sonnet)을 출시했다. 클로드 3.5 소넷는 다양한 평가에서 경쟁 모델과 클로드3 오퍼스(Opus)를 능가하는 성능을 보였다. Claude 3.5 Sonnet은 현재 Claude.ai와 Claude iOS 앱에서 무료로 사용할 수 있다. 클로드 프로와 팀 요금제 가입자는 훨씬 더 높은 요금 한도로 이용할 수 있다. Anthropic API, Amazon Bedrock, Google Cloud의 Vertex AI를 통해서도 이용할 수 있다. 이 모델의 비용은 입력 토큰 100만 개당 3달러, 출력 토큰 100만 개당 15달러이며, 토큰 컨텍스트 창은 200만 개다.

2배 더 빠른 처리 속도
Claude 3.5 Sonnet은 대학원 수준의 추론 능력(GPQA), 학부 수준의 지식(MMLU), 코딩 능력(HumanEval)에 대한 새로운 벤치마크를 기록했다. 뉘앙스, 유머, 복잡한 지침을 파악하는 능력이 현저히 향상되었으며 자연스럽고 공감할 수 있는 어조로 고품질 콘텐츠를 작성하는데 탁월하다.
Claude 3.5 Sonnet은 Claude 3 Opus보다 두 배 빠른 속도로 실행된다. 성능 향상과 비용 효율적인 가격이 결합된 Claude 3.5 Sonnet은 상황에 민감한 고객 지원과 다단계 워크플로 오케스트레이션과 같은 복잡한 작업에 적합하다.
내부 에이전트 코딩 평가에서 클로드3.5 소넷은 64%의 문제를 해결하여 38%를 해결한 클로드 3 오퍼스보다 뛰어난 성능을 보였다. 이 평가는 원하는 개선 사항에 대한 자연어 설명이 주어졌을 때 오픈 소스 코드베이스에 버그를 수정하거나 기능을 추가하는 모델의 능력을 테스트한다. 관련 도구가 제공되고 지시를 받으면 클로드3.5 소넷은 정교한 추론과 문제 해결 기능을 통해 독립적으로 코드를 작성, 편집, 실행할 수 있다. 코드 번역을 쉽게 처리할 수 있어 레거시 애플리케이션 업데이트와 코드베이스 마이그레이션에 특히 효과적이다.

최고의 비전 기능
클로드 3.5 소넷은 표준 비전 벤치마크에서 클로드 3 오퍼스를 능가하는 강력한 비전 모델이다. 차트와 그래프 해석과 같이 시각적 추론이 필요한 작업에서 강점을 나타낸다. 클로드 3.5 소넷은 불완전한 이미지에서 텍스트를 정확하게 전사(transcribe)할 수 있으며 이는 Ai가 텍스트보다 이미지, 그래픽 또는 일러스트레이션에서 더 많은 인사이트를 얻을 수 있는 소매, 물류, 금융 서비스의 핵심 기능이 될 것이다.

아티팩트(Artifacts) - 클로드를 이용하는 새로운 방법
이용자가 클로드와 상호작용할 수 있는 새로운 방법인 아티팩트(Artifacts)도 출시했다. 이용자가 코드 스니펫, 텍스트 문서, 웹사이트 디자인과 같은 콘텐츠를 생성하도록 클로드에게 요청하면 아티팩트가 대화와 함께 오른쪽 전용 창에 표시된다.
이용자는 토토사이트 세션의 창작물을 실시간으로 보고, 편집하고, 구축할 수 있는 역동적인 작업 공간을 만들어 Ai가 생성한 콘텐츠를 프로젝트와 워크플로우에 원활하게 통합할 수 있다.
이 미리보기 기능은 대화형 Ai에서 협업 업무 환경으로 진화하는 클로드의 진화를 보여준다. 팀 협업을 지원하도록 확장될 Claude.ai의 더 넓은 비전의 시작이다. 가까운 미래에는 팀과 조직 전체가 하나의 공유 공간에서 지식, 문서, 진행 중인 작업을 안전하게 중앙집중화할 수 있게 될 것이며 클로드는 온디맨드 팀원(on-demand teammate) 역할을 하게 될 것이다.
앞으로의 계획
앞으로 몇 개월마다 지능, 속도, 비용 간의 트레이드오프 곡선을 크게 개선할 것이다. 클로드3.5 모델 제품군을 완성하기 위해 2024년 말에는 Claude 3.5 Haiku와 Claude 3.5 Opus를 출시할 예정이다.
차세대 모델 제품군을 개발하는 것 외에도 기업용 애플리케이션과의 통합을 포함해 더 많은 비즈니스 활용 사례를 지원하기 위한 새로운 양식과 기능을 개발하고 있다. 이용자의 선호도와 상호 작용 기록을 기억하여 더욱 개인화되고 효율적인 경험을 제공하는 메모리와 같은 기능도 연구하고 있다.
"카카오톡 오픈채팅에 참여하시면 최신 소식과 자료를 받아보실 수 있습니다. (참여하기)"press@trendw.kr