오픈 소스 멀티모달 기능의 또 다른 업그레이드, Mistral AI, Small 3.1 모델 출시

665 0

미스트랄 AI 최근 최신 모델 출시를 발표했습니다. 미스트랄 Small 3.1을 소개하며 동급 모델 중 최고의 선택이라고 주장했습니다.

이 새로운 모델은 텍스트 성능, 멀티모달 이해, 컨텍스트 처리가 크게 개선된 Mistral Small 3를 기반으로 하며, 128k 토큰까지 확장되는 컨텍스트 창을 제공합니다.공식 Mistral AI 데이터에 따르면 Small 3.1은 다음과 같은 비교 가능한 모델보다 성능이 뛰어납니다. 젬마 3 및 GPT-4o Mini는 초당 150을 유지하면서 토큰 추론의 속도.

미스트랄 스몰 3.1의 가장 큰 특징 중 하나는 아파치 2.0 오픈 소스 라이선스를 채택하여 모델을 더 널리 사용하고 연구할 수 있게 되었다는 점입니다.

최신 AI 애플리케이션은 모델 기능에 대한 요구가 점점 더 커지고 있으며, 모델에 텍스트 처리, 다중 모드 입력 이해, 다중 언어 지원, 긴 컨텍스트 관리, 짧은 지연 시간과 비용 효율성이 요구되고 있습니다. Mistral AI는 Mistral Small 3.1이 이러한 모든 측면에서 주요 폐쇄 소스 소형 모델의 성능을 충족하거나 능가하는 최초의 오픈 소스 모델이라고 생각합니다. 오픈 소스 모델.

미스트랄 AI가 발표한 성능 데이터에 따르면, 미스트랄 스몰 3.1은 여러 벤치마크 테스트에서 우수한 성능을 보였습니다. 데이터 비교 가능성을 보장하기 위해 미스트랄 AI는 가능한 경우 다른 공급업체에서 보고한 수치를 사용했으며, 그렇지 않은 경우 일반 평가 도구를 통해 모델을 평가했습니다.

지침 준수 성능

텍스트 명령 벤치마킹

아래는 미스트랄 스몰 3.1의 텍스트 입력 성능을 젬마 3-it(27B), 코히어 아야-비전(32B), GPT-4o 미니, 클로드 3.5 하이쿠 등 다른 모델과 비교한 것입니다.

성능 데이터 표

멀티모달 인스트럭션 벤치마킹

아래는 멀티모달 명령 벤치마크의 결과이며, MM-MT-Bench는 0에서 100 사이로 조정되었습니다. 비교에 포함된 모델은 Gemma 3-it(27B), Cohere Aya-Vision(32B), GPT-4o Mini 및 Claude-3.5 Haiku입니다.

성능 데이터 표

다국어 지원

미스트랄 스몰 3.1은 다국어 처리에서도 강점을 보여줬는데, Gemma 3-it(27B), Cohere Aya-Vision(32B), GPT-4o Mini와 같은 모델과 비교했을 때에도 마찬가지입니다.

성능 데이터 표

긴 컨텍스트 처리 기능

긴 문맥 처리를 위해 미스트랄 스몰 3.1은 긴 텍스트 처리 성능을 검증하기 위해 Gemma 3-it(27B), GPT-4o Mini, Claude-3.5 하이쿠와 비교했습니다.

성능 데이터 표

사전 교육 성과

미스트랄 AI는 미스트랄 스몰 3.1을 위한 사전 학습된 기본 모델도 출시했습니다.

모든 사전 교육 데이터

훈련 전 성능을 위해 미스트랄 스몰 3.1 베이스(24B)를 젬마 3pt(27B)와 비교했습니다.

성능 데이터 표

애플리케이션 시나리오

미스트랄 스몰 3.1은 명령 팔로잉, 대화 지원, 이미지 이해, 함수 호출 등 광범위한 생성 AI 작업을 처리하도록 설계된 다목적 모델로 자리매김하고 있으며, 미스트랄 AI는 이 제품이 기업 및 소비자 AI 애플리케이션 모두를 위한 견고한 기반을 마련한다고 믿습니다.

주요 속성 및 기능

가벼움. 미스트랄 스몰 3.1은 단일 RTX 4090 그래픽 카드 또는 32GB RAM이 장착된 Mac 기기에서 실행됩니다. 따라서 디바이스 측면 시나리오에 이상적입니다.
빠른 응답 대화 지원. 빠르고 정확한 응답이 필요한 가상 비서 및 기타 애플리케이션에 이상적입니다.
지연 시간이 짧은 함수 호출. 자동화 또는 상담원 워크플로우에서 기능을 빠르게 실행할 수 있습니다.
특정 영역에 대한 미세 조정. 미스트랄 스몰 3.1은 특정 도메인에 맞게 미세 조정하여 전문화된 도메인의 정확한 모델을 생성할 수 있습니다. 이는 법률 상담, 의료 진단 및 기술 지원과 같은 영역에서 특히 유용합니다.
고급 추론의 기초. 미스트랄 AI는 오픈 소스 미스트랄 모델을 기반으로 구축하는 커뮤니티의 역량이 인상적이라고 말합니다. 지난 몇 주 동안 Mistral Small 3를 기반으로 구축된 다음과 같은 훌륭한 추론 모델이 등장했습니다. DeepHermes 24B.. 이를 위해 미스트랄 AI는 미스트랄 스몰 3.1의 기본 모델과 명령 모델 체크포인트를 출시하여 모델의 다운스트림 커스터마이징을 더욱 지원하게 되었습니다.

미스트랄 스몰 3.1은 문서 검증, 진단, 디바이스 측 이미지 처리, 품질 검사를 위한 육안 검사, 보안 시스템의 물체 감지, 이미지 기반 고객 지원, 일반 비서 등 멀티 모달 이해가 필요한 기업 및 소비자 애플리케이션을 아우르는 광범위한 애플리케이션 시나리오를 제공합니다.

사용성

미스트랄 스몰 3.1은 허깅 페이스 웹사이트에서 다운로드할 수 있습니다:미스트랄 스몰 3.1 베이스 노래로 응답 미스트랄 스몰 3.1 인스트럭트. 프라이빗하고 최적화된 추론 인프라가 필요한 엔터프라이즈 배포의 경우, Mistral AI에 문의하세요.

사용자는 미스트랄 AI의 개발자 플랫폼을 사용하여 다음과 같은 작업을 수행할 수 있습니다. 라 플레이트폼 API 호출을 사용해 보세요. 미스트랄 스몰 3.1은 향후 몇 주 내에 NVIDIA NIM 및 Microsoft Azure AI Foundry에 출시될 예정입니다.