MathCLUE:DeepSeek R1挑战「全国高中数学竞赛」,成绩大幅超越o1

MathCLUE : DeepSeek R1 défie la " Compétition nationale de mathématiques des lycées " et surpasse largement o1

Introduction à MathCLUE "Concours national de mathématiques pour les lycées" : évaluation approfondie des capacités de raisonnement mathématique au niveau du concours dans des modèles de grande taille. Le système d'évaluation couvre un certain nombre de dimensions représentatives des mathématiques au lycée, notamment la géométrie, l'algèbre et les statistiques de probabilité. Modèle d'évaluation : DeepSeek-R1 (consulté sur : chat.d...
Il y a 4 mois
07250
Claude 3.7 Sonnet 系统评估报告(中文版)

Claude 3.7 Rapport d'évaluation du système Sonnet (version chinoise)

Résumé Cette fiche système présente Claude 3.7 Sonnet, un modèle d'inférence hybride. Nous nous concentrons sur les mesures visant à réduire les dommages par le biais de la formation au modèle et de l'utilisation de systèmes et d'évaluations de sécurité environnants. Nous effectuons un examen approfondi basé sur la Politique d'extension responsable [1]...
Il y a 4 mois
07230
端脑云 DeepSeek 大语言模型免费试用,私域大模型服务器预装满血版 DeepSeek R1!

Endbrain Cloud DeepSeek Big Language Models Free Trial, Private Domain Big Model Server preloaded with full-blooded version of DeepSeek R1 !

À l'ère du numérique, la technologie de l'intelligence artificielle modifie notre mode de vie et de travail à un rythme sans précédent. Dans le domaine de l'intelligence artificielle, les Big Language Models de DeepSeek deviennent rapidement le centre d'intérêt de l'industrie en raison de leurs performances exceptionnelles et de leur innovation. Endbrain Cloud propose désormais le modèle DeepSeek...
Il y a 4 mois
07180
百川智能发布Baichuan-Omni-1.5全模态大模型,多项测评超越GPT-4o Mini

Baichuan Intelligence publie le grand modèle omnimodal Baichuan-Omni-1.5, qui surpasse le GPT-4o Mini dans plusieurs mesures.

Vers la fin de l'année, le secteur des grands modèles nationaux diffuse à nouveau de bonnes nouvelles. Baichuan Intelligence a récemment publié un certain nombre de produits de grands modèles de manière intensive, après le modèle d'inférence profonde de la scène complète Baichuan-M1-preview et le modèle open source médical augmenté Baichuan-M1-14B, et a ensuite relancé le modèle...
Il y a 4 mois
07160
研究表明:RL 在学习可泛化知识方面优于 SFT,尤其在多模态任务中展现出更强的推理与视觉识别能力

Il est démontré que:RL surpasse SFT dans l'apprentissage de connaissances généralisables, en particulier dans les tâches multimodales, montrant des capacités de raisonnement et de reconnaissance visuelle plus fortes.

INTRODUCTION Dans le domaine de l'intelligence artificielle (IA), les modèles fondamentaux (par exemple, les modèles linguistiques à grande échelle et les modèles linguistiques visuels) sont devenus un moteur essentiel du progrès technologique. Cependant, la manière d'améliorer efficacement la capacité de généralisation de ces modèles afin qu'ils puissent s'adapter à une variété de scénarios complexes et changeants du monde réel reste un défi majeur. Actuellement, les modèles ...
Il y a 4 mois
07090
OpenAI 放大招,要用 AI 硬件革了智能手机的命!

OpenAI s'apprête à révolutionner les smartphones avec du matériel d'IA !

Souvenez-vous, en 2007, Steve Jobs a fait décoller du ciel l'iPhone de première génération et a ouvert une nouvelle ère pour les smartphones. Plus de dix ans ont passé, bien que le smartphone devienne de plus en plus puissant, il semble avoir atteint le goulot d'étranglement de l'innovation. Alors que tout le monde se lamente sur le fait que "la technologie est basée sur le changement de coque", Op...
Il y a 4 mois
06990
文心智能体上线“赞赏”组件,依托百度分发流量躺平赚钱

Wenxin Intelligent Body online "appreciation" component, relying on Baidu to distribute traffic lying flat to make money.

J'ai reçu la nouvelle ce matin : une nouvelle façon de jouer aux affaires ! Invitation à tester le composant d'appréciation ! Félicitations, vous avez l'opportunité de tester le composant d'appréciation ! La clé de l'ouverture peut être gagnée ! Au début de l'année dernière, le Chief AI Sharing Circle a présenté la plateforme Wenxin Intelligent Body, et a partagé en même temps une sorte de compétences d'attraction Wenxin Intelligent Body....
il y a 5 mois
06950
Anthropic 发布规则分类器:有效防御大语言模型越狱攻击,参与测试领奖金!

Anthropic Releases Rule Classifier : une défense efficace contre les attaques de type "Jailbreak" sur les grands modèles de langage, participez aux tests pour obtenir des bonus !

Avec le développement rapide de la technologie de l'IA, les grands modèles de langage (LLM) changent nos vies à un rythme sans précédent. Cependant, les avancées technologiques entraînent également de nouveaux défis : les LLM peuvent être exploités à des fins malveillantes, en divulguant des informations nuisibles ou même en étant utilisés pour créer des armes chimiques, biologiques, radiologiques et nucléaires...
Il y a 4 mois
06940
你的专属数字人?六大开源数字人方案终极PK:效果对比一目了然!

Votre personne numérique exclusive ? L'ultime PK de six solutions open source de personne numérique : une comparaison des résultats en un coup d'œil !

Récemment, dans le cercle de l'IA, la technologie de l'humain numérique est vraiment en pleine effervescence, toutes sortes de solutions d'humain numérique "open source et les plus fortes" sont sans fin, éblouissant les gens. Bien que l'auteur ait également partagé un certain nombre de progiciels d'intégration de l'humain numérique, face à tant de choix, nous nous sentirons inévitablement confus, ne sachant pas quel est le plus approprié...
Il y a 4 mois
06910
OpenAI CEO 展望 AGI 经济学:三大观察揭示未来十年颠覆性变革

Le PDG d'OpenAI se penche sur l'économie de l'AGI : trois observations qui révèlent des changements perturbateurs au cours de la prochaine décennie

Par Sam Altman, PDG de l'OpenAI La mission de l'OpenAI est de veiller à ce que l'intelligence artificielle générale (AGI) profite à l'ensemble de l'humanité. L'OpenAI estime que des systèmes menant à l'AGI sont en train d'émerger, et qu'il est donc essentiel de comprendre le moment dans lequel nous nous trouvons...
Il y a 4 mois
06910