「AI搜索」测评基准首期榜单发布!4o领先幅度小,国内大模型表现亮眼,共5大基础11大场景14大模型

A primeira lista de benchmarks de avaliação do "AI Search" foi lançada! A margem de liderança da 4o é pequena, e os grandes modelos domésticos têm um desempenho brilhante, com um total de 5 bases, 11 cenários e 14 modelos.

中文大模型「AI搜索」(SuperCLUE-AISearch)基准测评发布,皆在深入评估大模型结合搜索的能力。该测评不仅关注大模型的基础能力,还重点考察其在场景应用的表现。测评内容涵盖了5个基础能力如...
7 meses atrás
01.2K0