「AI搜索」测评基准首期榜单发布!4o领先幅度小,国内大模型表现亮眼,共5大基础11大场景14大模型

Die erste Liste der "AI Search"-Evaluierungsbenchmarks wurde veröffentlicht! Der Vorsprung von 4o ist gering, und die großen einheimischen Modelle schneiden hervorragend ab, mit insgesamt 5 Basen, 11 Szenarien und 14 Modellen.

中文大模型「AI搜索」(SuperCLUE-AISearch)基准测评发布,皆在深入评估大模型结合搜索的能力。该测评不仅关注大模型的基础能力,还重点考察其在场景应用的表现。测评内容涵盖了5个基础能力如...
vor 7 Monaten
01.2K0