DeepSeek:被媒体忽视的问题

DeepSeek: ignored by the media

特邀撰稿人 Lennart Heim 和 Sihao Huang,本文交叉发布于 Lennart 的个人博客。Lennart 是 ChinaTalk 的常客,最近曾参与关于测试时计算时代的地缘政治的讨...
4mos ago
07190
LLM 蒸馏:一场关于大模型独立性的“暗战”?

LLM distillation: a "dark war" on the independence of large models?

一、背景与挑战 随着人工智能技术的飞速发展,大型语言模型(LLM)已成为自然语言处理领域的核心驱动力。然而,训练这些模型需要巨大的计算资源和时间成本,这促使了 知识蒸馏(KD)技术的兴起。知识蒸馏通过...
4mos ago
07490