导演:杰伊·阿拉马尔
本书以通俗易懂、大量图解的方式剖析了DeepSeek的底层技术。 全书分为3章和附录,第1章详细分析推理大模型的范式转变,即从“训练时计算”到“测试时计算”;第2章解读DeepSeek-R1的架构——混合专家(MoE),第3章展示DeepSeek-R1详细的训练过程及核心技术,涵盖基于GRPO的强化学习等;附录分享DeepSeek开源周活动。 本书适合大模型从业人员和对大模型底层技术感兴趣的读者。书中通过丰富的图解将复杂的技术解释得简单、清晰、通透,是学习大模型技术难得一见的参考书。 编辑推荐 1.【短小精悍】2小时搞懂DeepSeek底层技术 2.【通俗图解】近120幅全彩插图通俗解读,不枯燥 3.【内容系统】从推理模型原理到DeepSeek-R1训练 4.【作者资深】大模型领域知名专家Jay & Maarten作品 5.【图解系列】袋鼠书《图解大...(展开全部)