导演:余昌叶
《大模型算法:强化学习、微调与对齐》系统地讲解了大模型技术、训练算法(包括强化学习、RLHF、PPO、GRPO、DPO、SFT与CoT蒸馏等)、多种效果优化措施及其实践。全书以大语言模型(LLM)为核心,内容广泛且深入,绝大部分同样适用于视觉语言模型(VLM)和多模态语言模型(MLLM)。本书适合AI算法与工程领域的从业者、相关专业的学生,以及希望深入了解大模型技术、且具备一定AI基础的读者阅读。 本书特色: 【1】原创巨献 100+ 全彩架构图,深入浅出,直击算法核心。 【2】由企业一线资深算法工程师撰写,融入了企业级实践经验,深度契合大厂所用所需。 【3】多次进入京东AI图书榜 Top 5,行业力作。 【4】研发与面试利器,大模型算法、强化学习一网打尽。