《大语言模型》作者：赵鑫，李军毅，周昆，唐天一，文继荣【PDF】

test233 · 发表于 2025-3-9 22:42

作品简介：

为了更好地普及和传播大模型技术的最新进展与技术体系，我们于2023年3月发表了大语言模型英文综述文章《A Survey of Large Language Models》，并不断进行更新完善，目前已经更新至第14个版本，95页正文1064个参考文献。自英文综述文章上线后，陆续有读者询问该英文综述文章是否有对应的中文版本。为此，我们于2023年8月发布了该综述（v10）的中文翻译版。2023年12月底，为了更好地提供大模型技术的中文参考资料，我们启动了中文书的编写工作，并且于2024年4月完成初稿，经过历时5个月的后续修正与完善，这本书终于出版了。与英文综述文章的定位不同，本书更关注为大模型初学者提供整体的技术讲解，为此我们在内容上进行了大范围的更新与重组，力图展现一个系统的大模型技术框架和路线图。本书适用于具有深度学习基础的读者阅读，可以作为一本基础的大模型参考书籍。在准备中文书的过程中，我们广泛阅读了现有的经典论文、相关代码和学术教材，从中提炼出核心概念、算法与模型，并进行了系统性的组织与讲解。我们对于每个章节的内容初稿都进行了多次修正，力求表达的清晰性与准确性。然而在图书编写过程中，我们深感自身能力与知识的局限性，尽管已经付出了巨大的努力，但仍难免会有遗漏或不足之处。本书的出版仅是一个起点，我们将编写此书的过程也作为一个自身的学习过程，希望能够通过本书与读者进行深入交流，向更多的行业同行学习，欢迎大家为这本书提出宝贵的指导建议。

DDFF-99889（2） · 发表于 2025-3-16 08:52

专业书籍，应该不错，谢谢分享。

		自动登录	找回密码
密码			立即注册

[科技、报告] 《大语言模型》作者：赵鑫，李军毅，周昆，唐天一，文继荣【PDF】

本帖子中包含更多资源

评分

浏览过的版块

[科技、报告] 《大语言模型》作者：赵鑫，李军毅，周昆，唐天一，文继荣 【PDF】

本帖子中包含更多资源

评分

浏览过的版块

[科技、报告] 《大语言模型》作者：赵鑫，李军毅，周昆，唐天一，文继荣【PDF】