新書推薦:
《
罗马政治观念中的自由
》
售價:HK$
50.4
《
中国王朝内争实录:宠位厮杀
》
售價:HK$
61.6
《
凡事发生皆有利于我(这是一本读了之后会让人运气变好的书”治愈无数读者的心理自助经典)
》
售價:HK$
44.6
《
未来特工局
》
售價:HK$
55.8
《
高术莫用(十周年纪念版 逝去的武林续篇 薛颠传世之作 武学尊师李仲轩家世 凸显京津地区一支世家的百年沉浮)
》
售價:HK$
54.9
《
英国简史(刘金源教授作品)
》
售價:HK$
98.6
《
便宜货:廉价商品与美国消费社会的形成
》
售價:HK$
77.3
《
读书是一辈子的事(2024年新版)
》
售價:HK$
77.3
|
編輯推薦: |
1. 本书行文逻辑清晰,通俗易懂??深度学习算法包含很多繁杂的公式,为了便于读者理解本书内容,提高学习效率,本书重点不是推导理论,而是用通俗浅显的语言把道理阐明,帮助读者建立直觉。用通俗的语言对复杂模型进行解读,为读者在这个领域的进一步深入研究抛砖引玉。
2. 本书每一章节均附有课后习题,以便适时检验读者的学习效果,提高学习效率??为了便于读者理解本书内容,提高学习效率,专门在每一章后面附了练习题,读者在读完本章节内容之后,做一下课后练习题,以检验学习效果。这些课后习题答案和本书涉及的源代码一起收录于附赠资源中。
3. 行文和结构连贯??采取读者第一视角的模式来组织行文逻辑和实现方案,使得行文和结构更连贯,便于理解。4. 实际案例解析,注重实战演练??以通俗易懂的文字,解释了自然语言处理技术的基本原理,对常见算法架构进行介绍, 对本书的主要内容BERT 模型进行详细的讲解,分别从不同的难度等级展示了两个实战案例, 将理论和实践有机地结合在一起。
5. 编程思想及经验分享,提升你的编程能力??在案例讲解中,融入了编程思想及经验的分享。“不只是学习技术,重要的是在思想上能有所提升”,
|
內容簡介: |
本书用简单、通俗、易懂的语言对BERT相关的自然语言处理技术进行描述,从原理、架构、实现等多维度解读BERT 模型,并展示不同层面的实战案例,通过将理论和实践相结合, 使读者能够在对模型充分理解的基础上,运用模型解决实际任务。本书适合于自然语言处理初学者以及语言类大学的信息科学专业学生,不仅可作为拓展阅读的材料,还可作为立志从事自然语言处理方向研究人员的入门参考书。?
|
關於作者: |
陈之炎曾供职于长城电脑和大唐微电子等知名企业;参与过智能化翻译教学系统等大型项目的研发工作;长期担任清华数据派和大数据文摘等公众号的特约供稿者,发表过近20万字的有关人工智能和大数据的译作,作品被CSDN 、知乎等多个专业知识共享平台所转载。?
|
內容試閱:
|
■ 为什么要写这本书
??2020 年的晚秋,当出版社编辑联络到我,问我有没有兴趣写一本自然语言处理方面的书时,我欣然应允。于是选题接洽,经过深思熟虑之后决定选取 BERT 这个方向。
??BERT 的全称是基于变换器的双向编码器表示技术,它是一种基于深度学习的新型自然语言处理模型。BERT 提出了一种新的预训练目标:屏蔽字语言模型(MLM)与从左到右的单向语言模型预训练不同,MLM 目标允许表征融合左右两侧的语义,从而预训练一个深度双向 Transformer。BERT 一经问世,便有了不俗的表现,在机器阅读理解水平测试中,它在各项衡量指标上超越了人类,还在 11 种不同 NLP 测试中创出最佳成绩。BERT 为 NLP 带来了里程碑式的改变,也是 NLP 领域发展过程中一大进展。BERT 从诞生到现在,得到了广泛的应用,它在屏蔽词预测、关键词提取、下一句预测等多种自然语言处理任务中均有不俗的表现,因为 BERT 代表了 NLP 新技术,具有一定的先进性,所以我选定它来作为本书的主题。
??写这本书的初衷:用简单、通俗、易懂的语言对 BERT 相关的自然语言处理技术进行描述,从原理、架构、实现等多维度解读BERT 模型,并展示由浅到深不同层面的实战案例, 通过将理论和实践相结合,使读者能够在对模型充分理解的基础上,运用模型解决实际任务。
写这本书的第二个理由是对自己30 年工作做一个适时的总结。我是一名电子信息工程师,
在过去的 30 年工作中,分别在长城计算机软件与系统公司、大唐微电子、北京吾译超群科技有限公司担任研发工程师,曾经参与过“智能化翻译教学系统”等项目的研发工作,在自然语言处理等方面精耕细作,这次有机会来写 BERT,可以对这一新技术做一个系统的梳理和解读,并呈现给大家,并和大家分享。
如果你下定决心要去干一件事,到底需要几个理由?一个就够了,接下来,撸起袖子加油干!
■ 本书有什么特色
1. 本书行文逻辑清晰,通俗易懂
??深度学习算法包含很多繁杂的公式,为了便于读者理解本书内容,提高学习效率,本书重点不是推导理论,而是用通俗浅显的语言把道理阐明,帮助读者建立直觉。用通俗的语言对复杂模型进行解读,为读者在这个领域的进一步深入研究抛砖引玉。
2. 本书每一章节均附有课后习题,以便适时检验读者的学习效果,提高学习效率
??为了便于读者理解本书内容,提高学习效率,专门在每一章后面附了练习题,读者在读完本章节内容之后,做一下课后练习题,以检验学习效果。这些课后习题答案和本书涉及的源代码一起收录于附赠资源中。
3. 行文和结构连贯
??采取读者第一视角的模式来组织行文逻辑和实现方案,使得行文和结构更连贯,便于理解。
4. 实际案例解析,注重实战演练
??以通俗易懂的文字,解释了自然语言处理技术的基本原理,对常见算法架构进行介绍, 对本书的主要内容BERT 模型进行详细的讲解,分别从不同的难度等级展示了两个实战案例, 将理论和实践有机地结合在一起。
5. 编程思想及经验分享,提升你的编程能力
??在案例讲解中,融入了编程思想及经验的分享。“不只是学习技术,重要的是在思想上能有所提升”,希望让你在学习技术的同时,潜移默化中,能够加深对一些编程思想的认识。
■ 本书内容及知识体系
第一篇 自然语言处理基础
??本篇由第 1 ~ 3 章内容组成,对自然语言处理技术、掌握该技术需要的预备知识和文本的表示技术进行了解释。
第二篇 自然语言处理中的深度学习算法
??本篇包含第 4 ~ 5 章,第 4 章自然语言处理和深度学习介绍了常用的模型 ;第 5 章重点介绍了 BERT 模型。
第三篇 实战案例
本篇包含 6 ~ 7 章,分别从由浅到深的不同层面展示了两个实战案例。第四篇 结语和展望 (第 8 章)
■ 数据资源内容介绍
为了方便读者阅读本书,本书附赠以下资源。具体如下:
? 本书实例的源代码;
? 本书课后习题答案;
? BERT 模型数据集。
■ 适合阅读本书的读者
? 自然语言处理初学者;
? 语言类大学的信息科学专业的学生;
? 立志从事自然语言处理方向研究的学生;
? 计算机相关专业的学生;
? 软件开发项目经理。
■ 阅读本书的建议
? 没有自然语言处理基础的读者,建议从第 1 章按顺序阅读,读完前四章之后,对自然语言处理的背景知识便有了一定了解。在此基础上,阅读后续章节,第 5 章是本书的重点。有一定自然语言处理基础的读者,可以根据实际情况,选择感兴趣的章节进行针对性阅读。本书为不同的读者准备了两个不同层面的实战案例,读者可以根据自己的实际情况和认知程度,有选择地阅读。如果有志从事这一领域的工作或者深入研究,则应掌握第 6 ~ 7 章的全部内容,如果条件允许,最好实际动手实现文中案例。在实际演练过程中如果遇到任何问题,可以按照书上提供的联络方式找作者答疑。
?
前 言 III
? 对于书中提到的拓展参考资料,建议高水平读者进行拓展。自然语言处理是一个庞大的知识体系,本书涉猎的课题只是冰山一角,想在这一领域深耕细作的读者,还需大量阅读相关资料。
? 带着疑问去阅读,不仅是指你阅读之前要明确解决的问题(阅读目的),而且在阅读过程中,也要多反问自己:这是最好的实现方案吗?是否有其他更简便的实现方式?……通过不断自我提问,你的思维将会不断被打开,也能从中收获更多。
??本书是作者 30 年宝贵工作经验的结晶,通过本书,将自然语言处理这一华丽的水晶宫殿呈现给大家,为大家讲述宫殿中一颗璀璨的明珠——BERT 的前世今生,并指导大家如何将 BERT 这颗明珠镶嵌成皇冠、项链,或是一枚别致的胸针(实战示例),为大家在自然语言处理领域进一步深耕细作抛砖引玉。来吧,让我们开始 BERT 之旅吧!
由于作者水平有限,书中难免存在一些错误和疏漏,欢迎读者发现问题进行反馈。
■ 鸣谢
本书的完成首先感谢生命,感谢给予我生命之源的父母。
其次,感谢中国铁道出版社有限公司的编辑,没有这些编辑慧眼识珠,就没有此书对
BERT 这颗明珠做细致梳理的机会,他们在选题和全书架构方面提出了许多建设性的建议, 在写作过程中给予了许多鼓励和支持,此书得以按时交稿,得益于他们的大力支持,在此表示衷心的感谢。
在此书的写作过程中,卢苗苗老师为第4 章提供了参考资料,清华大学电子工程系汪致庸
同学为第 5 章的内容提供了参考资料,在此表示衷心感谢。
??最后,感谢热心读者拨冗垂阅,谢谢你们的热心阅读,希望读完此书后有所收获,再一次谢谢大家。
|
|