Daniel Jurafsky现任斯坦福大学语言学系和计算机科学系副教授。在此之前,他曾在博尔德的科罗拉多大学语言学系、计算机科学系和认知科学研究所任职。他出生于纽约州的Yonkers,1983年获语言学学士,1992年获计算机科学博士,两个学位都在伯克利加利福尼亚大学获得。他于1998年获得美国国家基金会CAREER奖,2002年获得Mac-Arthur奖。他发表过90多篇论文,内容涉及语音和语音处理的广泛领域。James H. Martin现任博尔德的科罗拉多大学语言学系、计算机科学系教授,认知科学研究所研究员。他出生于纽约市,1981年获可伦比亚大学计算机科学学士,1988年获伯克利加利福尼亚大学计算机科学博士。他写过70多篇关于计算机科学的论著,出版过《隐喻解释的计算机模型》(A Computational Model of Metaphor Interpretation)一书。Daniel Jurafsky现任斯坦福大学语言学系和计算机科学系副教授。在此之前,他曾在博尔德的科罗拉多大学语言学系、计算机科学系和认知科学研究所任职。他出生于纽约州的Yonkers,1983年获语言学学士,1992年获计算机科学博士,两个学位都在伯克利加利福尼亚大学获得。他于1998年获得美国国家基金会CAREER奖,2002年获得Mac-Arthur奖。他发表过90多篇论文,内容涉及语音和语音处理的广泛领域。James H. Martin现任博尔德的科罗拉多大学语言学系、计算机科学系教授,认知科学研究所研究员。他出生于纽约市,1981年获可伦比亚大学计算机科学学士,1988年获伯克利加利福尼亚大学计算机科学博士。他写过70多篇关于计算机科学的论著,出版过《隐喻解释的计算机模型》(A Computational Model of Metaphor Interpretation)一书。
冯志伟:先后在北京大学和中国科学技术大学研究生院两次研究生毕业,获双硕士学位。任中国科学技术信息研究所计算中心机器翻译研究组组长、教育部语言文字应用研究所计算语言学研究室主任、杭州师范大学外国语学院高端特聘教授。长期从事语言学和计算机科学的跨学科研究,是我国计算语言学事业的开拓者之一。在中国,他是中国语文现代化学会副会长、中国应用语言学学会常务理事、中国人工智能学会理事、国家语言文字工作委员会21世纪语言文字规范(标准)审定委员会委员、全国科学技术名词审定委员会委员、全国术语标准化技术委员会委员、中国外语教育研究中心学术委员会委员、《数学辞海》总编辑委员会委员、《中国大百科全书》《语言文字卷》编辑委员会成员。在国际上,他是TELRITrans-European Language Resources Infrastructure、LRECLanguage Resources and Evaluation Conference、COLING-2010(Computational Linguistics Conference)的顾问委员会委员,并担任IJCLInternational Journal of Corpus Linguistics、IJCCInternational Journal of Chinese and Computing等重要学术期刊编委以及英国Continuum出版公司系列丛书Research in Corpus and Discourse编委。承担国家自然科学基金项目和国家社会科学基金项目多项,出版专著30余部,发表论文300余篇。孙乐:1998年5月毕业于南京理工大学,获博士学位。1998年9月至2000年10月在中国科学院软件研究所从事博士后研究,博士后出站后留研究所工作至今,现为中国科学院软件研究所基础软件国家工程中心研究员,博士生导师。曾于2003年和2004年,先后在英国Birmingham大学、加拿大Montreal大学做访问学者,从事平行语料库和高精度信息检索方面的研究。目前主要研究方向:基于知识的自然语言理解、下一代信息检索模型、信息抽取与问答系统等。作为项目负责人承担国家自然科学基金项目、国家863项目和国际合作项目等10余项,在国内外重要学术刊物和会议上发表论文80多篇。
译 者 简 介
冯志伟
先后在北京大学和中国科学技术大学研究生院两次研究生毕业,获双硕士学位。1978年至1981年,在法国格勒诺布尔理科医科大学应用数学研究所IMAG自动翻译中心CETA师从法国著名数学家、国际计算语言学委员会主席B.Vauquois教授,专门研究数理语言学和机器翻译问题。回国后,先后担任中国科学技术信息研究所计算中心机器翻译研究组组长、教育部语言文字应用研究所计算语言学研究室主任、杭州师范大学外国语学院高端特聘教授。1986年至2004年,在德国Fraunhofer研究院)(FhG)、Trier大学、Konstanz高等技术学院、韩国Korean Advanced Institute of Science and Technology (KAIST)、英国Birmingham大学担任教授或研究员,长期从事语言学和计算机科学的跨学科研究,是我国计算语言学事业的开拓者之一。在中国,他是中国语文现代化学会副会长、中国应用语言学学会常务理事、中国人工智能学会理事、国家语言文字工作委员会21世纪语言文字规范(标准)审定委员会委员、全国科学技术名词审定委员会委员、全国术语标准化技术委员会委员、中国外语教育研究中心学术委员会委员、《数学辞海》总编辑委员会委员、《中国大百科全书》(《语言文字卷》)编辑委员会成员。在国际上,他是TELRI(Trans European Language Resources Infrastructure)、LREC(Language Resources and Evaluation Conference)、COLING 2010(Computational Linguistics Conference)的顾问委员会委员,并担任IJCL(International Journal of Corpus Linguistics)、IJCC(International Journal of Chinese and Computing)等重要学术期刊编委以及英国Continuum出版公司系列丛书Research in Corpus and Discourse编委。承担国家自然科学基金项目和国家社会科学基金项目多项,出版专著30余部,发表论文300余篇。
孙乐
1998年5月毕业于南京理工大学,获博士学位。1998年9月至2000年10月在中国科学院软件研究所从事博士后研究,现为中国科学院软件研究所中文信息处理研究室研究员、博士生导师。曾先后在英国Birmingham大学、加拿大Montreal大学做访问学者。目前主要研究方向:自然语言理解、知识图谱、信息抽取、问答系统等。作为项目负责人承担国家自然科学基金重点项目、国家863项目、国际合作项目等30多项,在ACL、SIGIR、EMNLP等重要国际会议和国内核心期刊发表论文50多篇。现为中国中文信息学会副理事长兼秘书长、中文信息学报副主编、国家语委语言文字规范标准审定委员会委员、国际测评NTCIR MOAT中文简体任务的组织者、第23届国际计算语言学大会(COLING 2010)组织委员会联席主席、第13届国际机器翻译峰会(MT Summit 2011)组织委员会联席主席、第53届国际计算语言学年会(ACL2015)组织委员会联席主席。
中文版序言
The goal of a textbook author is the same as the goal of any teacher: passing on our love for our field to a new generation of students, encouraging them to do innovative and creative new work, and helping them to advance the state of human knowledge. For a textbook in the interdisciplinary area of speech and language processing, there are the additional goals of enabling students from differing backgrounds computer science, linguistics, electrical engineering to acquire the knowledge and tools of the new interdisciplinary field, and to develop an appreciation for the beauty and complexity and variety of human language. We therefore feel extremely lucky that Professor Feng Zhiwei, aided by Dr. Sun Le, undertook the arduous job of translating this book. Prof. Feng is the perfect scholar for the job of translating such a book, because of his long experience in our field, his wide breadth of research interests throughout computational linguistics in general and Chinese computational linguistics specifically, his remarkable familiarity with the state of our field across the world, from China to France, from Korea to Germany, and of course his expertise on translation as a research area! We are also very excited that this translation into Chinese is the first translation of our book out of English. China's long history of the study of language is of course well known, and in this new century the young scientists of China are already playing a key role in the important scientific advances of our field. We look forward to even more amazing contributions from China and hope that our small book, now with the help of Prof. Feng and Dr. Sun, can provide a small aide in the great role that Chinese scientists are playing on the world scientific stage!
Daniel Jurafsky and James H. Martin
Palo Alto, California, and Boulder, Colorado
译文
教材的作者与所有教师有着相同的目标:即把我们对于本专业的热爱传达给新一代的学生, 鼓励他们去进行创新性的研究和探索,帮助他们把人类知识进一步向前推进。由于语音和语言的计算机处理属于交叉学科的领域,所以,我们这本关于这个交叉学科领域的教材还有其特定的目标。这些特定的目标就是使来自不同知识背景(计算机科学、语言学和电子工程)的学生掌握这门新的交叉学科的基本知识和工具,并在学习过程中一步一步地来感受人类语言的美妙性、复杂性和多样性。因此,当我们了解到冯志伟教授在孙乐研究员的协助下承担了把这本教材翻译成中文的艰辛工作的时候,我们感到无比的荣幸。我们认为,冯志伟教授是翻译这本教材的最理想的学者,因为他在这个专业领域具有多年的经验;他的研究兴趣涉及面广,既包括普遍的计算语言学研究,也包括具体的汉语计算语言学的研究;他对于这个学科在全世界的情况了如指掌,从中国到法国,从韩国到德国,他都亲身参与了这些国家的计算语言学研究工作;并且,翻译一直是冯教授长期从事的一个研究领域,他当然也是精研通达的翻译内行!这个中文译本是英文原著的第一个外文译本,它的出版使我们非常之激动和振奋。众所周知,中国在语言研究方面有着悠久的历史,在新世纪,中国年轻一代的科学工作者在这个领域的一些重要的科学进展方面已经起着关键性的作用。我们期待着中国在这个领域里进一步做出更加出色的贡献,并且希望,在中国科学工作者为全世界的科学进步事业所发挥的巨大作用中,由于冯志伟教授和孙乐研究员的帮助,拙著也能够为此尽我们的绵薄之力!
Daniel Jurafsky
James H. Martin
译者序
采用计算机技术来研究和处理自然语言是20世纪40年代末期和20世纪60年代才开始的, 60多年来,这项研究取得了长足的进展,成为了计算机科学中一门重要的新兴学科自然语言处理(Natural Language Processing,NLP)。
我们认为,计算机对自然语言的研究和处理,一般应经过如下4个方面