斯坦福自然语言经典教材 Speech and Language Processing 第三版发布重大更新

发布于 2023-06-15 08:46:59

【导读】斯坦福大学教授 Dan Jurafsky 与科罗拉多大学波德分校 James H. Martin 教授共同撰写的《Speech and Language Processing》,被翻译成 60 多种语言,是全世界自然语言处理领域最经典的教科书。本书不仅可以作为高等学校自然语言处理和计算语言学等课程的本科生和研究生教材,对于自然语言处理相关领域的研究人员和技术人员也是不可或缺的权威参考书。

image.png

25886d27-a565-42c2-8507-7face19ee7cb.png

此次版本刷新重点重写并完成了5, 6, 7, 8, 17, 18, 19, 23, 24, 25这些章节,以及第9章的草稿。神经网络及其训练的新教学序列,从逻辑回归开始,接着是嵌入、前馈网络和RNNs。加上新的或改进的BPE, tf-idf,嵌入中的偏置,波束搜索解码,HMMs,内涵框架,词汇归纳,阅读理解/问答。有些章节已移至附录中。更新了第6章和第25章的ppt。

下载链接:
https://web.stanford.edu/~jurafsky/slp3/

PDF 下载:https://web.stanford.edu/~jurafsky/slp3/ed3book_jan72023.pdf

本书共分五个部分。

第一部分“词汇的计算机处理”,讲述单词的计算机处理,包括单词切分、单词的形态学、最小编辑距离、词类,以及单词计算机处理的各种算法,包括正则表达式、有限状态自动机、有限状态转录机、N元语法模型、隐马尔可夫模型、最大熵模型等。

第二部分“语音的计算机处理”,介绍语音学、语音合成、语音自动识别以及计算音系学。

第三部分“句法的计算机处理”,介绍英语的形式语法,讲述句法剖析的主要算法,包括CKY剖析算法、Earley剖析算法、统计剖析,并介绍合一与类型特征结构、Chomsky层级分类、抽吸引理等分析工具。

第四部分“语义和语用的计算机处理”,介绍语义的各种表示方法、计算语义学、词汇语义学、计算词汇语义学,并介绍同指、连贯等计算机话语分析问题。

第五部分“应用”,讲述信息抽取、问答系统、自动文摘、对话和会话智能代理、机器翻译等自然语言处理的应用技术。

ed3book_jan72023_1.png
ed3book_jan72023_2.png
ed3book_jan72023_9.png
ed3book_jan72023_11.png
ed3book_jan72023_12.png
ed3book_jan72023_18.png
ed3book_jan72023_30.png
ed3book_jan72023_66.png
ed3book_jan72023_68.png

作者介绍:

Dan Jurafsky 麦克阿瑟天才奖得主

斯坦福大学计算机学院教授同时也是语言学系主任 Dan Jurafsky 是自然语言处理领域泰斗,他所著的《语音与语言处理》一书,被翻译成 60 多种语言,是全世界自然语言处理领域最经典的教科书。Dan Jurafsky 曾在 ACL 2006、EMNLP 2013、WWW 2013 获最佳论文奖,在 2002 年获得麦克阿瑟天才奖(美国跨领域最高奖项),2017 年获得美国科学院 Cozzarelli 奖,2015 年获得古尔德奖。Dan Jurafsky 教授在 Google Scholar 上引用量超过3万,h-index 达 75。他的主要研究方向有自然语言理解、对话系统、人与机器语言处理之间的关系等,并一直尝试运用自然语言处理方法来解决社会学和行为学问题。同时,他还对食物语言学以及中文有着极大的兴趣,他所著的科普图书《食物的语言—从语言学家角度读菜单》被翻译成多国语言,荣获2015国际畅销书榜首,并获 2015 年 James Beard Award 提名。

香农科技创始人李纪为也是Dan Jurafsky 的博士生,李纪为是第一位仅用三年时间就获得了斯坦福大学计算机科学(CS)博士学位的人。

James H. Martin

于1981年在哥伦比亚大学获计算机科学学士学位,1988年在伯克利加利福尼亚大学获计算机科学博士学位。现任博尔德的科罗拉多大学语言学系、计算机科学系教授,认知科学研究所研究员,主要研究方向为计算语义学、机器学习和信息检索。他发表过70多篇有关计算机科学的专著,出版了 A Computational Model ofMetaphor Interpretation 一书。

部分转自:https://www.sohu.com/a/256311315_505819?p=qq

0 条评论

发布
问题