设为首页收藏本站

NLP Code Studio

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 2395|回复: 14

NLP汉语自然语言处理原理与实践--新书推荐

[复制链接]

该用户从未签到

600

主题

669

帖子

1万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
15118
发表于 2017-2-5 13:10:00 | 显示全部楼层 |阅读模式
活动类型:
文档学习
开始时间:
2017-2-5 13:23
活动地点:
anywhere
性别:
不限
已报名人数:
17

本书是一本研究汉语自然语言处理方面的基础性、综合性书籍,涉及NLP的语言理论、算法和工程实践的方方面面,内容繁杂。 本书包括NLP的语言理论部分、算法部分、案例部分,涉及汉语的发展历史、传统的句法理论、认知语言学理论。需要指出的是,本书是迄今为止第一本系统介绍认知语言学和算法设计相结合的中文NLP书籍,并从认知语言学的视角重新认识和分析了NLP的句法和语义相结合的数据结构。这也是本书的创新之处。 本书适用于所有想学习NLP的技术人员,包括各大人工智能实验室、软件学院等专业机构。


作译者郑捷,threedweb网站的负责人,研究方向是机器学习与自然语言处理。当前负责的核心产品是高精度自然语言认知系统的设计与研发,研发目标是高精度(识别率为85%~95%)的统一架构的NLP认知系统,已经出版专著《机器学习算法原理与编程实践》,希望能与在NLP这方面有兴趣的读者一起学习交流。


目录第1章 中文语言的机器处理        1
1.1 历史回顾        2
1.1.1 从科幻到现实        2
1.1.2 早期的探索        3
1.1.3 规则派还是统计派        3
1.1.4 从机器学习到认知
计算        5
1.2 现代自然语言系统简介        6
1.2.1 NLP流程与开源框架        6
1.2.2 哈工大NLP平台及其
演示环境        9
1.2.3 Stanford NLP团队及其
演示环境        11
1.2.4 NLTK开发环境        13
1.3 整合中文分词模块        16
1.3.1 安装Ltp Python组件        17
1.3.2 使用Ltp 3.3进行中文
分词        18
1.3.3 使用结巴分词模块        20
1.4 整合词性标注模块        22
1.4.1 Ltp 3.3词性标注        23
1.4.2 安装StanfordNLP并
编写Python接口类        24
1.4.3 执行Stanford词性
标注        28
1.5 整合命名实体识别模块        29
1.5.1 Ltp 3.3命名实体识别        29
1.5.2 Stanford命名实体
识别        30
1.6 整合句法解析模块        32
1.6.1 Ltp 3.3句法依存树        33
1.6.2 Stanford Parser类        35
1.6.3 Stanford短语结构树        36
1.6.4 Stanford依存句法树        37
1.7 整合语义角色标注模块        38
1.8 结语        40
第2章 汉语语言学研究回顾        42
2.1 文字符号的起源        42
2.1.1 从记事谈起        43
2.1.2 古文字的形成        47
2.2 六书及其他        48
2.2.1 象形        48
2.2.2 指事        50
2.2.3 会意        51
2.2.4 形声        53
2.2.5 转注        54
2.2.6 假借        55
2.3 字形的流变        56
2.3.1 笔与墨的形成与变革        56
2.3.2 隶变的方式        58
2.3.3 汉字的符号化与结构        61
2.4 汉语的发展        67
2.4.1 完整语义的基本
形式——句子        68
2.4.2 语言的初始形态与
文言文        71
2.4.3 白话文与复音词        73
2.4.4 白话文与句法研究        78
2.5 三个平面中的语义研究        80
2.5.1 词汇与本体论        81
2.5.2 格语法及其框架        84
2.6 结语        86
第3章 词汇与分词技术        88
3.1 中文分词        89
3.1.1 什么是词与分词规范        90
3.1.2 两种分词标准        93
3.1.3 歧义、机械分词、语言
模型        94
3.1.4 词汇的构成与未登录
词        97
3.2 系统总体流程与词典结构        98
3.2.1 概述        98
3.2.2 中文分词流程        99
3.2.3 分词词典结构        103
3.2.4 命名实体的词典
结构        105
3.2.5 词典的存储结构        108
3.3 算法部分源码解析        111
3.3.1 系统配置        112
3.3.2 Main方法与例句        113
3.3.3 句子切分        113
3.3.4 分词流程        117
3.3.5 一元词网        118
3.3.6 二元词图        125
3.3.7 NShort算法原理        130
3.3.8 后处理规则集        136
3.3.9 命名实体识别        137
3.3.10 细分阶段与最短
路径        140
3.4 结语        142
第4章 NLP中的概率图模型        143
4.1 概率论回顾        143
4.1.1 多元概率论的几个
基本概念        144
4.1.2 贝叶斯与朴素贝叶斯
算法        146
4.1.3 文本分类        148
4.1.4 文本分类的实现        151
4.2 信息熵        154
4.2.1 信息量与信息熵        154
4.2.2 互信息、联合熵、
条件熵        156
4.2.3 交叉熵和KL散度        158
4.2.4 信息熵的NLP的
意义        159
4.3 NLP与概率图模型        160
4.3.1 概率图模型的几个
基本问题        161
4.3.2 产生式模型和判别式
模型        162
4.3.3 统计语言模型与NLP
算法设计        164
4.3.4 极大似然估计        167
4.4 隐马尔科夫模型简介        169
4.4.1 马尔科夫链        169
4.4.2 隐马尔科夫模型        170
4.4.3 HMMs的一个实例        171
4.4.4 Viterbi算法的实现        176
4.5 最大熵模型        179
4.5.1 从词性标注谈起        179
4.5.2 特征和约束        181
4.5.3 最大熵原理        183
4.5.4 公式推导        185
4.5.5 对偶问题的极大似然
估计        186
4.5.6 GIS实现        188
4.6 条件随机场模型        193
4.6.1 随机场        193
4.6.2 无向图的团(Clique)
与因子分解        194
4.6.3 线性链条件随机场        195
4.6.4 CRF的概率计算        198
4.6.5 CRF的参数学习        199
4.6.6 CRF预测标签        200
4.7 结语        201
第5章 词性、语块与命名实体
识别        202
5.1 汉语词性标注        203
5.1.1 汉语的词性        203
5.1.2 宾州树库的词性标注
规范        205
5.1.3 stanfordNLP标注
词性        210
5.1.4 训练模型文件        213
5.2 语义组块标注        219
5.2.1 语义组块的种类        220
5.2.2 细说NP        221
5.2.3 细说VP        223
5.2.4 其他语义块        227
5.2.5 语义块的抽取        229
5.2.6 CRF的使用        232
5.3 命名实体识别        240
5.3.1 命名实体        241
5.3.2 分词架构与专名
词典        243
5.3.3 算法的策略——词典
与统计相结合        245
5.3.4 算法的策略——层叠
式架构        252
5.4 结语        259
第6章 句法理论与自动分析        260
6.1 转换生成语法        261
6.1.1 乔姆斯基的语言观        261
6.1.2 短语结构文法        263
6.1.3 汉语句类        269
6.1.4 谓词论元与空范畴        274
6.1.5 轻动词分析理论        279
6.1.6 NLTK操作句法树        280
6.2 依存句法理论        283
6.2.1 配价理论        283
6.2.2 配价词典        285
6.2.3 依存理论概述        287
6.2.4 Ltp依存分析介绍        290
6.2.5 Stanford依存转换、
解析        293
6.3 PCFG短语结构句法分析        298
6.3.1 PCFG短语结构        298
6.3.2 内向算法和外向
算法        301
6.3.3 Viterbi算法        303
6.3.4 参数估计        304
6.3.5 Stanford 的PCFG算法
训练        305
6.4 结语        310
第7章 建设语言资源库        311
7.1 语料库概述        311
7.1.1 语料库的简史        312
7.1.2 语言资源库的分类        314
7.1.3 语料库的设计实例:
国家语委语料库        315
7.1.4 语料库的层次加工        321
7.2 语法语料库        323
7.2.1 中文分词语料库        323
7.2.2 中文分词的测评        326
7.2.3 宾州大学CTB简介        327
7.3 语义知识库        333
7.3.1 知识库与HowNet
简介        333
7.3.2 发掘义原        334
7.3.3 语义角色        336
7.3.4 分类原则与事件
分类        344
7.3.5 实体分类        347
7.3.6 属性与分类        352
7.3.7 相似度计算与实例        353
7.4 语义网与百科知识库        360
7.4.1 语义网理论介绍        360
7.4.2 维基百科知识库        364
7.4.3 DBpedia抽取原理        365
7.5 结语        368
第8章 语义与认知        370
8.1 回顾现代语义学        371
8.1.1 语义三角论        371
8.1.2 语义场论        373
8.1.3 基于逻辑的语义学        376
8.2 认知语言学概述        377
8.2.1 象似性原理        379
8.2.2 顺序象似性        380
8.2.3 距离象似性        380
8.2.4 重叠象似性        381
8.3 意象图式的构成        383
8.3.1 主观性与焦点        383
8.3.2 范畴化:概念的
认知        385
8.3.3 主体与背景        390
8.3.4 意象图式        392
8.3.5 社交中的图式        396
8.3.6 完形:压缩与省略        398
8.4 隐喻与转喻        401
8.4.1 隐喻的结构        402
8.4.2 隐喻的认知本质        403
8.4.3 隐喻计算的系统
架构        405
8.4.4 隐喻计算的实现        408
8.5 构式语法        412
8.5.1 构式的概念        413
8.5.2 句法与构式        415
8.5.3 构式知识库        417
8.6 结语        420
第9章 NLP中的深度学习        422
9.1 神经网络回顾        422
9.1.1 神经网络框架        423
9.1.2 梯度下降法推导        425
9.1.3 梯度下降法的实现        427
9.1.4 BP神经网络介绍和
推导        430
9.2 Word2Vec简介        433
9.2.1 词向量及其表达        434
9.2.2 Word2Vec的算法
原理        436
9.2.3 训练词向量        439
9.2.4 大规模上下位关系的
自动识别        443
9.3 NLP与RNN 448
9.3.1 Simple-RNN        449
9.3.2 LSTM原理        454
9.3.3 LSTM的Python
实现        460
9.4 深度学习框架与应用        467
9.4.1 Keras框架介绍        467
9.4.2 Keras序列标注        471
9.4.3 依存句法的算法
原理        478
9.4.4 Stanford依存解析的
训练过程        483
9.5 结语        488
第10章 语义计算的架构        490
10.1 句子的语义和语法预处理        490
10.1.1 长句切分和融合        491
10.1.2 共指消解        496
10.2 语义角色        502
10.2.1 谓词论元与语义
角色        502
10.2.2 PropBank简介        505
10.2.3 CPB中的特殊
句式        506
10.2.4 名词性谓词的语义
角色        509
10.2.5 PropBank展开        512
10.3 句子的语义解析        517
10.3.1 语义依存        517
10.3.2 完整架构        524
10.3.3 实体关系抽取        527
10.4 结语        531



链接地址:
https://www.amazon.cn/gp/product/B01NASN9SD?psc=1
http://product.china-pub.com/5077416#ml
http://product.dangdang.com/24176603.html

已通过 (5 人)

  留言 申请时间
myboyliu

已经下单,等到货

2017-3-8 15:45
aswan115

正在做文本挖掘,遇到很多问题,想往这方面学习。

2017-3-2 15:30
皓月当空

已下单 非常期待

2017-2-25 17:34
chungyehwang

已下单 :)

2017-2-11 17:50
humanchao

已下单,期待好内容

2017-2-6 10:44

暂未通过 (12 人)

  留言 申请时间
莹莹 2018-4-11 20:01
lt_coco 2018-4-8 10:45
Luka 2018-2-28 22:01
wxcxx520 2018-2-17 10:50
CrazyMonkey 2017-12-5 08:55
1126496537 2017-10-10 11:08
shujuxiaowang 2017-8-25 17:00
任宇翔 2017-8-16 17:05

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

该用户从未签到

0

主题

12

帖子

213

积分

中级会员

Rank: 3Rank: 3

积分
213
发表于 2017-2-7 18:20:23 | 显示全部楼层
请问站长,NLP汉语自然语言处理原理与实践,书中的代码在哪里能够下载
回复

使用道具 举报

该用户从未签到

600

主题

669

帖子

1万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
15118
 楼主| 发表于 2017-2-28 03:07:40 | 显示全部楼层
LP汉语自然语言处理原理与实践》书中代码:下载地址
回复

使用道具 举报

该用户从未签到

0

主题

14

帖子

184

积分

注册会员

Rank: 2

积分
184
QQ
发表于 2017-3-1 10:45:09 | 显示全部楼层
請問一下站長, 電子書會上架到www.amazon.cn嗎?
非常期待有Kindle版的

另外, QQ群一直加不進去, 加入群的通關密碼是?
回复

使用道具 举报

该用户从未签到

0

主题

39

帖子

235

积分

中级会员

Rank: 3Rank: 3

积分
235
发表于 2017-3-1 23:42:54 | 显示全部楼层
已经学习过了,值得读一下
回复

使用道具 举报

该用户从未签到

0

主题

7

帖子

176

积分

注册会员

Rank: 2

积分
176
发表于 2017-3-9 23:51:50 | 显示全部楼层
qq群已经满了,是否可以建一个这本书的读者群。多谢。
回复

使用道具 举报

该用户从未签到

0

主题

7

帖子

176

积分

注册会员

Rank: 2

积分
176
发表于 2017-3-10 14:54:13 | 显示全部楼层
希望书的作者开辟一个读者专栏,代码问题答疑。很多代码问题呀。
回复

使用道具 举报

该用户从未签到

0

主题

1

帖子

144

积分

注册会员

Rank: 2

积分
144
发表于 2017-3-13 13:38:46 | 显示全部楼层
今天快递刚刚到,还没有来得及看
回复

使用道具 举报

该用户从未签到

0

主题

1

帖子

155

积分

注册会员

Rank: 2

积分
155
QQ
发表于 2017-3-18 19:01:43 | 显示全部楼层
本帖最后由 buguniaoo1991 于 2017-3-18 19:02 编辑

已经到手啦。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

该用户从未签到

600

主题

669

帖子

1万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
15118
 楼主| 发表于 2017-3-21 09:33:19 | 显示全部楼层
您好

    这本书对于学习NLP的读者来说,十分的优秀,书中逻辑清晰,是国内难得的读物。

    现在我想询问下,在书中P99页的词典下载网址pan.baidu.com/s/1ntRky1N,这个链接已经失效了。
    您能否联系到作者重新上传一份该词典下载链接,或者其他的下载方式,我们这仅做研究使用。

谢谢
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表