Python Chinese Edition

Detailed summary in vernacular field.

Detalles Bibliográficos
Otros Autores:	Hardeniya, Nitin, author (author)
Formato:	Libro electrónico
Idioma:	Inglés
Publicado:	Birmingham, England : Packt Publishing [2019]
Edición:	First edition
Colección:	Yi bu tu shu.
Materias:	Python (Computer program language) Natural language processing (Computer science)
Ver en Biblioteca Universitat Ramon Llull:	https://discovery.url.edu/permalink/34CSUC_URL/1im36ta/alma991009805123006719

Tabla de Contenidos:

封
版权声明
内容提
序
前
源与支持
目录
模块 1 NLTK 基础知
第1章然处理简介
1.1 为什么学习NLP
1.2 从Python 的基本知开始
1.2.1 列
1.2.2 助
1.2.3 正则式
1.2.4 典
1.2.5 编写函数
1.3 NLTK
1.4 一
1.5 本章小结
第2章文本的整理和清洗
2.1 文本整理
2.2 文本清洗
2.3 句子拆分器
2.4 标析
2.5 干提取
2.6 形原
2.7 停用删
2.8 生僻字删
2.9 拼写校正
2.10 一
2.11 本章小结
第3章性标注
3.1 什么是性标注
3.1.1 斯坦福标注器
3.1.2 深入了标注器
3.1.3 序列标注器
1 N元标注器
2 正则式标注器
3.1.4 布尔标注器
3.1.5 基于标注器的机器学习
3.2 命名实体别
NER标注器
3.3 一
3.4 本章小结
第4章对文本的结构法分析
4.1 浅层法分析与深层法分析
4.2 法分析的两种方法
4.3 为什么法分析
4.4 不同类型的法分析器
4.4.1 归下的法分析器
4.4.2 移位归约法分析器
4.4.3 图法分析器
4.4.4 正则式法分析器
4.5 依存分析
4.6 组块化
4.7 信息抽取
4.7.1 命名实体别
4.7.2 关系抽取
4.8 本章小结
第5章 NLP应用
5.1 构建第一个NLP 应用
5.2 其他的NLP 应用
5.2.1 机器翻
5.2.2 统机器翻
5.2.3 信息检索
5.2.4 别
5.2.5 文本分类
5.2.6 信息提取
5.2.7 答系统
5.2.8 对系统
5.2.9 义消歧
5.2.10 主建模
5.2.11 检测
5.2.12 光学字符别
5.3 本章小结
第6章文本分类
6.1 机器学习
6.2 文本分类
6.3 样
6.3.1 朴素叶斯
6.3.2 决策树
6.3.3 机梯度下
6.3.4 回归
6.3.5 支持向机
6.4 机森林算法
6.5 文本类
K均值算法
6.6 文本的主建模
安 gensim
6.7 参料
6.8 本章小结
第7章网络爬取
7.1 网络爬
7.2 编写第一个爬程序
7.3 Scrapy 中的数据流
7.3.1 Scrapy 命令界
7.3.2
7.4 站点地图
7.5 管
7.6 外参
7.7 本章小结
第8章与其他Python库一同使用NLTK
8.1 NumPy
8.1.1 ndarray
8.1.2 基本操作
8.1.3 从数组中提取数据
8.1.4 复杂的矩算
8.2 SciPy
8.2.1 线性代数
8.2.2 特征值和特征向
8.2.3 稀疏矩
8.2.4 优化
8.3 Pandas
8.3.1 取数据
8.3.2 时序数据
8.3.3 列换
8.3.4 噪声数据
8.4 Matplotlib
8.4.1 subplot
8.4.2 添加
8.4.3 散点图
8.4.4 柱状图
8.4.5 3D图
8.5 外参
8.6 本章小结
第9章使用Python 社交媒体挖掘
9.1 数据收
推特.
9.2 数据提取
热
9.3 地理可化
9.3.1 影响检测
9.3.2 Facebook
9.3.3 影响的朋友
9.4 本章小结
第10章大模的文本挖掘
10.1 在Hadoop 上使用Python 的不同方法
10.1.1 Python的流
10.1.2 Hive/Pig UDF
10.1.3 流包器
10.2 在Hadoop 上 NLTK
10.2.1 UDF
10.2.2 Python流
10.3 在Hadoop 上 scikit-learn
10.4 PySpark
10.5 本章小结
模块 2 使用Python 3的NLTK 3 文本处理
第1章标文本和WordNet的基础
1.1 引
1.2 将文本标成句子
1.2.1 准备工作
1.2.2 工作方式
1.2.3 工作原理
1.2.4 更多信息
1.2.5 参
1.3 将句子标成单
1.3.1 工作方式
1.3.2 工作原理
1.3.3 更多信息
1.3.4 参
1.4 使用正则式标句
1.4.1 准备工作
1.4.2 工作方式
1.4.3 工作原理
1.4.4 更多信息
1.4.5 参
1.5 练句标生成器
1.5.1 准备工作
1.5.2 工作方式
1.5.3 工作原理
1.5.4 更多信息
1.5.5 参
1.6 在已标的句中滤停用
1.6.1 准备工作
1.6.2 工作方式
1.6.3 工作原理
1.6.4 更多信息
1.6.5 参
1.7 查找WordNet 中单的Synset
1.7.1 准备工作
1.7.2 工作方式
1.7.3 工作原理
1.7.4 更多信息
1.7.5 参
1.8 在WordNet 中查找元和同义
1.8.1 工作方式
1.8.2 工作原理
1.8.3 更多信息
1.8.4 参
1.9 算WordNet 和Synset 的相似度
1.9.1 工作方式
1.9.2 工作原理
1.9.3 更多信息
1.9.4 参
1.10 发现单搭
1.10.1 准备工作
1.10.2 工作方式
1.10.3 工作原理
1.10.4 更多信息
1.10.5 参
第2章替换和校正单
2.1 引
2.2 干提取
2.2.1 工作方式
2.2.2 工作原理
2.2.3 更多信息
2.2.4 参
2.3 使用WordNet 形原
2.3.1 准备工作
2.3.2 工作方式
2.3.3 工作原理
2.3.4 更多信息
2.3.5 参
2.4 基于匹的正则式替换单
2.4.1 准备工作
2.4.2 工作方式
2.4.3 工作原理
2.4.4 更多信息
2.4.5 参
2.5 移复字符
2.5.1 准备工作
2.5.2 工作方式
2.5.3 工作原理
2.5.4 更多信息
2.5.5 参
2.6 使用Enchant 拼写校正
2.6.1 准备工作
2.6.2 工作方式
2.6.3 工作原理
2.6.4 更多信息
2.6.5 参
2.7 替换同义
2.7.1 准备工作
2.7.2 工作方式
2.7.3 工作原理
2.7.4 更多信息
2.7.5 参
2.8 使用反义替换否定形式
2.8.1 工作方式
2.8.2 工作原理
2.8.3 更多信息
2.8.4 参
第3章创建料库
3.1 引.
3.2 建立定义料库
3.2.1 准备工作
3.2.2 工作方式
3.2.3 工作原理
3.2.4 更多信息
3.2.5 参
3.3 创建汇料库
3.3.1 准备工作
3.3.2 工作方式
3.3.3 工作原理
3.3.4 更多信息
3.3.5 参
3.4 创建已标性单的料库
3.4.1 准备工作
3.4.2 工作方式
3.4.3 工作原理
3.4.4 更多信息
3.4.5 参
3.5 创建已组块短的料库
3.5.1 准备工作
3.5.2 工作方式
3.5.3 工作原理
3.5.4 更多信息
3.5.5 参
3.6 创建已分类文本的料库
3.6.1 准备工作
3.6.2 工作方式
3.6.3 工作原理
3.6.4 更多信息
3.6.5 参
3.7 创建已分类组块料库取器
3.7.1 准备工作
3.7.2 工作方式
3.7.3 工作原理
3.7.4 更多信息
3.7.5 参
3.8 懒惰料库加
3.8.1 工作方式
3.8.2 工作原理
3.8.3 更多信息
3.9 创建定义料库图
3.9.1 工作方式
3.9.2 工作原理
3.9.3 更多信息
3.9.4 参
3.10 创建基于MongoDB 的料库取器
3.10.1 准备工作
3.10.2 工作方式
3.10.3 工作原理
3.10.4 更多信息
3.10.5 参
3.11 在加文件的情况下编料库
3.11.1 准备工作
3.11.2 工作方式
3.11.3 工作原理
第4章性标注
4.1 引
4.2 标注
4.2.1 准备工作
4.2.2 工作方式
4.2.3 工作原理
4.2.4 更多信息
4.2.5 参
4.3 练一元组性标注器
4.3.1 工作方式
4.3.2 工作原理
4.3.3 更多信息
4.3.4 参
4.4 回标注的组合标注器
4.4.1 工作方式
4.4.2 工作原理
4.4.3 更多信息
4.4.4 参
4.5 练和组合N元标注器
4.5.1 准备工作
4.5.2 工作方式
4.5.3 工作原理
4.5.4 更多信息
4.5.5 参
4.6 创建似然单标签的模型
4.6.1 工作方式
4.6.2 工作原理
4.6.3 更多信息
4.6.4 参
4.7 使用正则式标注
4.7.1 准备工作
4.7.2 工作方式
4.7.3 工作原理
4.7.4 更多信息
4.7.5 参
4.8 缀标签
4.8.1 工作方式
4.8.2 工作原理
4.8.3 更多信息
4.8.4 参
4.9 练布尔标注器
4.9.1 工作方式
4.9.2 工作原理
4.9.3 更多信息
4.9.4 参
4.10 练TnT 标注器
4.10.1 工作方式
4.10.2 工作原理
4.10.3 更多信息
4.10.4 参
4.11 使用WordNet 标注
4.11.1 准备工作
4.11.2 工作方式
4.11.3 工作原理
4.11.4 参
4.12 标注专有名
4.12.1 工作方式
4.12.2 工作原理
4.12.3 参
4.13 基于分类器的标注
4.13.1 工作方式
4.13.2 工作原理
4.13.3 更多信息
4.13.4 参
4.14 使用NLTK 练器练标注器.
4.14.1 工作方式
4.14.2 工作原理
4.14.3 更多信息
4.14.4 参
第5章提取组块
5.1 引
5.2 使用正则式组块和断
5.2.1 准备工作
5.2.2 工作方式
5.2.3 工作原理
5.2.4 更多信息
5.2.5 参
5.3 使用正则式合并和拆分组块
5.3.1 工作方式
5.3.2 工作原理
5.3.3 更多信息
5.3.4 参
5.4 使用正则式扩展和删组块
5.4.1 工作方式
5.4.2 工作原理
5.4.3 更多信息
5.4.4 参
5.5 使用正则式分析
5.5.1 工作方式
5.5.2 工作原理
5.5.3 更多信息
5.5.4 参
5.6 练基于标注器的组块器
5.6.1 工作方式
5.6.2 工作原理
5.6.3 更多信息
5.6.4 参
5.7 基于分类的分块
5.7.1 工作方式
5.7.2 工作原理
5.7.3 更多信息
5.7.4 参
5.8 提取命名实体
5.8.1 工作方式
5.8.2 工作原理
5.8.3 更多信息
5.8.4 参
5.9 提取专有名组块
5.9.1 工作方式
5.9.2 工作原理
5.9.3 更多信息
5.10 提取位组块
5.10.1 工作方式
5.10.2 工作原理
5.10.3 更多信息
5.10.4 参
5.11 练命名实体组块器
5.11.1 工作方式
5.11.2 工作原理
5.11.3 更多信息
5.11.4 参
5.12 使用NLTK 练器练组块器
5.12.1 工作方式
5.12.2 工作原理
5.12.3 更多信息
5.12.4 参
第6章换组块与树
6.1 引
6.2 滤句子中无意义的单
6.2.1 准备工作
6.2.2 工作方式
6.2.3 工作原理
6.2.4 更多信息
6.2.5 参
6.3 纠正动形式
6.3.1 准备工作
6.3.2 工作方式
6.3.3 工作原理
6.3.4 参
6.4 交换动短
6.4.1 工作方式
6.4.2 工作原理
6.4.3 更多信息
6.4.4 参
6.5 交换名基数
6.5.1 工作方式
6.5.2 工作原理
6.5.3 参
6.6 交换不定式短
6.6.1 工作方式
6.6.2 工作原理
6.6.3 更多信息
6.6.4 参
6.7 单数化复数名
6.7.1 工作方式
6.7.2 工作原理
6.7.3 参
6.8 接组块变换
6.8.1 工作方式
6.8.2 工作原理
6.8.3 更多信息
6.8.4 参
6.9 将组块树换为文本
6.9.1 工作方式
6.9.2 工作原理
6.9.3 更多信息
6.9.4 参
6.10 平展深度树
6.10.1 准备工作
6.10.2 工作方式
6.10.3 工作原理
6.10.4 更多信息
6.10.5 参
6.11 创建浅树
6.11.1 工作方式
6.11.2 工作原理
6.11.3 参
6.12 换树标签
6.12.1 准备工作
6.12.2 工作方式
6.12.3 工作原理
6.12.4 参
第7章文本分类
7.1 引
7.2 特征提取
7.2.1 工作方式
7.2.2 工作原理
7.2.3 更多信息
7.2.4 参.
7.3 练朴素叶斯分类器
7.3.1 准备工作
7.3.2 工作方式
7.3.3 工作原理
7.3.4 更多信息
7.3.5 参
7.4 练决策树分类器
7.4.1 工作方式
7.4.2 工作原理
7.4.3 更多信息
7.4.4 参
7.5 练最大熵分类器
7.5.1 准备工作
7.5.2 工作方式
7.5.3 工作原理
7.5.4 更多信息
7.5.5 参
7.6 练scikit-learn 分类器
7.6.1 准备工作
7.6.2 工作方式
7.6.3 工作原理
7.6.4 更多信息
7.6.5 参
7.7 分类器的精准率和召回率
7.7.1 工作方式
7.7.2 工作原理
7.7.3 更多信息
7.7.4 参
7.8 算信息单
7.8.1 工作方式
7.8.2 工作原理
7.8.3 更多信息
7.8.4 参
7.9 使用投票组合分类器
7.9.1 准备工作
7.9.2 工作方式
7.9.3 工作原理
7.9.4 参
7.10 使用多个二元分类器分类
7.10.1 准备工作
7.10.2 工作方式
7.10.3 工作原理
7.10.4 更多信息
7.10.5 参
7.11 使用NLTK 练器练分类器
7.11.1 工作方式
7.11.2 工作原理
7.11.3 更多信息
7.11.4 参
第8章分布式程和大型数据的处理
8.1 引
8.2 使用execnet 分布式标注
8.2.1 准备工作
8.2.2 工作方式
8.2.3 工作原理
8.2.4 更多内容
8.2.5 参
8.3 使用execnet 分布式组块
8.3.1 准备工作
8.3.2 工作方式
8.3.3 工作原理
8.3.4 更多内容
8.3.5 参
8.4 使用execnet 并处理列
8.4.1 工作方式
8.4.2 工作原理
8.4.3 更多内容
8.4.4 参
8.5 在Redis 中存储率分布
8.5.1 准备工作
8.5.2 工作方式
8.5.3 工作原理
8.5.4 更多内容
8.5.5 参
8.6 在Redis 中存储条件率分布
8.6.1 准备工作
8.6.2 工作方式
8.6.3 工作原理
8.6.4 更多内容
8.6.5 参
8.7 在Redis 中存储有序字典
8.7.1 准备工作
8.7.2 工作方式
8.7.3 工作原理
8.7.4 更多内容
8.7.5 参
8.8 使用Redis 和execnet 分布式单分
8.8.1 准备工作
8.8.2 工作方式
8.8.3 工作原理
8.8.4 更多内容
8.8.5 参
第9章析特定的数据类型
9.1 引
9.2 使用dateutil 析日期和时
9.2.1 准备工作
9.2.2 工作方式
9.2.3 工作原理
9.2.4 更多信息
9.2.5 参
9.3 时区的查找和换
9.3.1 准备工作
9.3.2 工作方式
9.3.3 工作原理
9.3.4 更多信息
9.3.5 参
9.4 使用lxml 从HTML 中提取URL
9.4.1 准备工作
9.4.2 工作方式
9.4.3 工作原理
9.4.4 更多信息
9.4.5 参
9.5 清理和剥离HTML
9.5.1 准备工作
9.5.2 工作方式
9.5.3 工作原理
9.5.4 更多信息.
9.5.5 参.

Python Chinese Edition

Ejemplares similares