Python Chinese Edition

Detailed summary in vernacular field.

Detalles Bibliográficos
Otros Autores: Hardeniya, Nitin, author (author)
Formato: Libro electrónico
Idioma:Inglés
Publicado: Birmingham, England : Packt Publishing [2019]
Edición:First edition
Colección:Yi bu tu shu.
Materias:
Ver en Biblioteca Universitat Ramon Llull:https://discovery.url.edu/permalink/34CSUC_URL/1im36ta/alma991009805123006719
Tabla de Contenidos:
  • 版权声明
  • 内容提
  • 源与支持
  • 目录
  • 模块 1 NLTK 基础知
  • 第1章 然 处理简介
  • 1.1 为什么 学习NLP
  • 1.2 从Python 的基本知 开始
  • 1.2.1 列
  • 1.2.2 助
  • 1.2.3 正则 式
  • 1.2.4 典
  • 1.2.5 编写函数
  • 1.3 NLTK
  • 1.4 一
  • 1.5 本章小结
  • 第2章 文本的整理和清洗
  • 2.1 文本整理
  • 2.2 文本清洗
  • 2.3 句子拆分器
  • 2.4 标 析
  • 2.5 干提取
  • 2.6 形 原
  • 2.7 停用 删
  • 2.8 生僻字删
  • 2.9 拼写校正
  • 2.10 一
  • 2.11 本章小结
  • 第3章 性标注
  • 3.1 什么是 性标注
  • 3.1.1 斯坦福标注器
  • 3.1.2 深入了 标注器
  • 3.1.3 序列标注器
  • 1 N元标注器
  • 2 正则 式标注器
  • 3.1.4 布 尔标注器
  • 3.1.5 基于标注器的机器学习
  • 3.2 命名实体 别
  • NER标注器
  • 3.3 一
  • 3.4 本章小结
  • 第4章 对文本的结构 法分析
  • 4.1 浅层 法分析与深层 法分析
  • 4.2 法分析的两种方法
  • 4.3 为什么 法分析
  • 4.4 不同类型的 法分析器
  • 4.4.1 归下 的 法分析器
  • 4.4.2 移位归约 法分析器
  • 4.4.3 图 法分析器
  • 4.4.4 正则 式 法分析器
  • 4.5 依存分析
  • 4.6 组块化
  • 4.7 信息抽取
  • 4.7.1 命名实体 别
  • 4.7.2 关系抽取
  • 4.8 本章小结
  • 第5章 NLP应用
  • 5.1 构建第一个NLP 应用
  • 5.2 其他的NLP 应用
  • 5.2.1 机器翻
  • 5.2.2 统 机器翻
  • 5.2.3 信息检索
  • 5.2.4 别
  • 5.2.5 文本分类
  • 5.2.6 信息提取
  • 5.2.7 答系统
  • 5.2.8 对 系统
  • 5.2.9 义消歧
  • 5.2.10 主 建模
  • 5.2.11 检测
  • 5.2.12 光学字符 别
  • 5.3 本章小结
  • 第6章 文本分类
  • 6.1 机器学习
  • 6.2 文本分类
  • 6.3 样
  • 6.3.1 朴素 叶斯
  • 6.3.2 决策树
  • 6.3.3 机梯度下
  • 6.3.4 回归
  • 6.3.5 支持向 机
  • 6.4 机森林算法
  • 6.5 文本 类
  • K均值算法
  • 6.6 文本的主 建模
  • 安 gensim
  • 6.7 参 料
  • 6.8 本章小结
  • 第7章 网络爬取
  • 7.1 网络爬
  • 7.2 编写第一个爬 程序
  • 7.3 Scrapy 中的数据流
  • 7.3.1 Scrapy 命令 界
  • 7.3.2
  • 7.4 站点地图
  • 7.5 管
  • 7.6 外 参
  • 7.7 本章小结
  • 第8章 与其他Python库一同使用NLTK
  • 8.1 NumPy
  • 8.1.1 ndarray
  • 8.1.2 基本操作
  • 8.1.3 从数组中提取数据
  • 8.1.4 复杂的矩 算
  • 8.2 SciPy
  • 8.2.1 线性代数
  • 8.2.2 特征值和特征向
  • 8.2.3 稀疏矩
  • 8.2.4 优化
  • 8.3 Pandas
  • 8.3.1 取数据
  • 8.3.2 时序数据
  • 8.3.3 列 换
  • 8.3.4 噪声数据
  • 8.4 Matplotlib
  • 8.4.1 subplot
  • 8.4.2 添加
  • 8.4.3 散点图
  • 8.4.4 柱状图
  • 8.4.5 3D图
  • 8.5 外 参
  • 8.6 本章小结
  • 第9章 使用Python 社交媒体挖掘
  • 9.1 数据收
  • 推特.
  • 9.2 数据提取
  • 9.3 地理可 化
  • 9.3.1 影响 检测
  • 9.3.2 Facebook
  • 9.3.3 影响 的朋友
  • 9.4 本章小结
  • 第10章 大 模的文本挖掘
  • 10.1 在Hadoop 上使用Python 的不同方法
  • 10.1.1 Python的流
  • 10.1.2 Hive/Pig UDF
  • 10.1.3 流包 器
  • 10.2 在Hadoop 上 NLTK
  • 10.2.1 UDF
  • 10.2.2 Python流
  • 10.3 在Hadoop 上 scikit-learn
  • 10.4 PySpark
  • 10.5 本章小结
  • 模块 2 使用Python 3的NLTK 3 文本处理
  • 第1章 标 文本和WordNet的基础
  • 1.1 引
  • 1.2 将文本标 成句子
  • 1.2.1 准备工作
  • 1.2.2 工作方式
  • 1.2.3 工作原理
  • 1.2.4 更多信息
  • 1.2.5 参
  • 1.3 将句子标 成单
  • 1.3.1 工作方式
  • 1.3.2 工作原理
  • 1.3.3 更多信息
  • 1.3.4 参
  • 1.4 使用正则 式标 句
  • 1.4.1 准备工作
  • 1.4.2 工作方式
  • 1.4.3 工作原理
  • 1.4.4 更多信息
  • 1.4.5 参
  • 1.5 练 句标 生成器
  • 1.5.1 准备工作
  • 1.5.2 工作方式
  • 1.5.3 工作原理
  • 1.5.4 更多信息
  • 1.5.5 参
  • 1.6 在已标 的 句中 滤停用
  • 1.6.1 准备工作
  • 1.6.2 工作方式
  • 1.6.3 工作原理
  • 1.6.4 更多信息
  • 1.6.5 参
  • 1.7 查找WordNet 中单 的Synset
  • 1.7.1 准备工作
  • 1.7.2 工作方式
  • 1.7.3 工作原理
  • 1.7.4 更多信息
  • 1.7.5 参
  • 1.8 在WordNet 中查找 元和同义
  • 1.8.1 工作方式
  • 1.8.2 工作原理
  • 1.8.3 更多信息
  • 1.8.4 参
  • 1.9 算WordNet 和Synset 的相似度
  • 1.9.1 工作方式
  • 1.9.2 工作原理
  • 1.9.3 更多信息
  • 1.9.4 参
  • 1.10 发现单 搭
  • 1.10.1 准备工作
  • 1.10.2 工作方式
  • 1.10.3 工作原理
  • 1.10.4 更多信息
  • 1.10.5 参
  • 第2章 替换和校正单
  • 2.1 引
  • 2.2 干提取
  • 2.2.1 工作方式
  • 2.2.2 工作原理
  • 2.2.3 更多信息
  • 2.2.4 参
  • 2.3 使用WordNet 形 原
  • 2.3.1 准备工作
  • 2.3.2 工作方式
  • 2.3.3 工作原理
  • 2.3.4 更多信息
  • 2.3.5 参
  • 2.4 基于匹 的正则 式替换单
  • 2.4.1 准备工作
  • 2.4.2 工作方式
  • 2.4.3 工作原理
  • 2.4.4 更多信息
  • 2.4.5 参
  • 2.5 移 复字符
  • 2.5.1 准备工作
  • 2.5.2 工作方式
  • 2.5.3 工作原理
  • 2.5.4 更多信息
  • 2.5.5 参
  • 2.6 使用Enchant 拼写校正
  • 2.6.1 准备工作
  • 2.6.2 工作方式
  • 2.6.3 工作原理
  • 2.6.4 更多信息
  • 2.6.5 参
  • 2.7 替换同义
  • 2.7.1 准备工作
  • 2.7.2 工作方式
  • 2.7.3 工作原理
  • 2.7.4 更多信息
  • 2.7.5 参
  • 2.8 使用反义 替换否定形式
  • 2.8.1 工作方式
  • 2.8.2 工作原理
  • 2.8.3 更多信息
  • 2.8.4 参
  • 第3章 创建 料库
  • 3.1 引.
  • 3.2 建立 定义 料库
  • 3.2.1 准备工作
  • 3.2.2 工作方式
  • 3.2.3 工作原理
  • 3.2.4 更多信息
  • 3.2.5 参
  • 3.3 创建 汇 料库
  • 3.3.1 准备工作
  • 3.3.2 工作方式
  • 3.3.3 工作原理
  • 3.3.4 更多信息
  • 3.3.5 参
  • 3.4 创建已标 性单 的 料库
  • 3.4.1 准备工作
  • 3.4.2 工作方式
  • 3.4.3 工作原理
  • 3.4.4 更多信息
  • 3.4.5 参
  • 3.5 创建已组块短 的 料库
  • 3.5.1 准备工作
  • 3.5.2 工作方式
  • 3.5.3 工作原理
  • 3.5.4 更多信息
  • 3.5.5 参
  • 3.6 创建已分类文本的 料库
  • 3.6.1 准备工作
  • 3.6.2 工作方式
  • 3.6.3 工作原理
  • 3.6.4 更多信息
  • 3.6.5 参
  • 3.7 创建已分类组块 料库 取器
  • 3.7.1 准备工作
  • 3.7.2 工作方式
  • 3.7.3 工作原理
  • 3.7.4 更多信息
  • 3.7.5 参
  • 3.8 懒惰 料库加
  • 3.8.1 工作方式
  • 3.8.2 工作原理
  • 3.8.3 更多信息
  • 3.9 创建 定义 料库 图
  • 3.9.1 工作方式
  • 3.9.2 工作原理
  • 3.9.3 更多信息
  • 3.9.4 参
  • 3.10 创建基于MongoDB 的 料库 取器
  • 3.10.1 准备工作
  • 3.10.2 工作方式
  • 3.10.3 工作原理
  • 3.10.4 更多信息
  • 3.10.5 参
  • 3.11 在加 文件的情况下编 料库
  • 3.11.1 准备工作
  • 3.11.2 工作方式
  • 3.11.3 工作原理
  • 第4章 性标注
  • 4.1 引
  • 4.2 标注
  • 4.2.1 准备工作
  • 4.2.2 工作方式
  • 4.2.3 工作原理
  • 4.2.4 更多信息
  • 4.2.5 参
  • 4.3 练一元组 性标注器
  • 4.3.1 工作方式
  • 4.3.2 工作原理
  • 4.3.3 更多信息
  • 4.3.4 参
  • 4.4 回 标注的组合标注器
  • 4.4.1 工作方式
  • 4.4.2 工作原理
  • 4.4.3 更多信息
  • 4.4.4 参
  • 4.5 练和组合N元标注器
  • 4.5.1 准备工作
  • 4.5.2 工作方式
  • 4.5.3 工作原理
  • 4.5.4 更多信息
  • 4.5.5 参
  • 4.6 创建似然单 标签的模型
  • 4.6.1 工作方式
  • 4.6.2 工作原理
  • 4.6.3 更多信息
  • 4.6.4 参
  • 4.7 使用正则 式标注
  • 4.7.1 准备工作
  • 4.7.2 工作方式
  • 4.7.3 工作原理
  • 4.7.4 更多信息
  • 4.7.5 参
  • 4.8 缀标签
  • 4.8.1 工作方式
  • 4.8.2 工作原理
  • 4.8.3 更多信息
  • 4.8.4 参
  • 4.9 练布 尔标注器
  • 4.9.1 工作方式
  • 4.9.2 工作原理
  • 4.9.3 更多信息
  • 4.9.4 参
  • 4.10 练TnT 标注器
  • 4.10.1 工作方式
  • 4.10.2 工作原理
  • 4.10.3 更多信息
  • 4.10.4 参
  • 4.11 使用WordNet 标注
  • 4.11.1 准备工作
  • 4.11.2 工作方式
  • 4.11.3 工作原理
  • 4.11.4 参
  • 4.12 标注专有名
  • 4.12.1 工作方式
  • 4.12.2 工作原理
  • 4.12.3 参
  • 4.13 基于分类器的标注
  • 4.13.1 工作方式
  • 4.13.2 工作原理
  • 4.13.3 更多信息
  • 4.13.4 参
  • 4.14 使用NLTK 练器 练标注器.
  • 4.14.1 工作方式
  • 4.14.2 工作原理
  • 4.14.3 更多信息
  • 4.14.4 参
  • 第5章 提取组块
  • 5.1 引
  • 5.2 使用正则 式组块和 断
  • 5.2.1 准备工作
  • 5.2.2 工作方式
  • 5.2.3 工作原理
  • 5.2.4 更多信息
  • 5.2.5 参
  • 5.3 使用正则 式合并和拆分组块
  • 5.3.1 工作方式
  • 5.3.2 工作原理
  • 5.3.3 更多信息
  • 5.3.4 参
  • 5.4 使用正则 式扩展和删 组块
  • 5.4.1 工作方式
  • 5.4.2 工作原理
  • 5.4.3 更多信息
  • 5.4.4 参
  • 5.5 使用正则 式 分 析
  • 5.5.1 工作方式
  • 5.5.2 工作原理
  • 5.5.3 更多信息
  • 5.5.4 参
  • 5.6 练基于标注器的组块器
  • 5.6.1 工作方式
  • 5.6.2 工作原理
  • 5.6.3 更多信息
  • 5.6.4 参
  • 5.7 基于分类的分块
  • 5.7.1 工作方式
  • 5.7.2 工作原理
  • 5.7.3 更多信息
  • 5.7.4 参
  • 5.8 提取命名实体
  • 5.8.1 工作方式
  • 5.8.2 工作原理
  • 5.8.3 更多信息
  • 5.8.4 参
  • 5.9 提取专有名 组块
  • 5.9.1 工作方式
  • 5.9.2 工作原理
  • 5.9.3 更多信息
  • 5.10 提取 位组块
  • 5.10.1 工作方式
  • 5.10.2 工作原理
  • 5.10.3 更多信息
  • 5.10.4 参
  • 5.11 练命名实体组块器
  • 5.11.1 工作方式
  • 5.11.2 工作原理
  • 5.11.3 更多信息
  • 5.11.4 参
  • 5.12 使用NLTK 练器 练组块器
  • 5.12.1 工作方式
  • 5.12.2 工作原理
  • 5.12.3 更多信息
  • 5.12.4 参
  • 第6章 换组块与树
  • 6.1 引
  • 6.2 滤句子中无意义的单
  • 6.2.1 准备工作
  • 6.2.2 工作方式
  • 6.2.3 工作原理
  • 6.2.4 更多信息
  • 6.2.5 参
  • 6.3 纠正动 形式
  • 6.3.1 准备工作
  • 6.3.2 工作方式
  • 6.3.3 工作原理
  • 6.3.4 参
  • 6.4 交换动 短
  • 6.4.1 工作方式
  • 6.4.2 工作原理
  • 6.4.3 更多信息
  • 6.4.4 参
  • 6.5 交换名 基数
  • 6.5.1 工作方式
  • 6.5.2 工作原理
  • 6.5.3 参
  • 6.6 交换不定式短
  • 6.6.1 工作方式
  • 6.6.2 工作原理
  • 6.6.3 更多信息
  • 6.6.4 参
  • 6.7 单数化复数名
  • 6.7.1 工作方式
  • 6.7.2 工作原理
  • 6.7.3 参
  • 6.8 接组块变换
  • 6.8.1 工作方式
  • 6.8.2 工作原理
  • 6.8.3 更多信息
  • 6.8.4 参
  • 6.9 将组块树 换为文本
  • 6.9.1 工作方式
  • 6.9.2 工作原理
  • 6.9.3 更多信息
  • 6.9.4 参
  • 6.10 平展深度树
  • 6.10.1 准备工作
  • 6.10.2 工作方式
  • 6.10.3 工作原理
  • 6.10.4 更多信息
  • 6.10.5 参
  • 6.11 创建浅树
  • 6.11.1 工作方式
  • 6.11.2 工作原理
  • 6.11.3 参
  • 6.12 换树标签
  • 6.12.1 准备工作
  • 6.12.2 工作方式
  • 6.12.3 工作原理
  • 6.12.4 参
  • 第7章 文本分类
  • 7.1 引
  • 7.2 特征提取
  • 7.2.1 工作方式
  • 7.2.2 工作原理
  • 7.2.3 更多信息
  • 7.2.4 参.
  • 7.3 练朴素 叶斯分类器
  • 7.3.1 准备工作
  • 7.3.2 工作方式
  • 7.3.3 工作原理
  • 7.3.4 更多信息
  • 7.3.5 参
  • 7.4 练决策树分类器
  • 7.4.1 工作方式
  • 7.4.2 工作原理
  • 7.4.3 更多信息
  • 7.4.4 参
  • 7.5 练最大熵分类器
  • 7.5.1 准备工作
  • 7.5.2 工作方式
  • 7.5.3 工作原理
  • 7.5.4 更多信息
  • 7.5.5 参
  • 7.6 练scikit-learn 分类器
  • 7.6.1 准备工作
  • 7.6.2 工作方式
  • 7.6.3 工作原理
  • 7.6.4 更多信息
  • 7.6.5 参
  • 7.7 分类器的精准率和召回率
  • 7.7.1 工作方式
  • 7.7.2 工作原理
  • 7.7.3 更多信息
  • 7.7.4 参
  • 7.8 算 信息 单
  • 7.8.1 工作方式
  • 7.8.2 工作原理
  • 7.8.3 更多信息
  • 7.8.4 参
  • 7.9 使用投票组合分类器
  • 7.9.1 准备工作
  • 7.9.2 工作方式
  • 7.9.3 工作原理
  • 7.9.4 参
  • 7.10 使用多个二元分类器分类
  • 7.10.1 准备工作
  • 7.10.2 工作方式
  • 7.10.3 工作原理
  • 7.10.4 更多信息
  • 7.10.5 参
  • 7.11 使用NLTK 练器 练分类器
  • 7.11.1 工作方式
  • 7.11.2 工作原理
  • 7.11.3 更多信息
  • 7.11.4 参
  • 第8章 分布式 程和大型数据 的处理
  • 8.1 引
  • 8.2 使用execnet 分布式标注
  • 8.2.1 准备工作
  • 8.2.2 工作方式
  • 8.2.3 工作原理
  • 8.2.4 更多内容
  • 8.2.5 参
  • 8.3 使用execnet 分布式组块
  • 8.3.1 准备工作
  • 8.3.2 工作方式
  • 8.3.3 工作原理
  • 8.3.4 更多内容
  • 8.3.5 参
  • 8.4 使用execnet 并 处理列
  • 8.4.1 工作方式
  • 8.4.2 工作原理
  • 8.4.3 更多内容
  • 8.4.4 参
  • 8.5 在Redis 中存储 率分布
  • 8.5.1 准备工作
  • 8.5.2 工作方式
  • 8.5.3 工作原理
  • 8.5.4 更多内容
  • 8.5.5 参
  • 8.6 在Redis 中存储条件 率分布
  • 8.6.1 准备工作
  • 8.6.2 工作方式
  • 8.6.3 工作原理
  • 8.6.4 更多内容
  • 8.6.5 参
  • 8.7 在Redis 中存储有序字典
  • 8.7.1 准备工作
  • 8.7.2 工作方式
  • 8.7.3 工作原理
  • 8.7.4 更多内容
  • 8.7.5 参
  • 8.8 使用Redis 和execnet 分布式单 分
  • 8.8.1 准备工作
  • 8.8.2 工作方式
  • 8.8.3 工作原理
  • 8.8.4 更多内容
  • 8.8.5 参
  • 第9章 析特定的数据类型
  • 9.1 引
  • 9.2 使用dateutil 析日期和时
  • 9.2.1 准备工作
  • 9.2.2 工作方式
  • 9.2.3 工作原理
  • 9.2.4 更多信息
  • 9.2.5 参
  • 9.3 时区的查找和 换
  • 9.3.1 准备工作
  • 9.3.2 工作方式
  • 9.3.3 工作原理
  • 9.3.4 更多信息
  • 9.3.5 参
  • 9.4 使用lxml 从HTML 中提取URL
  • 9.4.1 准备工作
  • 9.4.2 工作方式
  • 9.4.3 工作原理
  • 9.4.4 更多信息
  • 9.4.5 参
  • 9.5 清理和剥离HTML
  • 9.5.1 准备工作
  • 9.5.2 工作方式
  • 9.5.3 工作原理
  • 9.5.4 更多信息.
  • 9.5.5 参.