Java数据科学指南 Chinese Edition
Detailed summary in vernacular field only.
Autor principal: | |
---|---|
Otros Autores: | |
Formato: | Libro electrónico |
Idioma: | Inglés |
Publicado: |
Birmingham :
Packt Publishing, Limited
2024.
|
Edición: | 1st ed |
Colección: | Yi bu tu shu.
|
Materias: | |
Ver en Biblioteca Universitat Ramon Llull: | https://discovery.url.edu/permalink/34CSUC_URL/1im36ta/alma991009820529206719 |
Tabla de Contenidos:
- Intro
- 内容提
- 作 简介
- 审稿人简介
- 前
- 源与支持
- 目录
- 第1章 取数据与清洗数据
- 1.1 简介
- 1.2 使用 Java 从分层目录中提取所有文件名
- 准备工作
- 操作步
- 1.3 使用Apache Commons IO从多层目录中提取所有文件名
- 准备工作
- 操作步
- 1.4 使用 Java 8 从文本文件一次性 取所有内容
- 操作步
- 1.5 使用Apache Commons
- 准备工作
- 操作方法
- 1.6 使用Apache Tika 提取PDF 文本
- 准备知
- 操作步
- 1.7 使用正则 式清洗 ASCII 文本文件
- 操作步
- 1.8 使用Univocity 析CSV 文件
- 准备工作
- 操作步
- 1.9 使用Univocity 析TSV 文件
- 准备工作
- 操作步
- 1.10 使用JDOM 析XML 文件
- 准备工作
- 操作步
- 1.11 使用JSON.simple 编写JSON 文件
- 准备工作
- 操作步
- 1.12 使用JSON.simple 取JSON 文件
- 准备工作
- 操作步
- 1.13 使用JSoup 从一个URL 提取Web 数据
- 准备工作
- 操作步
- 1.14 使用Selenium Webdriver 从网站提取Web 数据
- 准备工作
- 操作步
- 1.15 从MySQL 数据库 取 格数据
- 准备工作
- 操作步
- 第2章 为数据建立索引与搜索数据
- 2.1 简介
- 2.2 使用Apache Lucene 为数据建立索引
- 准备工作
- 操作步
- 工作原理
- 2.3 使用Apache Lucene 搜索带索引的数据
- 准备工作
- 操作步
- 第3章 数据统 分析
- 3.1 简介
- 3.2 生成描 性统
- 操作步
- 3.3 生成概 统
- 操作步
- 3.4 从多种分布生成概 统
- 操作步
- 更多内容
- 3.5 算 率分布
- 操作步
- 3.6 算字符串中的
- 操作步
- 工作原理
- 3.7 使用Java 8 算字符串中的
- 操作步
- 3.8 算简单回归
- 操作步
- 3.9 算普 最小二乘回归
- 操作步
- 3.10 算广义最小二乘回归
- 操作步
- 3.11 算两组数据点的协方差
- 操作步
- 3.12 为两组数据点 算皮尔 相关系数
- 操作步
- 3.13 执 对t检
- 操作步
- 3.14 执 卡方检
- 操作步
- 3.15 执 单因素方差分析 one-way ANOVA test
- 操作步
- 3.16 执 K-S 检
- 操作步
- 第4章 数据学习Ⅰ
- 4.1 简介
- 4.2 创建与保存ARFF 文件
- 操作步
- 4.3 对机器学习模型 交叉
- 操作步
- 4.4 对新的测 数据 分类
- 准备工作
- 操作步
- 4.5 使用 滤分类器对新测 数据分类
- 操作步
- 4.6 创建线性回归模型
- 操作步
- 4.7 创建 回归模型
- 操作步
- 4.8 使用K均值算法对数据点 类
- 操作步
- 4.9 依据类别对数据 类处理
- 操作方法
- 4.10 学习数据 的关 则
- 准备工作
- 操作步
- 4.11 使用低层方法、 滤方法、元分类器方法 择特征/属性
- 准备工作
- 操作步
- 第5章 数据学习Ⅱ
- 5.1 简介
- 5.2 使用Java 机器学习库 Java-ML 向数据应用机器学习
- 准备工作
- 操作步
- 5.3 使用斯坦福分类器对数据点分类
- 准备工作
- 操作步
- 工作原理
- 5.4 使用MOA 对数据点分类
- 准备工作
- 操作步
- 5.5 使用 Mulan 对多标签数据点 分类
- 准备工作
- 操作步
- 第6章 从文本数据提取信息
- 6.1 简介
- 6.2 使用Java 检测标 单.
- 准备工作
- 操作步
- 6.3 使用Java 检测句子
- 准备工作
- 操作步
- 6.4 使用OpenNLP 检测标 单 与句子
- 准备工作
- 操作步
- 6.5 使用Stanford CoreNLP 从标 中提取 根、 性 以及 别命名实体
- 准备工作
- 操作步
- 6.6 使用 Java 8 借助余弦相似性测度测 文本相似度
- 准备工作
- 操作步
- 6.7 使用Mallet 从文本文档提取主
- 准备工作
- 操作步
- 6.8 使用Mallet 对文本文档 分类
- 准备工作
- 操作步
- 6.9 使用Weka 对文本文档 分类
- 准备工作
- 操作步
- 第7章 处理大数据
- 7.1 简介
- 7.2 使用Apache Mahout 练在线 回归模型
- 准备工作
- 操作步
- 7.3 使用Apache Mahout 应用在线 回归模型
- 准备工作
- 操作步
- 7.4 使用Apache Spark 决简单的文本挖掘
- 准备工作
- 操作步
- 7.5 使用MLib 的K 均值算法做 类
- 准备工作
- 操作步
- 7.6 使用MLib 创建线性回归模型
- 准备工作
- 操作步
- 7.7 使用 MLib 的 机森林模型对数据点 分类
- 准备工作
- 操作步
- 第8章 数据深度学习
- 8.1 简介
- 8.2 使用DL4j 创建Word2vec 神经网络
- 操作方法
- 工作原理
- 更多内容
- 8.3 使用 DL4j 创建深度信念神经网络
- 操作步
- 工作原理
- 8.4 使用DL4j 创建深度 动编码器
- 操作步
- 工作原理
- 第9章 数据可 化
- 9.1 简介
- 9.2 绘制2D 正弦曲线
- 准备工作
- 操作步
- 9.3 绘制直方图
- 准备工作
- 操作步
- 9.4 绘制条形图
- 准备工作
- 操作步
- 9.5 绘制箱线图或箱 图
- 准备工作
- 操作步
- 9.6 绘制散点图
- 准备工作
- 操作步
- 9.7 绘制甜圈图
- 准备工作
- 操作步
- 9.8 绘制 积图
- 准备工作
- 操作步.