Java数据科学指南 Chinese Edition

Detailed summary in vernacular field only.

Detalles Bibliográficos
Autor principal: Press, Posts & Telecom (-)
Otros Autores: Shams, Rushdi
Formato: Libro electrónico
Idioma:Inglés
Publicado: Birmingham : Packt Publishing, Limited 2024.
Edición:1st ed
Colección:Yi bu tu shu.
Materias:
Ver en Biblioteca Universitat Ramon Llull:https://discovery.url.edu/permalink/34CSUC_URL/1im36ta/alma991009820529206719
Tabla de Contenidos:
  • Intro
  • 内容提
  • 作 简介
  • 审稿人简介
  • 源与支持
  • 目录
  • 第1章  取数据与清洗数据
  • 1.1 简介
  • 1.2 使用 Java 从分层目录中提取所有文件名
  • 准备工作
  • 操作步
  • 1.3 使用Apache Commons IO从多层目录中提取所有文件名
  • 准备工作
  • 操作步
  • 1.4 使用 Java 8 从文本文件一次性 取所有内容
  • 操作步
  • 1.5 使用Apache Commons
  • 准备工作
  • 操作方法
  • 1.6 使用Apache Tika 提取PDF 文本
  • 准备知
  • 操作步
  • 1.7 使用正则 式清洗 ASCII 文本文件
  • 操作步
  • 1.8 使用Univocity 析CSV 文件
  • 准备工作
  • 操作步
  • 1.9 使用Univocity 析TSV 文件
  • 准备工作
  • 操作步
  • 1.10 使用JDOM 析XML 文件
  • 准备工作
  • 操作步
  • 1.11 使用JSON.simple 编写JSON 文件
  • 准备工作
  • 操作步
  • 1.12 使用JSON.simple 取JSON 文件
  • 准备工作
  • 操作步
  • 1.13 使用JSoup 从一个URL 提取Web 数据
  • 准备工作
  • 操作步
  • 1.14 使用Selenium Webdriver 从网站提取Web 数据
  • 准备工作
  • 操作步
  • 1.15 从MySQL 数据库 取 格数据
  • 准备工作
  • 操作步
  • 第2章 为数据建立索引与搜索数据
  • 2.1 简介
  • 2.2 使用Apache Lucene 为数据建立索引
  • 准备工作
  • 操作步
  • 工作原理
  • 2.3 使用Apache Lucene 搜索带索引的数据
  • 准备工作
  • 操作步
  • 第3章 数据统 分析
  • 3.1 简介
  • 3.2 生成描 性统
  • 操作步
  • 3.3 生成概 统
  • 操作步
  • 3.4 从多种分布生成概 统
  • 操作步
  • 更多内容
  • 3.5 算 率分布
  • 操作步
  • 3.6 算字符串中的
  • 操作步
  • 工作原理
  • 3.7 使用Java 8 算字符串中的
  • 操作步
  • 3.8 算简单回归
  • 操作步
  • 3.9 算普 最小二乘回归
  • 操作步
  • 3.10 算广义最小二乘回归
  • 操作步
  • 3.11 算两组数据点的协方差
  • 操作步
  • 3.12 为两组数据点 算皮尔 相关系数
  • 操作步
  • 3.13 执 对t检
  • 操作步
  • 3.14 执 卡方检
  • 操作步
  • 3.15 执 单因素方差分析 one-way ANOVA test
  • 操作步
  • 3.16 执 K-S 检
  • 操作步
  • 第4章 数据学习Ⅰ
  • 4.1 简介
  • 4.2 创建与保存ARFF 文件
  • 操作步
  • 4.3 对机器学习模型 交叉
  • 操作步
  • 4.4 对新的测 数据 分类
  • 准备工作
  • 操作步
  • 4.5 使用 滤分类器对新测 数据分类
  • 操作步
  • 4.6 创建线性回归模型
  • 操作步
  • 4.7 创建 回归模型
  • 操作步
  • 4.8 使用K均值算法对数据点 类
  • 操作步
  • 4.9 依据类别对数据 类处理
  • 操作方法
  • 4.10 学习数据 的关 则
  • 准备工作
  • 操作步
  • 4.11 使用低层方法、 滤方法、元分类器方法 择特征/属性
  • 准备工作
  • 操作步
  • 第5章 数据学习Ⅱ
  • 5.1 简介
  • 5.2 使用Java 机器学习库 Java-ML 向数据应用机器学习
  • 准备工作
  • 操作步
  • 5.3 使用斯坦福分类器对数据点分类
  • 准备工作
  • 操作步
  • 工作原理
  • 5.4 使用MOA 对数据点分类
  • 准备工作
  • 操作步
  • 5.5 使用 Mulan 对多标签数据点 分类
  • 准备工作
  • 操作步
  • 第6章 从文本数据提取信息
  • 6.1 简介
  • 6.2 使用Java 检测标 单.
  • 准备工作
  • 操作步
  • 6.3 使用Java 检测句子
  • 准备工作
  • 操作步
  • 6.4 使用OpenNLP 检测标 单 与句子
  • 准备工作
  • 操作步
  • 6.5 使用Stanford CoreNLP 从标 中提取 根、 性 以及 别命名实体
  • 准备工作
  • 操作步
  • 6.6 使用 Java 8 借助余弦相似性测度测 文本相似度
  • 准备工作
  • 操作步
  • 6.7 使用Mallet 从文本文档提取主
  • 准备工作
  • 操作步
  • 6.8 使用Mallet 对文本文档 分类
  • 准备工作
  • 操作步
  • 6.9 使用Weka 对文本文档 分类
  • 准备工作
  • 操作步
  • 第7章 处理大数据
  • 7.1 简介
  • 7.2 使用Apache Mahout 练在线 回归模型
  • 准备工作
  • 操作步
  • 7.3 使用Apache Mahout 应用在线 回归模型
  • 准备工作
  • 操作步
  • 7.4 使用Apache Spark 决简单的文本挖掘
  • 准备工作
  • 操作步
  • 7.5 使用MLib 的K 均值算法做 类
  • 准备工作
  • 操作步
  • 7.6 使用MLib 创建线性回归模型
  • 准备工作
  • 操作步
  • 7.7 使用 MLib 的 机森林模型对数据点 分类
  • 准备工作
  • 操作步
  • 第8章 数据深度学习
  • 8.1 简介
  • 8.2 使用DL4j 创建Word2vec 神经网络
  • 操作方法
  • 工作原理
  • 更多内容
  • 8.3 使用 DL4j 创建深度信念神经网络
  • 操作步
  • 工作原理
  • 8.4 使用DL4j 创建深度 动编码器
  • 操作步
  • 工作原理
  • 第9章 数据可 化
  • 9.1 简介
  • 9.2 绘制2D 正弦曲线
  • 准备工作
  • 操作步
  • 9.3 绘制直方图
  • 准备工作
  • 操作步
  • 9.4 绘制条形图
  • 准备工作
  • 操作步
  • 9.5 绘制箱线图或箱 图
  • 准备工作
  • 操作步
  • 9.6 绘制散点图
  • 准备工作
  • 操作步
  • 9.7 绘制甜圈图
  • 准备工作
  • 操作步
  • 9.8 绘制 积图
  • 准备工作
  • 操作步.