同类推荐
-
-
机器人工程专业导论
-
¥39.00
-
-
工业生产过程自控工程设计
-
¥88.00
-
-
MOFs基电化学传感器的构建及应用
-
¥68.00
-
-
移动机器人系统:从理论到实践:from theory …
-
¥88.00
-
-
七芯光纤微腔传感关键技术
-
¥99.00
-
-
工业机器人从基础到实战
-
¥128.00
-
-
企业级数据架构:核心要素、架构模型、数据管理与平台搭建
-
¥99.00
-
-
平台企业用户数据造假规制研究:基于估值最大化目标:ba…
-
¥88.00
-
-
控制之道:过程控制的理论与实践
-
¥89.00
-
-
大数据分析处理(慕课版)
-
¥69.80
|
|
图书信息
|
|
|
大数据教程——数据分析原理和方法
|
ISBN: | 9787030632982 |
定价: | ¥148.00 |
作者: | 林正炎[等]著 |
出版社: | 科学出版社 |
出版时间: | 2020年12月 |
开本: | 24cm |
页数: | 11,380页 |
装祯: | 平装 |
中图法: | TP274 |
相关供货商
供货商名称
|
库存量
|
库区
|
更新日期
|
|
|
|
|
其它供货商库存合计
|
261
|
|
2024-03-29
|
图书简介 | 本书试图较全面地介绍大数据技术的基本原理和方法, 包括以统计模型为主的各类数据模型以及它们的计算方法, 同时还将介绍这些方法在一些领域 (如人工智能) 中的应用。 |
目录 | 目录r 前言r 第1章 引言 1r 1.1 什么是大数据 1r 1.1.1 大数据概论 1r 1.1.2 大数据的特点 1r 1.1.3 大数据带来的利益 2r 1.1.4 大数据的类型 3r 1.2 数据分析过程 4r 1.3 专业领域知识 4r 1.3.1 统计学 5r 1.3.2 数据挖掘 5r 1.3.3 机器学r 1.3.4 人工智能 6r 1.3.5 数学 6r 1.4 数据科学家做什么? 6r 1.4.1 学术界 6r 1.4.2 工业界 6r 第2章 大数据的预处理、存储和计算 8r 2.1 数据的预处理 8r 2.1.1 数据源 9r 2.1.2 数据格式 9r 2.1.3 数据形式 10r 2.2 数据清洗 11r 2.2.1 数据清洗的系统框架 12r 2.2.2 待清洗数据的主要类型 12r 2.2.3 数据检测算法和清洗算法 13r 2.2.4 数据清洗评估 16r 2.3 云存储和云计算* 17r 18r 第3章 数据可视化 20r 3.1 基本原理 20r 3.2 实现过程 20r 3.3 可视化工具 21r 3.4 数据可视化方法 21r 第4章 回归与分类(一) 25r 4.1 线回归 25r 4.1.1 模型介绍 26r 4.1.2 参数估计 28r 4.1.3 假设检验 32r 4.1.4 模型评价与诊断 35r 4.1.5 预测 39r 4.2 线回归的推广* 40r 4.2.1 多项式回归 41r 4.2.2 样条回归 43r 4.2.3 局部回归 47r 4.2.4 广义加模型 52r 4.2.5 回归能的度量 54r 4.3 时间序列分析 57r 4.3.1 AR(p)模型 57r 4.3.2 MA(q)模型 60r 4.3.3 ARMA(p,q)模型 63r 4.4 逻辑斯谛回归 68r 4.5 判别分类 72r 4.5.1 线判别分析 72r 4.5.2 二次判别分析 75r 4.6 k邻分类 76r 78r 第5章 回归与分类(二) 81r 5.1 决策树 81r 5.1.1 回归树 82r 5.1.2 分类树 88r 5.1.3 决策树的优缺点 91r 5.2 Bagging分类 91r 5.3 森林分类 96r 5.4 AdaBoost分类 98r 5.5 支持向量机分类 103r 5.5.1 大间隔分类器 103r 5.5.2 支持向量分类器 109r 5.5.3 支持向量机 113r 5.5.4 多分类的支持向量机 118r 118r 第6章 聚类及相关数据分析 120r 6.1 聚类分析 120r 6.1.1 距离的定义 120r 6.1.2 系统聚类法 127r 6.1.3 K{均值聚类 130r 6.2 文本分析 134r 6.2.1 基本概念 134r 6.2.2 处理过程和任务 136r 6.2.3 特征处理 138r 6.2.4 文本表示模型 139r 6.2.5 文本分类与文本聚类 143r 6.2.6 应用实例 144r 6.2.7 分布式文本挖掘 147r 6.3 网络图形描述和模型* 148r 6.3.1 图的基本概念 148r 6.3.2 复杂网络的统计特征 149r 6.3.3 小世界现象 151r 6.3.4 模型介绍 154r 6.4 网络数据分析和图形模型 157r 6.4.1 网络数据概述 157r 6.4.2 网络数据收集 158r 6.4.3 网络数据分析 160r 6.5 关联系统 164r 6.5.1 关联规则 164r 6.5系统 166r 6.5.3 基于系统设计过程 169r 170r 第7章 高维统计中的变量选择 173r 7.1 经典降维方法 173r 7.1.1 主成分分析 173r 7.1.2 因子分析 178r 7.2 Lasso模型及其变形 185r 7.2.1 Lasso基本方法 185r 7.2.2 Lasso方法的拓展 188r 7.2.3 其他降维方法 196r 7.3 流形降维方法* 204r 7.3.1 核主成分分析 205r 7.3.2 局部线嵌入 206r 7.3.3 多维缩放 208r 7.3.4 Isomap 209r 7.4 非负矩阵分解* 210r 7.4.1 基本原理 210r 7.4.2 NMF的求解方法 211r 7.4.3 应用 212r 7.5 自编码器 212r 7.5.1 基本原理 213r 7.5.2 可视化自编码器 215r 7.6 t-SNE 216r 7.6.1 算法 216r 7.6.2 应用 217r 7.7 正则化方法 218r 7.7.1 多项式拟合 218r 7.7.2 过拟合和欠拟合 221r 7.7.3 L2正则 222r 7.7.4 L1正则 224r 7.7.5 缩减参数的选取 225r 225r 第8章 大期望算法(EM算法) 227r 8.1 预备知识 228r 8.2 算法描述 229r 8.3 算法导出* 230r 8.4 EM算法的应用 232r 8.4.1 简单实例——抛投硬币实验 232r 8.4.2 男女生身高实例——混合高斯模型 235r 240r 第9章 贝叶斯方法 242r 9.1 引论 242r 9.2 贝叶斯统计推断 243r 9.2.1 一个例子 243r 9.2.2 确定先验分布 244r 9.2.3 点估计 245r 9.2.4 区间估计 245r 9.2.5 假设检验 246r 9.3 贝叶斯方法在变量选择中的应用 246r 9.3.1 贝叶斯模型选择 246r 9.3.2 采样 248r 9.3.3 贝叶斯变量选择 249r 250r 第10章 隐马尔可夫模型 252r 10.1 隐马尔可夫模型的基本概念 252r 10.1.1 马尔可夫链 252r 10.1.2 隐马尔可夫模型 253r 10.1.3 观测序列的生成过程 257r 10.1.4 隐马尔可夫模型的三个基本问题 257r 10.2 概率计算算法 258r 10.2.1 前向算法 258r 10.2.2 后向算法 260r 10.2.3 一些概率与期望值的计算 261r 10.3 学 262r 10.3.1 监督学 262r 10.3.2 Baum-Welch算法 263r 10.3.3 Baum-Welch模型参数估计 265r 10.4 预测算法 266r 10.4.1似算法 266r 10.4.2 维特比算法 267r 0 271r 第11章 神经网络与深度学72r 11.1 引言 272r 11.2 神经网络 272r 11.2.1 简介 272r 11.2.2 神经元 274r 11.2.3 感知器 275r 11.2.4 神经网络模型 276r 11.2.5 激活函数 278r 11.2.6 代价函数 280r 11.2.7 梯度下降法 281r 11.2.8 反向传播算法 283r 11.2.9 梯度检验 285r 11.3 深度神经网络 285r 11.4 卷积神经网络 286r 11.4.1 卷积 287r 11.4.2 卷积层 288r 11.4.3 池化层 291r 11.4.4 卷积神经网络的网络架构 292r 11.4.5 权值的训练 293r 11.4.6 LeNet-5卷积神经网络 295r 11.5 循环神经网络 297r 11.5.1 简单循环神经网络 297r 11.5.2 基于时间的反向传播算法 299r 11.5.3 梯度消失和梯度爆炸 302r 11.5.4 长短时记忆网络* 302r 11.5.5 门限循环单元* 304r 11.6 强化学305r 11.6.1 什么是强化学305r 11.6.2 强化学同的环境 307r 11.6.3 强化学个有代表的算法及理论基础 307r 11.6.4 强化学关应用 308r 11.6.5 强化学台 308r 11.6.6 强化学望 309r 11.7 深度学工智能中的应用 309r 11.7.1 深度学人驾驶汽车领域的应用 309r 11.7.2 深度学然语言处理领域的应用 311r 11.7.3 深度学疗健康领域的应用 314r 1 315r 第12章 案例分析 316r 12.1 金融数据分析案例 316r 12.2 高维稀疏单细胞RNA测序数据的聚类研究 321r 12.2.1 背景介绍 321r 12.2.2 研究目标和内容 322r 12.2.3 数据标准化 323r 12.2.4 基于隐变量标准化两阶段单细胞无监督类 325r 12.3 手写数字识别 327r 12.3.1 MNIST数据的说明和导入 327r 12.3.2 MNIST手写数字神经网络识别 330r 参考文献 337r 附录A R语言简介 344r A.1 特点 344r A.2 安装和运行 344r A.3 帮助命令和帮助工具 345r A.4 RStudio 346r A.5 R编程要点 347r 附录B Python语言介绍 356r B.1 基础介绍 356r B.2 非基础部分 367r B.3 机器学module介绍 375r 索引 379r 彩图 |
|