同类推荐
-
-
多元统计分析
-
¥48.00
-
-
概率论
-
¥49.00
-
-
随机分析与控制简明教程
-
¥68.00
-
-
随机过程基础
-
¥98.00
-
-
概率统计与随机过程
-
¥59.80
-
-
从零学实验设计与数据处理
-
¥85.00
-
-
应用非参数统计实验指导
-
¥58.00
-
-
贝叶斯数据分析
-
¥199.80
-
-
Bayes统计判决:图像识别导论:introducti…
-
¥98.00
-
-
互联网大厂推荐算法实战
-
¥89.80
|
|
图书信息
|
|
|
自然语言处理中的贝叶斯分析
|
ISBN: | 9787111669579 |
定价: | ¥89.00 |
作者: | (以)谢伊·科恩(Shay Cohen)著 |
出版社: | 机械工业出版社 |
出版时间: | 2021年01月 |
开本: | 26cm |
页数: | 10,225页 |
装祯: | 平装 |
中图法: | O212.8 |
相关供货商
供货商名称
|
库存量
|
库区
|
更新日期
|
|
|
|
|
其它供货商库存合计
|
48
|
|
2024-04-19
|
图书简介 | 本书涵盖了流利阅读NLP中贝叶斯学习方向的论文以及从事该领域的研究所需的方法和算法。这些方法和算法部分来自于机器学习和统计学,部分是针对NLP开发的。我们涵盖推理技术,如马尔科夫链、蒙特卡罗抽样和变分推理、贝叶斯估计和非参数建模。为了应对该领域的快速变化,本书新版增加了一个新的章节,关于贝叶斯背景下的表现学习和神经网络。我们还将介绍贝叶斯统计的基本概念,如先验分布、共轭性和生成式建模。最后,我们回顾了一些基本的NLP建模技术,如语法建模、神经网络和表示学习,以及它们在贝叶斯分析中的应用。 |
目录 | 译者序 第2版前言 第l版前言 第1版致谢 第1章 ;基础知识 ;1.1 ;概率测度 ;1.2 ;变量 ; ;1.2.1 ;连续变量和离散变量 ; ;1.2.2 ;多元变量的联合分布 ;1.3 ;条件分布 ; ;1.3.1 ;贝叶斯法则 ; ;1.3.2 ;独立变量与条件独立变量 ; ;1.3.3 ;可交换的变量 ;1.4 ;变量的期望 ;1.5 ;模型 ; ;1.5.1 ;参数模型与非参数模型 ; ;1.5.2 ;模型推断 ; ;1.5.3 ;生成模型 ; ;1.5.4 ;.模型中的独立假定 ; ;1.5.5 ;有向图模型 ;1.6 ;从数据场景中学r/> ;1.7 ;贝叶斯学派和频率学派的哲学(冰山一角) ;1.8 ;本章小结 ;1.9 ;br/>第2章 ;绪论 ;2.1 ;贝叶斯统计与自然语言处理的结合点概述 ;2.2 ;个例子:隐狄利克雷分配模型 ; ;2.2.1 ;狄利克雷分布 ; ;2.2.2 ;推断 ; ;2.2.3 结 ;2.3 ;个例子:贝叶斯文本回归 ;2.4 ;本章小结 ;2.5 ;br/>第3章 ;先验 ;3.1 ;共轭先验 ; ;3.1.1 ;共轭先验和归一化常数 ; ;3.1.2 ;共轭先验在隐变量模型中的应用 ; ;3.1.3 ;混合共轭先验 ; ;3.1.4 ;重新归一化共轭分布 ; ;3.1.5 ;是否共轭的讨论 ; ;3.1.6 结 ;3.2 ;多项式分布和类别分布的先验 ; ;3.2.1 ;再谈狄利克雷分布 ; ;3.2.2 ;Logistic正态分布 ; ;3.2.3 ;讨论 ; ;3.2.4 结 ;3.3 ;非信息先验 ; ;3.3.1 ;均匀不正常先验 ; ;3.3.2 ;Jeffreys先验 ; ;3.3.3 ;讨论 ;3.4 ;.共轭指数模型 ;3.5 ;模型中的多参数抽取 ;3.6 ;结构先验 ;3.7 ;本章小结 ;3.8 ;br/>第4章 ;贝叶斯估计 ;4.1 ;隐变量学种观点 ;4.2 ;贝叶斯点估计 ; ;4.2.1 ;大后验估计 ; ;4.2.2 ;基于大后验解的后似 ; ;4.2.3 ;决策一理论点估计 ; ;4.2.4 结 ;4.3 ;经验贝叶斯 ;4.4 ;后验的行为 ;4.5 ;本章小结 ;4.6 ;br/>第5章 ;采样算法 ;5.1 ;MCMC算法:概述 ;5.2 ;MCMC推断的自然语言处理模型结构 ;5.3 ;吉布斯采样 ; ;5.3.1 ;坍塌吉布斯采样 ; ;5.3.2 ;运算符视图 ; ;5.3.3 ;并行化的吉布斯采样器 ; ;5.3.4 结 ;5.4 ;Metropolis—Hastjrags算法 ;5.5 ;切片采样 ; ;5.5.1 ;辅助变量采样 ; ;5.5.2 ;切片采样和辅助变量采样在自然语言处理中的应用 ;5.6 ;模拟退火 ;5.7 ;MCMC算法的收敛 ;5.8 ;马尔可夫链:基本理论 ;5.9 ;MCMC领域外的采样算法 ;5.10 ;蒙特卡罗积分 ;5.11 ;讨论 ; ;5.11.1 ;分布的可计算与采样 ; ;5.11.2 ;嵌套的MCMC采样 ; ;5.11.3 ;MCMC方法的运行时间 ; ;5.11.4 ;粒子滤波 ;5.12 ;本章小结 ;5.13 ;br/>第6章 ;变分推断 ;6.1 ;边缘对数似然的变分界 ;6.2 均似 ;6.3 均场变分推断算法 ; ;6.3.1 ;狄利克雷一多项式变分推断 ; ;6.3.2 ;与期望大化算法的联系 ;6.4 ;基于变分推断的经验贝叶斯 ;6.5 ;讨论 ; ;6.5.1 ;推断算法的初始化 ; ;6.5.2 ;收敛诊断 ; ;6.5.3 ;变分推断在解码中的应用 ; ;6.5.4 ;变分推断小化KL散度 ; ;6.5.5 ;在线的变分推断 ;6.6 ;本章小结 ;6.7 ;br/>第7章 ;非参数先验 ;7.1 ;狄利克雷过程:三种视角 ; ;7.1.1 ;折棍子过程 ; ;7.1.2 ;中餐馆过程 ;7.2 ;狄利克雷过程混合模型 ; ;7.2.1 ;基于狄利克雷过程混合模型的推断 ; ;7.2.2 ;狄利克雷过程混合是混合模型的极限 ;7.3 ;层次狄利克雷过程 ;7.4 ;Pitman.Yor过程 ; ;7.4.1 ;Pitman—Yor过程用于语言建模 ; ;7.4.2 ;Pitman—Yor过程的幂律行为 ;7.5 ;讨论 ; ;7.5.1 ;高斯过程 ; ;7.5.2 ;印度自助餐过程 ; ;7.5.3 ;嵌套的中餐馆过程 ; ;7.5.4 ;距离依赖的中餐馆过程 ; ;7.5.5 ;序列记忆器 ;7.6 ;本章小结 ;7.7 ;br/>第8章 ;贝叶斯语法模型 ;8.1 ;贝叶斯隐马尔可夫模型 ;8.2 ;概率上下文无关语法 ; ;8.2.1 ;作为多项式分布集的PCFG ; ;8.2.2 ;PCFG的基本推断算法 ; ;8.2.3 ;作为隐马尔可夫模型的PCFG ;8.3 ;贝叶斯概率上下文无关语法 ; ;8.3.1 ;PCFG的先验 ; ;8.3.2 ;贝叶斯PCFG的蒙特卡罗推断 ; ;8.3.3 ;贝叶斯PCFG的变分推断 ;8.4 ;适配器语法 ; ;8.4.1 ;Pitman.Yor适配器语法 ; ;8.4.2 ;PYAG的折棍子视角 ; ;8.4.3 ;基于PYAG的推断 ;8.5 ;层次狄利克雷过程PCFG ;8.6 ;依存语法 ;8.7 ;同步语法 ;8.8 ;多语言学r/> ; ;8.8.1 ;词标注 ; ;8.8.2 ;语法归纳 ;8.9 ;延伸阅读 ;8.10 ;本章小结 ;8.11 ;br/>第9章 ;表征学经网络 ;9.1 ;神经网络与表征学什么是现在 ;9.2 ;词嵌入 ; ;9.2.1 ;词嵌入的skip—gram模型 ; ;9.2.2 ;贝叶斯skip—rgram词嵌入 ; ;9.2.3 ;讨论 ;9.3 ;神经网络 ; ;9.3.1 ;频率论估计和反向传播算法 ; ;9.3.2 ;神经网络权值的先验 ;9.4 ;神经网络在自然语言处理中的现代应用 ; ;9.4.1 ;循环神经网络和递归神经网络 ; ;9.4.2 ;梯度消失与梯度爆炸问题 ; ;9.4.3 ;神经编码器—解码器模型 ; ;9.4.4 ;卷积神经网络 ;9.5 ;调整神经网络 ; ;9.5.1 ;正则化 ; ;9.5.2 ;超参数调整 ;9.6 ;神经网络生成建模 ; ;9.6.1 ;变分自编码器 ; ;9.6.2 ;生成对抗网络 ;9.7 ;本章小结 ;9.8 ;br/>结束语 附录A ;基本概念 附录B ;概率分布清单 参考文献
|
|