问题标签 [markov-random-fields]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - 在文本中标记参考/引文
我需要找到一种方法来标记文本中对出版物的引用。我们一直在通过正则表达式执行此操作,但它不适用于这些新模式。
一些例子(语言是德语):
Herzog(2012 年 8 月),Einkommensteuerskriptum Band 1,S 8
Achatz/Bieber 在 Achatz/Kirchmayr, Körperschaftsteuergesetz (2011)
Heinrich in Quantschnigg/Renner/Schellmann/Stöger, Die Körperschaftsteuer (2013) § 7 Rz 32
Raab/Renner in Quantschnigg/Renner/Schellmann/Stöger/Vock, Die Körperschaftsteuer, 24. Lfg., § 8 Tz 292,293
Quantschnigg/Renner/Schellmann/Stöger/Vock (Hrsg), KStG 23 (2013) § 13 Rz 67
因此,它主要以作者姓名和出版物的标题开始,但随后变得非常多样化。在示例中它可能看起来不那么糟糕,但我可以给出更多看起来不同的东西。
所以我认为这可能是机器学习的一项任务。然而,在该领域的经验很少,我发现很难找到合适的技术。
我找到了 POS 标记,但这似乎不是这里的方法。我也偶然发现了 upton CRF,但上面几乎没有什么材料可以让像我这样的初学者开始。
我已经在 sklearn 中进行了一些分类和回归,但仅此而已。
谁能指出我正确的方向?
networking - 贝叶斯推理中消息的定义是什么?
最近开始研究贝叶斯网络模型。这是很有趣的。但我发现每本教科书或任何其他关于贝叶斯网络模型的论文都没有包含对消息的全面定义。
我希望我能拥有一个。
ps:如果您能给我一个精确的(最好是数学的)消息定义,我将非常感激。
machine-learning - 完全连接的成对图形模型
完全连接的成对图形模型能否估计 N 个二元变量的任意联合分布?
machine-learning - 使用条件随机场进行序列学习?
我是顺序学习(和机器学习)的新手,我正在尝试了解如何使用条件随机场来解决我的问题。
我有一个数据集,它是我的应用程序的最终用户何时何地工作的顺序日志。例如,以下数据集将只有 User1 的值
我正在尝试解决以下问题:给定用户工作的工作日和设施,他们接下来将在哪个设施和工作日工作?
为了解决这个问题,我开始研究 Conditional Random Fields,但是对于任何库都很难使用它。
我尝试使用以下库: 1. PyStruct ( https://pystruct.github.io/ ) 但由于这个问题,这对我不起作用:Index out of bounds: Fitting SSVM using Pystruct
- CRFSuite(http://www.chokkan.org/software/crfsuite/)(这依赖于 libBFGS。当我在我的 ubuntu 机器上安装 libbfgs 时没有任何错误,为 CRFSuite 运行“make install”仍然失败并说它无法识别 libBFGS)
所以我转向另一个图书馆.. 3. CRF++ ( https://taku910.github.io/crfpp/ )
我能够安装 CRF++ 并且还能够运行他们发行版中给出的示例。但是,我需要一些帮助来了解如何修改模板文件以适合我的用例......
另外,我在想我的标签将是来自上述数据集的设施+工作日的串联字符串。
我是序列学习的新手,目前正在努力研究如何解决这个问题......
任何建议都会非常有帮助,因为我似乎有点卡在这里..
谢谢!
c++ - 条件随机场(CRF)实现/库
我正在寻找免费的 C++ 条件随机字段 (CRF) 实现,但不适用于文本处理。
有很多很酷的实现:
CRFsuite (用于文本处理)
CRF++ (用于文本处理)
JGMT (Matlab - MEX 不是 C++)
还有其他包,如 Darwin 和 HCRF ,在 C++ 中没有使用示例。
我想知道是否有人知道除我上面提到的以外的任何 C++ CRF 库,或者知道有关如何设置和使用 Darwin 或 HCRF 的任何示例?
matlab - 有条件随机场(CRF)和马尔可夫随机场(MRF)的实用教程吗?
我已经开始在短期内阅读 MRF 和 CRF;但是,我在理解这些概念方面有很多困难。任何人都可以建议一些在线资源以进行理论和基本理解吗?我很难理解这两个概念的数学。
此外,我想在实现过程中尝试查看这两个图形模型的每个阶段,以便更好地理解进一步的实现和利用。是否有任何关于该领域的实用教程正在使用 Matlab/其他编程语言实现?
如果有人知道,我将不胜感激,请指导我,因为我很困惑,不知道如何从头开始。
您的帮助将不胜感激。谢谢...
machine-learning - 为什么马尔可夫随机场中的推理很难?
我正在研究马尔可夫随机场,显然,MRF 中的推理很难/计算成本很高。具体来说,Kevin Murphy 的《机器学习:概率视角》一书说:
“在第一项中,我们将 y 固定为其观察值;这有时称为钳位项。在第二项中,y 是自由的;这有时称为未钳位项或对比项。请注意,计算未钳位项需要推理在模型中,这必须在每个梯度步骤中完成一次。这使得训练无向图模型比训练有向图模型更难。
为什么我们在这里进行推理?我知道我们正在对所有 y 求和,这似乎很昂贵,但我看不出我们实际上在哪里估计任何参数。Wikipedia 还讨论了推理,但只讨论了计算条件分布,以及需要对所有未指定的节点求和……但是……这不是我们在这里要做的,是吗?
或者,任何人都对为什么 MRF 中的推理很困难有很好的直觉?
资料来源:ML:PP 第 19 章:https ://www.cs.ubc.ca/~murphyk/MLbook/pml-print3-ch19.pdf
具体部分见下文
machine-learning - 吉布斯抽样给出了小概率
作为我们最终设计项目的一部分,我们必须设计一个 Gibbs 采样器来对图像进行降噪。我们选择使用 Metropolis 算法而不是常规的 Gibbs 采样器。该算法的粗略草图如下,所有像素都是0-255灰度值。此外,我们使用简单的平滑先验分布。
这几乎就是该程序的要点。我的问题是在我计算概率的步骤中
能量差异如此之大,以至于概率几乎总是为零。减轻这种情况的正确方法是什么?我们也尝试过 Gibbs 抽样方法,但我们遇到了类似的问题。Gibbs 采样器代码如下。我们不使用 metropolisSample,而是使用 gibbsSample
我们在这个实现中也遇到了类似的问题。当我们计算
我们的能量如此之大,以至于我们的概率都归零。从理论上讲,这应该不是问题,因为我们将它们全部相加,然后除以总和,但浮点表示不够准确。什么是解决这个问题的好方法?
optimization - 如何根据特定的能量函数细化 Graphcut cmex 代码?
我下载了以下图形切割代码: https ://github.com/shaibagon/GCMex
我编译了 mex 文件,并为代码中的预定义图像(即 rgb 图像)运行它
我想优化图像分割结果,
我有图像的概率图,其尺寸为(宽度,高度,5)。图像维度上的五个概率分布堆叠在一起。每个都与一个类有关。
我的问题是代码的哪些部分应该根据概率图像。我想根据我的应用程序定义数据和平滑项。我的问题是:
1)有人根据定义的不同能量函数改进了代码(我想改变一元和成对的公式)。
2) 我有一堆 3D 图像。我想定义 6 个邻域系统,当前切片中的 4 个邻居和两个相邻切片中的另外两个。我可以在哪个函数和部分代码中进行改进?
谢谢