问题标签 [bayesian]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1656 浏览

c# - 如何使用内容和主题过滤电子邮件?

在我的应用程序(C#)中,我需要根据电子邮件的内容过滤电子邮件。如果电子邮件是双重选择,则需要将其发送到指定的电子邮件地址,如果它是普通电子邮件,我应该将其发送到另一个电子邮件地址。

我查看了进来的电子邮件,并列出了出现在双重选择电子邮件主题中的常用词(最多 10 - 20 个词)。对于收到的每封电子邮件,我检查了主题是否包含一些单词,以及它们是否超过 2-3 个,具体取决于主题长度,我决定这是一个选择加入。问题是这个基本版本不能很好地工作。

我阅读了有关垃圾邮件过滤器的信息(基本上我想做的是类似的。)在网上搜索了一些示例后,我发现了一些基于贝叶斯网络的示例。这个解决方案的问题是我需要提供很多我还没有的培训材料。

我如何在不需要大量培训材料的情况下根据内容+主题或仅主题过滤这些电子邮件?

编辑:我想在电子邮件服务器级别进行过滤。

0 投票
3 回答
1933 浏览

events - Erlang中事件流(又名CEP)的实时关联/分析框架?

想分析一个事件流,共享某些特征(一个共同的来源),并在给定的时间窗口内,最终关联这些多个事件并从中得出一些推论,最后启动一些动作。

我对复杂事件处理 (CEP) 的有限了解告诉我,它是此类事情的理想选择。然而,到目前为止,在我的研究中,我发现人们将其与规则引擎和贝叶斯分类器进行比较,有时还会使用它们的组合。

想知道有没有——

  1. 要遵循的一些最佳实践(理想情况下由性能数据和事件性质/类型的描述支持),尤其是在 Erlang 中?

  2. Erlang 有自己的 CEP 框架吗?

  3. Erlang 中有任何可用的贝叶斯分类器库吗?

来自 Java 世界的 Esper 似乎与我想做的事情非常接近,但如果可能的话,我更愿意保留我的环境仅 Erlang(或仅 Erlang 和 C/C++)。

指点、建议、指导——欢迎大家。

谢谢,

我知道了

0 投票
2 回答
788 浏览

artificial-intelligence - 经典人工智能、本体论、机器学习、贝叶斯

我开始研究应用于计算机视觉和情感计算的机器学习和贝叶斯推理。

如果我理解正确的话,之间会有很大的讨论

  • 经典 IA、本体论、语义网研究人员
  • 和机器学习和贝叶斯人

我认为它通常被称为强人工智能与弱人工智能,也与功能心理学(大脑作为黑盒集)和认知心理学(心智理论,镜像神经元)等哲学问题相关,但这不是编程论坛的重点这个。

我想了解这两种观点之间的差异。理想情况下,答案将参考示例和学术论文,其中一种方法获得良好结果而另一种方法失败。我也对历史趋势感兴趣:为什么方法失宠,而新的方法开始兴起。例如,我知道贝叶斯推理在计算上是棘手的,在 NP 中存在问题,这就是为什么长期以来概率模型在信息技术世界中不受青睐的原因。然而,它们已经开始在计量经济学中崛起。

0 投票
2 回答
1448 浏览

algorithm - 想知道贝叶斯分类器是否是正确的方法?

我想知道贝叶斯分类器是否适用于应用程序,其中相同的短语“冷盘”(例如)在关联某些事物(啤酒、苏打水)时是“好”,但在与其他事物相关时是“坏”(牛排、比萨饼,汉堡)?

我想知道的是,如果训练一个贝叶斯分类器(“啤酒冷”和“苏打冷”是“好”)会取消训练它“牛排冷”和“汉堡冷”是“坏”)。

或者,是否可以(正确地)训练贝叶斯“冷食”可能是“好”或“坏”,这取决于它与什么相关联?

我在这里和其他地方发现了很多关于贝叶斯的好信息,但无法确定它是否适合这种类型的应用程序,其中一个短语的好坏答案是“取决于”?

0 投票
2 回答
2830 浏览

ruby - 贝叶斯分类器分数代表什么?

我正在使用ruby​​ 分类器 gem,它的分类方法返回根据训练模型分类的给定字符串的分数。

分数是百分比吗?如果是这样,最大差异是 100 分吗?

0 投票
1 回答
465 浏览

python - Python Orange 分布式计算

我目前正在使用 Python 包Orange对大量数据进行一些分类测试。我主要使用朴素贝叶斯方法,并且我从其他应用程序中知道能够分发到多个节点进行计算。不幸的是,Orange 似乎没有能力使用多台计算机或内核。

有人在集群环境中使用过 Orange 吗?还是在多核计算机上?

任何的意见都将会有帮助..

问候

0 投票
2 回答
478 浏览

java - 推文价值预测:什么样的分析(贝叶斯?)可以预测 Twitter 用户对推文的重视程度?

我正在考虑向TalkingPuffin Twitter 客户端添加一个功能,在对用户进行一些培训后,它可以根据预测值对传入的推文进行排名。Java 虚拟机(首选 Scala 或 Java)有哪些解决方案来执行此类操作?

0 投票
2 回答
1185 浏览

artificial-intelligence - 分类器算法的参数优化

据说不同的算法有不同的参数。我真的不认为这是真的,比如说如果它是一个树决策算法和朴素贝叶斯算法,每个的参数是什么?谁能给我一个例子。。

如果是这种情况,那么对将要使用决策树算法运行的数据进行 5 折交叉验证与贝叶斯算法不同吗?

同样对于参数优化,我将进行 5 折交叉验证。有没有办法自动执行此操作以使用 weka 确定参数的设置值键?

0 投票
2 回答
1739 浏览

nlp - 文档分析和标记

假设我有一堆我想要标记、分类等的文章(数千篇)。理想情况下,我想通过手动分类/标记几百来训练一些东西,然后放开它。

你会推荐哪些资源(书籍、博客、语言)来完成这样的任务?我的一部分认为这将非常适合贝叶斯分类器甚至潜在语义分析,但除了我从一些红宝石中发现的内容外,我对任何一个都不太 熟悉

贝叶斯分类器可以解决这样的问题吗?我应该更多地关注语义分析/自然语言处理吗?或者,我应该只是从那里寻找关键字密度和映射吗?

任何建议表示赞赏(如果需要的话,我不介意拿起几本书)!

0 投票
2 回答
6968 浏览

matlab - 用 mvnpdf MATLAB 分类

xtrain matrix2 features2000 rows作为训练对数据进行分类,所以维度是2, μ 是 2 元素向量, Σ 是协方差矩阵 2x2:

mu = 0.3486 0.8327

我正在做类似的事情:

然后计算:

问题是如何用 a 测试分类器的结果xtest matrix

例子)mvnpdf(X,Mean,Cov)

X <=我们要分类的数据
Mean<= 创建时已知
Cov<= 创建时已知

对每个类的数据计算pdfgauss and multiply by Prior(w)进行分类并选择一个显示最大值的类

要使用这些函数 pdfgauss 使用一些东西来计算距离 dist = mahalan(X,Mean(:,i),Cov(:,:,i));

  • 我如何完成这个分类?

pdfgauss.m