问题标签 [heuristics]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
8 回答
3485 浏览

algorithm - 计算机国际象棋树搜索的最新技术是什么?

我对提供百分之几速度的微小优化不感兴趣。我对 alpha-beta 搜索最重要的启发式方法很感兴趣。以及评估功能的最重要组成部分。

我对具有最大(改进/代码大小)比率的算法特别感兴趣。(不是(改进/复杂性))。

谢谢。

PS Killer move heuristic 就是一个完美的例子——易于实现且功能强大。启发式数据库太复杂了。

0 投票
2 回答
6962 浏览

model-view-controller - 你应该在 MVC 中给你的控制器起什么名字?什么时候应该创建一个新的?

我有一个真正适用于任何 MVC 框架的问题,我正在使用 Zend Framework MVC。

你应该在什么时候创建一个新的控制器?控制器层究竟应该定义什么?

我用 MVC 创建了几个应用程序,逐渐变得更加可重用,但我一直在为控制器类命名而苦苦挣扎。在大多数情况下,它匹配任何 URL 请求,因此是业务/前端逻辑。但在某些情况下,这似乎完全是武断的。

有人可以遵循一些启发式/指南吗?似乎所有关于 MVC 的炒作,尤其是 PHP,关于实际约定和启发式的数据很少。因为创建一个杂乱无章的 MVC 应用程序非常容易......

0 投票
1 回答
4843 浏览

antivirus - 防病毒程序如何检测 EICAR 测试病毒?

EICAR 测试病毒用于测试反病毒程序的功能。为了将其检测为病毒,

防病毒程序是否应具有测试病毒的病毒定义

或者

启发式将其检测为可疑模式并将其检测为病毒。

(我见过一个 AV 程序在下载时删除文件但没有将病毒识别为 EICAR 测试病毒的情况。就像一个可疑对象--> 即如果它有定义它应该识别病毒名称、详细信息等不是'是吗?)

0 投票
8 回答
455 浏览

spam-prevention - 启发式发现垃圾邮件发送者/机器人(在论坛、博客等中)

我能想到的方法是:

  1. 测量动作之间的时间。
  2. 比较帖子的内容(如果它们彼此太相似),或者更好的是,只比较发布的链接。
  3. 检查用户活跃的一段时间内的分布(如果用户活跃,比如每小时发布一次,持续一周,那么我们这里要么有超人,要么有机器人)。
  4. 预计会有一些特殊活动:就像在 stackoverflow 中一样,我希望用户按下他们的用户名链接(顶部中间)来查看他们的新答案、评论、问题等。
  5. (由 chakrit 添加)帖子中的链接数。
  6. 不是启发式的。使用一些异步 JS 进行用户登录。(只是让机器人程序员的生活变得更加艰难)。
  7. (由 Alekc 添加)不是启发式的。用户代理值。
  8. 而且,我怎么会忘记 Google 的方法(Will Hartung 提到过)。让用户能够将某人标记为垃圾邮件,足够的垃圾邮件投票意味着这是一个垃圾邮件用户。(计算什么是足够的用户,是这里的工作)。

还有什么想法吗?

0 投票
2 回答
1645 浏览

python - 从文件中提取位图

给定一个未知规格的复杂文件,其中包含未压缩的位图文件 (.BMP),您将如何在 Python 中提取它?
扫描“BM”标签并查看以下字节是否“类似”BMP 标头?

0 投票
3 回答
12839 浏览

image - 检测照片方向的算法

我想自动旋转照片,即使关于图像方向的 EXIF 元数据不可用。

有没有很好的算法来检测照片的方向?这些图像是来自数码相机的照片。该算法不一定要完美运行,但减少正确旋转照片所需的人工交互量将是一个好处。

我找到了有关该主题的两篇论文:

对其他研究特别是实现的指针表示赞赏。

0 投票
1 回答
328 浏览

yahoo-pipes - Yahoo-Pipes,最佳实践:“使用字符串正则表达式循环”与“正则表达式”

在“带有字符串正则表达式的循环”和“正则表达式”模块之间做出决定时,要考虑什么有用的启发式方法?

0 投票
2 回答
359 浏览

html - 查找 HTML 部分文档的内容

这不是一个真正的编程问题,更像是一个算法问题。

问题:查找 HTML 页面的“内容”部分。

“内容”是指包含人类看到的页面内容的dom,没有噪音,只是“页面实际内容”。我知道问题没有明确定义,但让我们继续...例如在博客网站中,这通常很容易,当浏览到特定帖子时,您通常在页面顶部有一些工具栏,可能还有一些导航元素LHS 然后你有包含内容的 div 。试图从 HTML 中找出这一点可能很棘手。然而,幸运的是,大多数博客都有 RSS 提要,并且在此特定帖子的提要中,您会找到 <description> 部分(或 <content:encoded>),这正是您想要的。因此,为了细化内容的定义,这是页面上包含有趣部分的实际内容,删除所有广告、导航元素等。所以从博客中查找内容相对容易,假设它们有 RSS。其他支持 RSS 的网站也是如此。

新闻网站呢?在许多情况下,新闻网站都有 RSS,但并非总是如此。那么如何在新闻网站上找到内容呢?更一般的网站呢?许多网页(当然不是全部)都有内容部分和其他部分。你能想出一个好的算法来找到“有趣”的部分和不那么有趣的部分吗?也许从不变的部分改变的部分?

希望我已经说清楚了...谢谢!

0 投票
2 回答
2753 浏览

algorithm - 等距地图的准确 A* 搜索启发式?

我已经编写了 A* 搜索算法的实现。问题是我目前使用的启发式方法只能在方形网格上准确地工作。由于我的地图是等距的,因此启发式没有考虑地图的实际布局,因此也没有考虑单元格之间的距离。

更新:经过大量的日志记录和分析(读作花费大量时间试图找出平庸),我得出的结论是,我目前的启发式方法工作得很好,有一个小例外:最终结果与真正的直线相反对角线运动。

这意味着在等轴测sqrt(2)地图上,直线移动的成本实际上是对角线移动的数倍,它被计算为对角线移动的移动。问题是:如何修改我当前的启发式方法,以便为等距布局产生正确的结果?简单地替换为,反之亦然是行不通的。diagonalstraight

地图布局

0 投票
3 回答
3302 浏览

nlp - 如何从 Project Gutenberg 文本中去除页眉/页脚?

我尝试了各种方法来从 Project Gutenberg 文本中剥离许可证,以用作语言学习项目的语料库,但我似乎无法提出一种无监督、可靠的方法。到目前为止,我想出的最好的启发式方法是剥离前 28 行和最后 398 行,这适用于大量文本。关于我可以自动剥离文本的方法的任何建议(这对于许多文本来说非常相似,但在每种情况下略有不同,还有一些不同的模板),以及关于如何验证文本已被准确剥离,将非常有用。