问题标签 [phrases]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
258 浏览

facebook - 使用 Facebook API 搜索不常用的短语

是否可以获得非常用短语(例如 URL)的结果?

我试图对我的短语进行编码。我使用 PHP urlencode() 函数来尝试查找包含“http://www.google.com”的帖子

但是我得到的是:

0 投票
4 回答
13891 浏览

regex - 正则表达式匹配两个单独的短语

我正在寻找一个可以确保网页上同时显示两个短语的正则表达式。

我需要在网络上确保的两个短语是Current QPS (last 10s, ignored 0)Average Latency (last 100 queries)

网页看起来像(查询时间会有所不同,但文字不会改变):

我能够匹配网站上的每个短语,但不能同时匹配这两个短语。如何让我的工具忽略两个短语之间的内容?

PS我在这里没有用任何语言编程,正则表达式将被放入一个接受正则表达式的工具中。

0 投票
1 回答
94 浏览

javascript - 检测两个或多个 Javascript 字符串中的短语

我想知道是否有一种简单的方法可以检测两个字符串中的“短语”而不用引号引起来。例如:

“我喜欢盒子里的杰克”和“盒子里的杰克有很好的食物”

在这种情况下,将检测到“盒子里的插孔”。现在我可能会遍历整个第一个字符串,看看它是否在第二个字符串中,它不是......并继续减少到更小的长度并通过第二个字符串运行它,直到我找到 3-word-match “盒子里的杰克”……但效率不高。

任何帮助都会很棒 - 谢谢!

0 投票
1 回答
327 浏览

regex - 我想用正则表达式提取多个替代文本实例,但不确定如何

我用它(?<=alt)[\w\s\,\/\(\)\.]*来提取第一个替代文本。这很棒,但我想提取多个替代文本。我在视觉网络开膛手中使用正则表达式

我从中提取的代码是

0 投票
2 回答
277 浏览

perl - 文本文件中的短语搜索

给定一个像“我正在搜索文本”这样的短语和一个包含单词列表的文本文件。

我必须找到文本文件中是否存在单词的每个组合。

例如,我必须搜索出现“我”、“我是”、“我正在搜索”、“我正在搜索”、“正在搜索”等。

我更喜欢用 perl 编写它,我需要一个运行速度更快的最佳解决方案。

示例文本文件:

0 投票
3 回答
260 浏览

html - 使用 perl 正则表达式的混合结果,匹配 html 代码中的短语列表

正则表达式的混合结果,匹配 html 代码中的短语列表

这篇新帖子是对另一篇帖子的回应,Perl Regex match lines that contains multiple words,但由于我不知道的原因被版主删除了。在原始线程中问这个问题对我来说似乎是合乎逻辑的,因为它与尝试使用该线程早期给出的解决方案以及它的问题有关。有一个对faq的通用引用,它似乎没有显示任何差异,以及消息,“如果您有问题,请发布您自己的问题。” 因此这篇文章。

我正在使用 LWP::Simple 获取网页,然后尝试匹配包含某些短语的行。我在上述线程中的答案#1中复制了正则表达式,并替换/添加了我需要匹配的单词,但是我得到的结果与两个相似但不同的网页混合在一起。

我正在使用的正则表达式是:

对于网站#1,它有包含这些单词的裸行,在一系列由<pre>..</pre>标签包围的块中,它匹配所有与该行完全相同的行,如预期的那样:

但是对于网站#2,它的单词周围有令人讨厌的小标签:

它匹配每一行!

我确定<span>标签是执行此操作的“正确”方式,但我想知道如何绕过这些标签,以便我可以为两个站点只使用一个正则表达式。有没有一种简单的方法可以做到这一点,还是我必须学习如何解析 html(我不想这样做)?

我正在寻找一种快速的解决方案,而不是一个强大的解决方案。这可能是一次性的交易。如果这些相对静态的页面发生变化,它可能会很小并且很容易修复。请不要向我介绍所有“反正则表达式换html”页面。我见过他们。请不要让我使用 HTML::TreeBuilder。哦拜托...

0 投票
1 回答
872 浏览

pos-tagger - Mallet CRF SimpleTagger 短语/多词

我是 Mallet 的新手,我正在尝试使用 mallet 简单标记器/CRF 并尝试使用短语 - 我尝试在 mallet 网站上查找文档并浏览用户档案 - 没有任何帮助。

我尝试训练槌进行简单标记,它的工作原理很好。这是我的数据的样子(请注意训练之间有一个换行符,表示它们是不同的集合)

样本训练数据:

我遇到的问题是当城市名称是多个单词时,说

请注意,在上述训练数据中,“新”是一个停止词问题

  1. 对于简单标记器,上述表示是否正常?如果不是,我如何表示短语?
  2. 如果不是如何表示数据,以便 SimpleTagger/CRF 可以使用前面的“n”个词来到达标签?即我输入的一种块
0 投票
4 回答
1614 浏览

php - PHP用短语替换脏话

所以我知道如何用其他单词替换某些单词。我想弄清楚的是如何取一个词并用一个短语替换它并消除所有其他输入。

例如:

坏词是“狗”

用户输入->“你闻起来像狗。”

而不是用“彩虹”或其他东西代替“狗”,我希望它回应类似的东西:“你是一个便盆”。

这是我的代码:

有了这个代码,它就会回响:“你闻起来像你是个大嘴巴。”

我确定这是一个转发,我很抱歉。我能找到的所有内容都是关于如何仅替换部分字符串而不是整个字符串的文档。

0 投票
0 回答
71 浏览

java - Solr ...如何同时进行搜索和更正词?

我有两个列表(真的有很多),我需要在它们之间进行匹配。例如:

我有这样的文件:

  • 曼联
  • 阿森纳足球俱乐部
  • 维冈
  • ...

第二个列表是这样的:

  • 曼彻斯特大学
  • 兵工厂
  • 维冈足球俱乐部
  • ...

所以,我需要查询第二个列表的每个单词是否存在于第一个列表中(如果适用,请更正它)。

我不能使用字典,因为单词列表总是在变化。每个列表词可以有多个词。

我正在寻找一些方法,如 N-gram、拼写检查器等......但我很困惑,因为这些方法逐个字母工作(例如第一个“M”,第二个“Ma”......)而且我不知道是什么做或开始。你如何解决这个问题?问候!

0 投票
1 回答
134 浏览

f# - 查找字符串中的短语和每个短语的频率

我正在使用 f# 编写一个脚本,该脚本在给定的字符串或文本中查找短语,以及每个短语的频率。

该短语将包含 2 个或更多单词。

我知道如何用其他语言做到这一点,但我对 F Sharp 中的匿名函数很感兴趣,目前我正在学习和寻找。

这是一个非常复杂且有用的想法,因为短语包含两个或多个单词。

到目前为止我所拥有的:

对于问题的第一部分,我可以找到一个解决方案,但是在多次尝试计算每个短语在字符串中使用了多少之后,我感到迷茫。

上面的代码可以检查任何给定的短语是否在 a 字符串中。

谁能帮我为每个短语的频率添加一个计数器?