问题标签 [phrases]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
113 浏览

.htaccess - htaccess 和波兰语短语 - 友好的 url

我必须用波兰语短语创建一个友好的网址。最后,我的 .htaccess 应该接受所有字母(也包括波兰字母)、数字、加号(+)和减号(-)。你能帮助我吗?

谢谢!

我的网址:

我的 htaccess:

0 投票
1 回答
75 浏览

xml - 神秘的 XML date="__________" 数字字符串?

我有这个 XML 文件,它是 vBulletin 论坛的插件/产品。它基本上是一个插件,可以将社交媒体图标放在用户图片下方,链接到该人的社交媒体资料。他们的个人资料中有一个字段,他们输入了他们的信息。例如,他们输入了他们的 youtube 频道名称,当他们发布时,YouTube 图标会出现在他们的头像下方;当它被点击时,它会链接到那个 YouTube 频道。

我需要为其添加一些额外的部分,但是这段代码确实让我感到困惑,我一直无法通过研究找到答案。

每个社交媒体字段都有一个 10 位数的数字串。但我不知道这些数字是从哪里来的。我试过不这样做,但是如果我想输入的每个附加字段没有不同的数字,代码就无法工作。代码在下面,我先把整个块放进去,以防它有助于细节。

此外,可悲的是,编写此插件的人不再回复支持问题。我已经尝试过,去年 7 月向开发人员发布问题但仍未得到回复的其他人也尝试过。

感谢您的时间!

0 投票
0 回答
127 浏览

solr - 如何使用 solr 短语

我正在使用 solr4.1.0,我正在尝试让常用词短语搜索工作。这意味着在搜索“the cat”时,我希望显示包含该短语的文档,而不是在某处或不同字段中包含“the”和“cat”的文档。

我有的:

当“正常”单词与 stopwords.txt 中的停用词组合时,这应该输出特殊的 gram 标记。在分析视图中,这按预期工作,因此“the cat”被通用语法化为“the_cat cat”。

我的客户所追求的解决方案是,当查询中的停用词与普通词一起使用时,只有具有此确切短语(停用词 2-shingle)的元素应该匹配。整体默认运算符仍然是 AND。

例如,我有以下字段的文档

  1. 编号:1;标题:我的猫在它的自然环境中;desc: 世界上最好的动物是猫
  2. 编号:2;标题:猫是邪恶的;描述:每个人都知道猫是纯粹的邪恶
  3. 编号:3;标题:猫解谜;desc: 我们的猫叫夏洛克

以下是我想要实现的示例......基本上,用户在搜索、查询和运算符方面或多或少是文盲,因此搜索应该解释输入并“做正确的事”。正确的做法是:

  1. 输入:cat
    结果:docs 1、2、3(为方便起见,没有评分)
  2. 输入:cat world
    结果:doc 1
    AND 是默认值
  3. 输入:cat 每个人
    结果:doc 2
    AND 跨越多个字段
  4. 输入:猫
    结果:doc 1 因为只有这个字段包含短语“猫”,在查询过程中不知何故必须神奇地出现
  5. 输入:nice cat
    结果:[]
    因为没有文档包含短语“the nice”,算法会将其解释为常用词短语
  6. 输入:猫世界
    结果:doc 1
  7. 输入:纯结果:[]

这背后的原因是客户对一些(精心挑选的)停用词有一些具体的想法。
那么这是一种现实的做法吗?在将其传递给 solr 之前是否有必要进行某种查询预解析?还有其他方法可以达到预期的效果吗?

0 投票
1 回答
394 浏览

python - 每个句子的python平均短语

给出了这两个函数。

我应该返回每个句子的平均短语数。这是我写的函数

这只会给我 3.0,即总短语除以总句子。我的问题是如何计算(第一句中的总短语)/(总句子)+(第二句中的总短语)/(总句子)+ ...

0 投票
1 回答
257 浏览

python - 文本 Python 中的重复短语 _ 跟进

另一位用户已经开始讨论如何在 Python 中查找重复的短语,但只关注三个单词的短语。

Robert Rossney 的答案是完整且有效的(这里是Python 文本中的重复短语),但是我可以要求一种简单地找到重复短语的方法,尽管它们很长?我认为可以详细说明之前讨论中已经阐述的方法,但我不太确定如何去做。

我认为这是可以修改以返回不同长度的元组的函数:

0 投票
0 回答
324 浏览

php - PHP - 从网页中解析文本以获取可读短语中的文本/短信

我在 PHP 中工作。

我有一些来自网页/html 文件的文本,它已经通过可读性/简化过程,现在我想将其拆分为不超过一定字符数的短语/消息。

目前:我从整页开始,除了段落标签之外,我剥离标签,我用任何东西替换段落结束标签

这给出了一个段落数组。

对于比允许的最大允许长度更长的每个段落,我将其分解为 '. '。

给出一系列句子。

对于每个超过最大允许长度的句子,我会在“.”上爆炸。(没有空间......对于懒惰的人)。

对于超过最大允许长度的每一个,我会在最大长度内查找最后一个 ' ' 并对此进行拆分。

如果任何文本仍然太长,则将其分块到最大长度。

这一切都是非常连续和循环的,并且可以作为单个消息单独发送的多个短句 - 我相信这可以通过几个正则表达式做得更好。

编辑

0 投票
1 回答
1243 浏览

java - 从java中的给定文本中提取阿拉伯语短语

你能帮我找到一个包含短语列表的正则表达式,并检查给定文本中是否存在这些短语之一,好吗?

例子:

如果我有hashSet以下的话:

给定的文本是:كيف الحال أتمنى أن تكون بخير

我想在执行正则表达式后得到:كيف الحال

我的初始代码:

0 投票
1 回答
234 浏览

c - 从 C 中的输入文件中读取特定短语

晚上最后一个问题。我尽量不要在每次斗争中发布超过一次哈哈......

这个稍微简单一点。

我有一个 txt 文件,前 8 行中有一系列排列的数字。之后的每一行都是一个特定的短语,例如“BUY ITEM”或“AWARD ITEM”,后跟一个整数(有几个短语,但我只关心一个)。基本上我试图有一个 for 或 while 循环,我可以在其中检测文档中的短语,将指针设置为短语的末尾,然后 fscanf 短语右侧的整数。我遇到的唯一麻烦是将指针指向特定短语的末尾,然后读取数字。以及该短语在不同的行上重复的事实,我不希望一次全部采用这些值。

我确定我可以做一个简单的

就是这样。但是我已经尝试过 fseek 和 fget 并且没有任何东西能够真正帮助获得指向我需要它的位置的指针,而没有预设的去向位置。输入文件每次都会不同,所以我不能只告诉它向下 1024 个空格或类似的东西。只是不知道你会怎么做...

下面还有一个输入文件的例子。

非常感谢任何人的帮助。

0 投票
1 回答
1958 浏览

solr - 多词短语的 Solr 拼写检查

我对多词短语的 solr 拼写检查建议有疑问。查询“红辣椒”

我明白了

问题是,即使“chiller”在索引中有 4 个结果,“red chiller”也没有。所以我们最终建议了一个结果为 0 的短语。

我该怎么做才能使拼写检查仅对整个短语起作用?我尝试在查询中使用 KeywordTokenizerFactory:

我也尝试添加

在 solrconfig.xml 中。

但两者似乎都没有什么不同。

使拼写检查仅给出对整个短语有结果的排序规则的最佳方法是什么?谢谢!

0 投票
1 回答
70 浏览

php - 使用 mysql 和 php 查找短语

我正在做一个项目,我需要你在数据库查询中的建议。我正在使用 PHP 和 MySQL。

语境

  • 我有一个名为的表,其中phrases包含一个phrases存储短语的列,每个短语由一到三个单词组成。
  • 我有一个text包含 500 - 1000 个单词的字符串

我需要突出显示数据库表text中存在的字符串中的所有短语。phrases

我的解决方案

我浏览了短语列表中的每个短语并将其与 进行比较text,但是短语的数量很大(100k),因此进行此匹配大约需要 2 分钟或更长时间。

有没有更有效的方法来做到这一点?