问题标签 [phrases]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
.htaccess - htaccess 和波兰语短语 - 友好的 url
我必须用波兰语短语创建一个友好的网址。最后,我的 .htaccess 应该接受所有字母(也包括波兰字母)、数字、加号(+)和减号(-)。你能帮助我吗?
谢谢!
我的网址:
我的 htaccess:
xml - 神秘的 XML date="__________" 数字字符串?
我有这个 XML 文件,它是 vBulletin 论坛的插件/产品。它基本上是一个插件,可以将社交媒体图标放在用户图片下方,链接到该人的社交媒体资料。他们的个人资料中有一个字段,他们输入了他们的信息。例如,他们输入了他们的 youtube 频道名称,当他们发布时,YouTube 图标会出现在他们的头像下方;当它被点击时,它会链接到那个 YouTube 频道。
我需要为其添加一些额外的部分,但是这段代码确实让我感到困惑,我一直无法通过研究找到答案。
每个社交媒体字段都有一个 10 位数的数字串。但我不知道这些数字是从哪里来的。我试过不这样做,但是如果我想输入的每个附加字段没有不同的数字,代码就无法工作。代码在下面,我先把整个块放进去,以防它有助于细节。
此外,可悲的是,编写此插件的人不再回复支持问题。我已经尝试过,去年 7 月向开发人员发布问题但仍未得到回复的其他人也尝试过。
感谢您的时间!
solr - 如何使用 solr 短语
我正在使用 solr4.1.0,我正在尝试让常用词短语搜索工作。这意味着在搜索“the cat”时,我希望显示包含该短语的文档,而不是在某处或不同字段中包含“the”和“cat”的文档。
我有的:
当“正常”单词与 stopwords.txt 中的停用词组合时,这应该输出特殊的 gram 标记。在分析视图中,这按预期工作,因此“the cat”被通用语法化为“the_cat cat”。
我的客户所追求的解决方案是,当查询中的停用词与普通词一起使用时,只有具有此确切短语(停用词 2-shingle)的元素应该匹配。整体默认运算符仍然是 AND。
例如,我有以下字段的文档
- 编号:1;标题:我的猫在它的自然环境中;desc: 世界上最好的动物是猫
- 编号:2;标题:猫是邪恶的;描述:每个人都知道猫是纯粹的邪恶
- 编号:3;标题:猫解谜;desc: 我们的猫叫夏洛克
以下是我想要实现的示例......基本上,用户在搜索、查询和运算符方面或多或少是文盲,因此搜索应该解释输入并“做正确的事”。正确的做法是:
- 输入:cat
结果:docs 1、2、3(为方便起见,没有评分) - 输入:cat world
结果:doc 1
AND 是默认值 - 输入:cat 每个人
结果:doc 2
AND 跨越多个字段 - 输入:猫
结果:doc 1 因为只有这个字段包含短语“猫”,在查询过程中不知何故必须神奇地出现 - 输入:nice cat
结果:[]
因为没有文档包含短语“the nice”,算法会将其解释为常用词短语 - 输入:猫世界
结果:doc 1 - 输入:纯结果:[]
这背后的原因是客户对一些(精心挑选的)停用词有一些具体的想法。
那么这是一种现实的做法吗?在将其传递给 solr 之前是否有必要进行某种查询预解析?还有其他方法可以达到预期的效果吗?
python - 每个句子的python平均短语
给出了这两个函数。
我应该返回每个句子的平均短语数。这是我写的函数
这只会给我 3.0,即总短语除以总句子。我的问题是如何计算(第一句中的总短语)/(总句子)+(第二句中的总短语)/(总句子)+ ...
python - 文本 Python 中的重复短语 _ 跟进
另一位用户已经开始讨论如何在 Python 中查找重复的短语,但只关注三个单词的短语。
Robert Rossney 的答案是完整且有效的(这里是Python 文本中的重复短语),但是我可以要求一种简单地找到重复短语的方法,尽管它们很长?我认为可以详细说明之前讨论中已经阐述的方法,但我不太确定如何去做。
我认为这是可以修改以返回不同长度的元组的函数:
php - PHP - 从网页中解析文本以获取可读短语中的文本/短信
我在 PHP 中工作。
我有一些来自网页/html 文件的文本,它已经通过可读性/简化过程,现在我想将其拆分为不超过一定字符数的短语/消息。
目前:我从整页开始,除了段落标签之外,我剥离标签,我用任何东西替换段落结束标签
这给出了一个段落数组。
对于比允许的最大允许长度更长的每个段落,我将其分解为 '. '。
给出一系列句子。
对于每个超过最大允许长度的句子,我会在“.”上爆炸。(没有空间......对于懒惰的人)。
对于超过最大允许长度的每一个,我会在最大长度内查找最后一个 ' ' 并对此进行拆分。
如果任何文本仍然太长,则将其分块到最大长度。
这一切都是非常连续和循环的,并且可以作为单个消息单独发送的多个短句 - 我相信这可以通过几个正则表达式做得更好。
编辑
java - 从java中的给定文本中提取阿拉伯语短语
你能帮我找到一个包含短语列表的正则表达式,并检查给定文本中是否存在这些短语之一,好吗?
例子:
如果我有hashSet
以下的话:
给定的文本是:كيف الحال أتمنى أن تكون بخير
我想在执行正则表达式后得到:كيف الحال
我的初始代码:
c - 从 C 中的输入文件中读取特定短语
晚上最后一个问题。我尽量不要在每次斗争中发布超过一次哈哈......
这个稍微简单一点。
我有一个 txt 文件,前 8 行中有一系列排列的数字。之后的每一行都是一个特定的短语,例如“BUY ITEM”或“AWARD ITEM”,后跟一个整数(有几个短语,但我只关心一个)。基本上我试图有一个 for 或 while 循环,我可以在其中检测文档中的短语,将指针设置为短语的末尾,然后 fscanf 短语右侧的整数。我遇到的唯一麻烦是将指针指向特定短语的末尾,然后读取数字。以及该短语在不同的行上重复的事实,我不希望一次全部采用这些值。
我确定我可以做一个简单的
就是这样。但是我已经尝试过 fseek 和 fget 并且没有任何东西能够真正帮助获得指向我需要它的位置的指针,而没有预设的去向位置。输入文件每次都会不同,所以我不能只告诉它向下 1024 个空格或类似的东西。只是不知道你会怎么做...
下面还有一个输入文件的例子。
非常感谢任何人的帮助。
solr - 多词短语的 Solr 拼写检查
我对多词短语的 solr 拼写检查建议有疑问。查询“红辣椒”
我明白了
问题是,即使“chiller”在索引中有 4 个结果,“red chiller”也没有。所以我们最终建议了一个结果为 0 的短语。
我该怎么做才能使拼写检查仅对整个短语起作用?我尝试在查询中使用 KeywordTokenizerFactory:
我也尝试添加
内
在 solrconfig.xml 中。
但两者似乎都没有什么不同。
使拼写检查仅给出对整个短语有结果的排序规则的最佳方法是什么?谢谢!
php - 使用 mysql 和 php 查找短语
我正在做一个项目,我需要你在数据库查询中的建议。我正在使用 PHP 和 MySQL。
语境
- 我有一个名为的表,其中
phrases
包含一个phrases
存储短语的列,每个短语由一到三个单词组成。 - 我有一个
text
包含 500 - 1000 个单词的字符串
我需要突出显示数据库表text
中存在的字符串中的所有短语。phrases
我的解决方案
我浏览了短语列表中的每个短语并将其与 进行比较text
,但是短语的数量很大(100k),因此进行此匹配大约需要 2 分钟或更长时间。
有没有更有效的方法来做到这一点?