“phrases”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

113 浏览

.htaccess - htaccess 和波兰语短语 - 友好的 url

我必须用波兰语短语创建一个友好的网址。最后，我的 .htaccess 应该接受所有字母（也包括波兰字母）、数字、加号（+）和减号（-）。你能帮助我吗？

谢谢！

我的网址：

我的 htaccess：

2013-11-22T16:30:33.887

0 投票

1 回答

75 浏览

xml - 神秘的 XML date="__________" 数字字符串？

我有这个 XML 文件，它是 vBulletin 论坛的插件/产品。它基本上是一个插件，可以将社交媒体图标放在用户图片下方，链接到该人的社交媒体资料。他们的个人资料中有一个字段，他们输入了他们的信息。例如，他们输入了他们的 youtube 频道名称，当他们发布时，YouTube 图标会出现在他们的头像下方；当它被点击时，它会链接到那个 YouTube 频道。

我需要为其添加一些额外的部分，但是这段代码确实让我感到困惑，我一直无法通过研究找到答案。

每个社交媒体字段都有一个 10 位数的数字串。但我不知道这些数字是从哪里来的。我试过不这样做，但是如果我想输入的每个附加字段没有不同的数字，代码就无法工作。代码在下面，我先把整个块放进去，以防它有助于细节。

此外，可悲的是，编写此插件的人不再回复支持问题。我已经尝试过，去年 7 月向开发人员发布问题但仍未得到回复的其他人也尝试过。

感谢您的时间！

xml date vbulletin phrases

2014-01-14T12:55:21.607

0 投票

0 回答

127 浏览

solr - 如何使用 solr 短语

我正在使用 solr4.1.0，我正在尝试让常用词短语搜索工作。这意味着在搜索“the cat”时，我希望显示包含该短语的文档，而不是在某处或不同字段中包含“the”和“cat”的文档。

我有的：

当“正常”单词与 stopwords.txt 中的停用词组合时，这应该输出特殊的 gram 标记。在分析视图中，这按预期工作，因此“the cat”被通用语法化为“the_cat cat”。

我的客户所追求的解决方案是，当查询中的停用词与普通词一起使用时，只有具有此确切短语（停用词 2-shingle）的元素应该匹配。整体默认运算符仍然是 AND。

例如，我有以下字段的文档

编号：1；标题：我的猫在它的自然环境中；desc: 世界上最好的动物是猫
编号：2；标题：猫是邪恶的；描述：每个人都知道猫是纯粹的邪恶
编号：3；标题：猫解谜；desc: 我们的猫叫夏洛克

以下是我想要实现的示例......基本上，用户在搜索、查询和运算符方面或多或少是文盲，因此搜索应该解释输入并“做正确的事”。正确的做法是：

输入：cat
结果：docs 1、2、3（为方便起见，没有评分）
输入：cat world
结果：doc 1
AND 是默认值
输入：cat 每个人
结果：doc 2
AND 跨越多个字段
输入：猫
结果：doc 1 因为只有这个字段包含短语“猫”，在查询过程中不知何故必须神奇地出现
输入：nice cat
结果：[]
因为没有文档包含短语“the nice”，算法会将其解释为常用词短语
输入：猫世界
结果：doc 1
输入：纯结果：[]

这背后的原因是客户对一些（精心挑选的）停用词有一些具体的想法。
那么这是一种现实的做法吗？在将其传递给 solr 之前是否有必要进行某种查询预解析？还有其他方法可以达到预期的效果吗？

solr phrases

2014-02-20T13:47:59.647

0 投票

1 回答

394 浏览

python - 每个句子的python平均短语

给出了这两个函数。

我应该返回每个句子的平均短语数。这是我写的函数

这只会给我 3.0，即总短语除以总句子。我的问题是如何计算（第一句中的总短语）/（总句子）+（第二句中的总短语）/（总句子）+ ...

python average sentence phrases

2014-03-10T23:10:35.153

0 投票

1 回答

257 浏览

python - 文本 Python 中的重复短语 _ 跟进

另一位用户已经开始讨论如何在 Python 中查找重复的短语，但只关注三个单词的短语。

Robert Rossney 的答案是完整且有效的（这里是Python 文本中的重复短语），但是我可以要求一种简单地找到重复短语的方法，尽管它们很长？我认为可以详细说明之前讨论中已经阐述的方法，但我不太确定如何去做。

我认为这是可以修改以返回不同长度的元组的函数：

python phrases

2014-03-11T13:22:15.770

0 投票

0 回答

324 浏览

php - PHP - 从网页中解析文本以获取可读短语中的文本/短信

我在 PHP 中工作。

我有一些来自网页/html 文件的文本，它已经通过可读性/简化过程，现在我想将其拆分为不超过一定字符数的短语/消息。

目前：我从整页开始，除了段落标签之外，我剥离标签，我用任何东西替换段落结束标签

这给出了一个段落数组。

对于比允许的最大允许长度更长的每个段落，我将其分解为 '. '。

给出一系列句子。

对于每个超过最大允许长度的句子，我会在“.”上爆炸。（没有空间......对于懒惰的人）。

对于超过最大允许长度的每一个，我会在最大长度内查找最后一个 ' ' 并对此进行拆分。

如果任何文本仍然太长，则将其分块到最大长度。

这一切都是非常连续和循环的，并且可以作为单个消息单独发送的多个短句 - 我相信这可以通过几个正则表达式做得更好。

编辑

php html regex parsing phrases

2014-04-04T11:04:20.860

0 投票

1 回答

1243 浏览

java - 从java中的给定文本中提取阿拉伯语短语

你能帮我找到一个包含短语列表的正则表达式，并检查给定文本中是否存在这些短语之一，好吗？

例子：

如果我有hashSet以下的话：

给定的文本是：كيف الحال أتمنى أن تكون بخير

我想在执行正则表达式后得到：كيف الحال

我的初始代码：

java regex arabic phrases

2014-05-17T11:22:52.327

0 投票

1 回答

234 浏览

c - 从 C 中的输入文件中读取特定短语

晚上最后一个问题。我尽量不要在每次斗争中发布超过一次哈哈......

这个稍微简单一点。

我有一个 txt 文件，前 8 行中有一系列排列的数字。之后的每一行都是一个特定的短语，例如“BUY ITEM”或“AWARD ITEM”，后跟一个整数（有几个短语，但我只关心一个）。基本上我试图有一个 for 或 while 循环，我可以在其中检测文档中的短语，将指针设置为短语的末尾，然后 fscanf 短语右侧的整数。我遇到的唯一麻烦是将指针指向特定短语的末尾，然后读取数字。以及该短语在不同的行上重复的事实，我不希望一次全部采用这些值。

我确定我可以做一个简单的

就是这样。但是我已经尝试过 fseek 和 fget 并且没有任何东西能够真正帮助获得指向我需要它的位置的指针，而没有预设的去向位置。输入文件每次都会不同，所以我不能只告诉它向下 1024 个空格或类似的东西。只是不知道你会怎么做...

下面还有一个输入文件的例子。

非常感谢任何人的帮助。

c file-io scanf fseek phrases

2014-09-27T00:24:56.443

0 投票

1 回答

1958 浏览

solr - 多词短语的 Solr 拼写检查

我对多词短语的 solr 拼写检查建议有疑问。查询“红辣椒”

我明白了

问题是，即使“chiller”在索引中有 4 个结果，“red chiller”也没有。所以我们最终建议了一个结果为 0 的短语。

我该怎么做才能使拼写检查仅对整个短语起作用？我尝试在查询中使用 KeywordTokenizerFactory：

我也尝试添加

内

在 solrconfig.xml 中。

但两者似乎都没有什么不同。

使拼写检查仅给出对整个短语有结果的排序规则的最佳方法是什么？谢谢！

solr spell-checking phrases

2014-12-30T19:38:45.923

0 投票

1 回答

70 浏览

php - 使用 mysql 和 php 查找短语

我正在做一个项目，我需要你在数据库查询中的建议。我正在使用 PHP 和 MySQL。

语境

我有一个名为的表，其中phrases包含一个phrases存储短语的列，每个短语由一到三个单词组成。
我有一个text包含 500 - 1000 个单词的字符串

我需要突出显示数据库表text中存在的字符串中的所有短语。phrases

我的解决方案

我浏览了短语列表中的每个短语并将其与进行比较text，但是短语的数量很大（100k），因此进行此匹配大约需要 2 分钟或更长时间。

有没有更有效的方法来做到这一点？

php mysql search full-text-search phrases

2015-01-01T11:32:09.633

问题标签 [phrases]

Reference