问题标签 [phrase]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何使用 python 将 html 存储在 MySQL 表中
好的,这是我的代码。希望你能帮助我。我正在使用名为 MySQLdb 的 MySQL 库。
我的问题是,每次我调用该函数时,它都不会正确地表达 HTML。我什么都试过了,你能帮忙吗?
mysql - 布尔全文搜索排除短语 AB-CD,例如 -“AB-CD”?
我有一个填充了某些值的表,例如
使用 MySQL 全文布尔搜索,我想在此表中搜索包含“delta”的所有名称,但排除其唯一代码“ab-cd”的第一个结果基本。此代码包含一个减号,这是一项要求,无法删除。
因此,在我看来,以下查询“应该”适应这一点:
但是,运行此查询不会产生所需的结果,因为结果仍然包含带有要排除的代码“ab-cd”的行。
这两个表的 Coalition 都设置为 utf8_bin。
ft_min_word_len 值设置为 4。
有人可能会提出这种行为的原因吗,我假设它可能将字符串视为两个单独的值,例如“-ab”、“-cd”,并且由于 ft_min_word_len 值为 4,这两个字符串都不能产生任何结果?
我认为使用封装“”意味着第二个减号将被视为文字,但似乎情况并非如此。也许它与我不知道的表联盟有关?
无论如何,任何建议/建议/输入/反馈/方向将不胜感激,谢谢!
firefox - Firefox 是否在其 Google Analytics cookie 中存储关键字?
我正在尝试提取某人曾经登陆网站的关键词。而且由于我有 Google Analytics 脚本,我应该能够获取 cookie 名称 ___utmz,然后查找字符串“utmctr=....”来查找哪些关键字。
但是,在 Firefox 中,无论如何,我总是看到(未提供)
如果有人使用 FF 访问,有没有办法提取关键字?
php - PHP 正则表达式关键字匹配
我有一个文本字段,用户将在其中输入逗号分隔的关键字或关键短语,然后服务器将使用这些值来检查多个文本主体是否匹配。
所以基本上我需要的是匹配一个精确的短语,不区分大小写,在正文中可能有空格。
通过生成以下正则表达式,我可以轻松匹配关键字:
示例关键字:peanut, butter, jelly
生成正则表达式:/peanut|butter|jelly/i
但是有空格是行不通的。即使我将给定值中的空格替换为\s
示例:peanut butter, jelly sandwich, delicious
正则表达式:/peanut\sbutter|jelly\ssandwich|delicious/i
什么是正确匹配短语的正确正则表达式?不区分大小写并使用 PHP 的 preg_match
?
谢谢。
编辑
这就是我正在做的事情:
以上生成如上所述的表达式(没有将空格替换为\s
,因为它不起作用。)
接下来我简单地做preg_match( $keywordsRegex, $text );
search - 使用通配符的 Lucene 多短语查询搜索
我一直在尝试进行 lucene 搜索查询,其中输入“Foo B”将返回“Foo Bar”、Foo Bear、Foo Build 等,但不会返回 ID 为“Foo”和单词“Bar”的记录在说它的“描述”字段。
我已经研究过 multiphrasequery 但它从不返回任何结果,下面是我一直在尝试的
sql - 部分句子值的 SQL LIKE
我有一个数据库(更改),我正在尝试创建一个关于详细字段值的 sql 报告。问题是细节值显示一个“短语”,我需要根据这个短语或它的一部分进行评估。
SQL
我希望它显示详细信息包含“至:[1. 第二步]”的所有值,但结果始终没有返回任何内容,其中有表值。以下是详细信息字段的完整值的示例:“[Step] Changed From: [1. Step One] To: [1. Step Two]” [] 中的项目也代表数据库中的其他值
.net - 如何检测某个短语或正则表达式的“错字”?
如何检测错字,但仅限于特定短语。另一种思考方式是如何检测某个正则表达式的错字。
例如,我不想要一个通用的错字查找器,我在上面找到了多个资源。我不想要一个通用的拼写检查器,我再次找到了多个资源。
我将如何为一个相对恒定的值编写一个错字检查器......比如说:
超级秘密 13-12345
它应该总是说“超级秘密 NN-NNNNN”(N 表示任何 0-9 数字)。
它会将以下内容标记为“拼写错误”:
- 超级秘密 13-12345
- 超级秘密 1312345
- 精子 13-123456
- 斯普尔秘密 13-12345
- 超级秘密
- 13-12345
它不会将以下内容标记为“拼写错误”:
- 超级秘密 13-12345
- 任何其他随机词
- 超人飞越丛林
我最担心额外的字符泄漏、转置字符或不遵循 NN-NNNNN 格式的数字。
我觉得这是一个可以回答的问题,但我可能只是没有使用正确的词问 Google 或 SO。
我正在用 .NET 编写它,但显然可以移植任何东西。
java - Java - 单词和短语频率计数
这是我的困境。
我需要一个可以在随机文本中找到出现次数最多的字符串模式的函数。
所以如果输入是这样的:
按出现排序的输出应如下所示(不区分大小写):
就我而言,我只需要包含 2 个或更多单词的短语。知道如何解决这个问题吗?
java - 没有 solr 的短语的 Lucene java 建议器
我有一个带有二进制文档(如 PDF)的大型数据库和一个没有 TermFreqVector 的索引,只是“Store.NO,Index.ANALYZED”。我正在尝试使用它来实现短语建议器/预测器。我想搜索单个和多个单词,例如:“where”或“where are”,我希望得到“where are you john”之类的内容。
我很惊讶 LUKE 能够以某种方式从创建的索引中逐词恢复文档文档(我已经检查了它的来源,但是......我仍然不知道没有 TermFreqVector 怎么可能)。有没有人知道这怎么可能?我的建议者有两个选择:
1)使用“不知何故”卢克的机制从我现在拥有的索引中恢复文档。(那将是最好的)。
2) 为短语建议者创建另一个索引。(然而,目前实施的索引大约需要 2-3 天和大约 4-5Gigs)。我已经在网上搜索了解决方案,但其中大多数导致我无法使用的 SOLR。
我已经尝试了一些解决方案,但是......我卡住了。
我将不胜感激任何提示。
solr - 使用 solr 突出显示确切的短语
我使用 solrj 作为客户端来索引 solr 服务器上的文档我是 solr 的新手,而且我在 solr 中突出显示有问题。用 solr 突出显示确切的短语不起作用。
例如,如果关键字是:“dulce hogar”,它会返回:
它应该是:
我不明白是哪个问题。
我在 schema.xml 中的配置
在 solrconfig.xml
提前感谢您的帮助,
西尔。