问题标签 [cfindex]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
185 浏览

coldfusion - Coldfusion cfsearch 不适用于关键字吸烟

我有四个文件 [一个 .PDF、一个 .doc 和两个 .docx]。我使用 ColdFusion Administrator创建了一个名为“testCollection”的 ColdFusion 集合。在管理 ColdFusion 集合屏幕中,我输入了文件扩展名 [.pdf、.doc、.docx] 和放置所有 4 个文件的目录路径。还选中了复选框 [Recursively Index Sub Directories]。单击提交后,我可以在 Solr Collections 中看到 5 个具有其大小的文档。

之后,我在下面写了一个 cfm 文件,以根据其内容搜索文件。
搜索.cfm

当我输入标准“老年”时,它会给我正确的结果并显示除一个文件“Search_Not_Show_For_Aged.docx”之外的所有文件,因为它没有搜索标准内容“老年”。

我的问题是当我输入标准“吸烟”时,它没有给我正确的结果。它显示除一个文件“Search_Not_Show_For_Smoking.docx”之外的所有文件,但该文件包含“吸烟”字样。我将文件放入保管箱并在此处分享

请提出建议并帮助解决此问题。

谢谢

0 投票
0 回答
99 浏览

pdf - Coldfusion索引损坏的文件

对第一个文件运行刷新,然后对所有其他文件运行更新。递归可能不是必需的。

在遇到损坏的 PDF 文件之前可以正常工作。如果我尝试在 PDF 阅读器中手动打开文件,我会收到文件可能已损坏的消息。

我需要它来通过这个文件并继续索引其余部分。我尝试了三分钟的请求超时,但这不起作用。我曾尝试提取 CFPDF 信息,但它也挂起读取它。我不知道如何测试文档以查看它是否已损坏。

最终,我希望它在大约 3 分钟后放弃该文件。

有什么建议么

0 投票
1 回答
506 浏览

solr - HTMLStripCharFilterFactory @ Solr 3.4 是否为返回的字段去除 html?

根据corporatezen.com/2013/11/updating-solr-engine-coldfusion,我正在使用应该使用Solr 3.4的CF10。我添加<charFilter class="solr.HTMLStripCharFilterFactory"/>了,<fieldType name="text">但搜索结果中的摘要字段仍然包含 HTML。知道为什么吗?

<field name="summary" type="text" indexed="false" stored="true" required="false" />

http://localhost:8985/solr/test/admin/schema.jsp显示:

字段:摘要字段类型:TEXT

属性:标记化、存储

模式:标记化,存储

位置增量差距:100

指数分析器:org.apache.solr.analysis.TokenizerChain 详情

字符过滤器:

org.apache.solr.analysis.HTMLStripCharFilterFactory args:{luceneMatchVersion: LUCENE_24 } Tokenizer Class: org.apache.solr.analysis.WhitespaceTokenizerFactory

过滤器:

org.apache.solr.analysis.StopFilterFactory args:{words: stopwords.txt ignoreCase: true enablePositionIncrements: true luceneMatchVersion: LUCENE_24 } org.apache.solr.analysis.WordDelimiterFilterFactory args:{splitOnCaseChange: 1 generateNumberParts: 1 catenateWords: 1 luceneMatchVersion: LUCENE_24 generateWordParts: 1 catenateAll: 0 catenateNumbers: 1 } org.apache.solr.analysis.LowerCaseFilterFactory args:{luceneMatchVersion: LUCENE_24} org.apache.solr.analysis.EnglishPorterFilterFactory args:{protected: protwords.txt luceneMatchVersion: LUCENE_24 } org. apache.solr.analysis.RemoveDuplicatesTokenFilterFactory args:{luceneMatchVersion: LUCENE_24 } 查询分析器:org.apache.solr.analysis.TokenizerChain 详情

字符过滤器:

org.apache.solr.analysis.HTMLStripCharFilterFactory args:{luceneMatchVersion: LUCENE_24 } Tokenizer Class: org.apache.solr.analysis.WhitespaceTokenizerFactory

过滤器:

org.apache.solr.analysis.SynonymFilterFactory args:{synonyms: synonyms.txt expand: true ignoreCase: true luceneMatchVersion: LUCENE_24 } org.apache.solr.analysis.StopFilterFactory args:{words: stopwords.txt ignoreCase: true luceneMatchVersion: LUCENE_24 } org.apache.solr.analysis.WordDelimiterFilterFactory 参数:{splitOnCaseChange:1 generateNumberParts:1 catenateWords:0 luceneMatchVersion:LUCENE_24 generateWordParts:1 catenateAll:0 catenateNumbers:0} org.apache.solr.analysis.LowerCaseFilterFactory 参数:{luceneMatchVersion:LUCENE_24 } org.apache.solr.analysis.EnglishPorterFilterFactory args:{protected: protwords.txt luceneMatchVersion: LUCENE_24 } org.apache.solr.analysis.RemoveDuplicatesTokenFilterFactory args:{luceneMatchVersion: LUCENE_24 }

0 投票
1 回答
95 浏览

search - 如何将最后修改日期作为字段插入文档集合的 ColdFusion CFIndex 中?

如何使集合的 cfindex 包含一列,该列包含指定目录路径中各种文档的修改日期?文档似乎涵盖了数据库集合搜索的内容,但对文件/文件夹搜索保持沉默。

0 投票
0 回答
54 浏览

coldfusion - cfindex 显示插入的记录,但 doccount 为 0

我在查询中使用 cfindex,但无法从索引中获取数据。当我检查它们的集合时,我的其他索引的文档计数大于 0,但即使刷新的状态具有值,这个也始终为 0。这是我的代码:

我认为没有任何理由显示创建 qExams 的查询,但我已经在索引之前转储了它,并且我确实注意到其中确实有数据。

结果#info#如下:

结果#qQizzes#如下:

为了清楚起见,我删除了路径和日期。但是正如您所看到的,大小不是 0,如果我说在索引中添加或删除自定义字段,它甚至会发生变化,但是文档计数始终为 0。

什么会导致每次都为0?

0 投票
0 回答
70 浏览

solr - 在 solr 集合中包含文件名?

是否可以在 ColdFusion Solr 集合中索引文件,并以可搜索的方式包含文件名?

如果我搜索我知道已编入索引的文件名,并且集合的转储显示键和 url 包含该文件名,它会返回 0 个结果。

我尝试将文件名添加到中的 body 参数中cfindex,但这不起作用:

我知道您通常不会在 a 上包含 body type=file,但我想我会尝试。

0 投票
0 回答
116 浏览

solr - 有多少 ColdFusion 集合太多了?

我们在 Windows server 2012 R2 上使用 CF 11。有了我们的数据结构,我们需要使用一个非常大或大约 500 个小的 Solr 集合。无论哪种方式,都有哪些优点和缺点?是否有关于收藏数量的最佳实践的指南/参考?任何意见是极大的赞赏!

0 投票
0 回答
167 浏览

coldfusion - CFINDEX 给出错误“您的文档包含超过 100000 个字符,因此已达到您请求的限制。”

在此处输入图像描述在 ColdFusion 2016 中,我试图索引一个包含超过 100000 个字符的大文件。

我收到以下错误

org.apache.tika.sax.WriteOutContentHandler$WriteLimitReachedException:您的文档包含超过 100000 个字符,因此已达到您请求的限制。要接收文档的全文,请提高您的限制。(但是可以使用达到限制的文本)。

我在哪里将限制从 100000 增加到 10000000 ?

0 投票
0 回答
62 浏览

solr - ColdFusion 11 更新 19 - 新 SOLR 集合“未找到”问题

我们在 CF 11 中使用了许多 SOLR 集合。在我们应用更新 19 之前创建的集合正在正确刷新并且工作正常。但是,我们安装更新 19 后创建的集合无法正常运行。这是我们看到的:

  1. 正在以正确的方式创建一个新集合:一个新目录(带有正确的子目录)出现在 /cfusion/collections 下。CF Administrator 中的 Data & services --> ColdFusion Collections 下会出现一个新集合。但是,运行这一行:抛出“org.apache.solr.client.solrj.SolrServerException”。

  2. 当我们尝试通过运行“http://localhost:8987/solr/#collection#/dataimport?command=delta-import&commit=true”来刷新该新集合时,我们会收到 404 Not Found 错误: 新创建的集合刷新尝试时出错

我们的旧集合(在我们应用 CF 更新 19 之前创建)正在使用相同的命令正确刷新。

我们在更新 19 中破坏/遗漏了哪些可能导致此问题的内容?非常感谢任何想法或线索!