“cfindex”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

185 浏览

coldfusion - Coldfusion cfsearch 不适用于关键字吸烟

我有四个文件 [一个 .PDF、一个 .doc 和两个 .docx]。我使用 ColdFusion Administrator创建了一个名为“testCollection”的 ColdFusion 集合。在管理 ColdFusion 集合屏幕中，我输入了文件扩展名 [.pdf、.doc、.docx] 和放置所有 4 个文件的目录路径。还选中了复选框 [Recursively Index Sub Directories]。单击提交后，我可以在 Solr Collections 中看到 5 个具有其大小的文档。

之后，我在下面写了一个 cfm 文件，以根据其内容搜索文件。
搜索.cfm

当我输入标准“老年”时，它会给我正确的结果并显示除一个文件“Search_Not_Show_For_Aged.docx”之外的所有文件，因为它没有搜索标准内容“老年”。

我的问题是当我输入标准“吸烟”时，它没有给我正确的结果。它显示除一个文件“Search_Not_Show_For_Smoking.docx”之外的所有文件，但该文件包含“吸烟”字样。我将文件放入保管箱并在此处分享

请提出建议并帮助解决此问题。

谢谢

2015-02-12T12:55:17.710

0 投票

0 回答

99 浏览

pdf - Coldfusion索引损坏的文件

对第一个文件运行刷新，然后对所有其他文件运行更新。递归可能不是必需的。

在遇到损坏的 PDF 文件之前可以正常工作。如果我尝试在 PDF 阅读器中手动打开文件，我会收到文件可能已损坏的消息。

我需要它来通过这个文件并继续索引其余部分。我尝试了三分钟的请求超时，但这不起作用。我曾尝试提取 CFPDF 信息，但它也挂起读取它。我不知道如何测试文档以查看它是否已损坏。

最终，我希望它在大约 3 分钟后放弃该文件。

有什么建议么

pdf solr coldfusion cfindex

2015-02-16T18:28:23.393

0 投票

1 回答

506 浏览

solr - HTMLStripCharFilterFactory @ Solr 3.4 是否为返回的字段去除 html？

根据corporatezen.com/2013/11/updating-solr-engine-coldfusion，我正在使用应该使用Solr 3.4的CF10。我添加<charFilter class="solr.HTMLStripCharFilterFactory"/>了，<fieldType name="text">但搜索结果中的摘要字段仍然包含 HTML。知道为什么吗？

<field name="summary" type="text" indexed="false" stored="true" required="false" />

http://localhost:8985/solr/test/admin/schema.jsp显示：

字段：摘要字段类型：TEXT

属性：标记化、存储

模式：标记化，存储

位置增量差距：100

指数分析器：org.apache.solr.analysis.TokenizerChain 详情

字符过滤器：

org.apache.solr.analysis.HTMLStripCharFilterFactory args:{luceneMatchVersion: LUCENE_24 } Tokenizer Class: org.apache.solr.analysis.WhitespaceTokenizerFactory

过滤器：

org.apache.solr.analysis.StopFilterFactory args:{words: stopwords.txt ignoreCase: true enablePositionIncrements: true luceneMatchVersion: LUCENE_24 } org.apache.solr.analysis.WordDelimiterFilterFactory args:{splitOnCaseChange: 1 generateNumberParts: 1 catenateWords: 1 luceneMatchVersion: LUCENE_24 generateWordParts: 1 catenateAll: 0 catenateNumbers: 1 } org.apache.solr.analysis.LowerCaseFilterFactory args:{luceneMatchVersion: LUCENE_24} org.apache.solr.analysis.EnglishPorterFilterFactory args:{protected: protwords.txt luceneMatchVersion: LUCENE_24 } org. apache.solr.analysis.RemoveDuplicatesTokenFilterFactory args:{luceneMatchVersion: LUCENE_24 } 查询分析器：org.apache.solr.analysis.TokenizerChain 详情

字符过滤器：

org.apache.solr.analysis.HTMLStripCharFilterFactory args:{luceneMatchVersion: LUCENE_24 } Tokenizer Class: org.apache.solr.analysis.WhitespaceTokenizerFactory

过滤器：

org.apache.solr.analysis.SynonymFilterFactory args:{synonyms: synonyms.txt expand: true ignoreCase: true luceneMatchVersion: LUCENE_24 } org.apache.solr.analysis.StopFilterFactory args:{words: stopwords.txt ignoreCase: true luceneMatchVersion: LUCENE_24 } org.apache.solr.analysis.WordDelimiterFilterFactory 参数：{splitOnCaseChange：1 generateNumberParts：1 catenateWords：0 luceneMatchVersion：LUCENE_24 generateWordParts：1 catenateAll：0 catenateNumbers：0} org.apache.solr.analysis.LowerCaseFilterFactory 参数：{luceneMatchVersion：LUCENE_24 } org.apache.solr.analysis.EnglishPorterFilterFactory args:{protected: protwords.txt luceneMatchVersion: LUCENE_24 } org.apache.solr.analysis.RemoveDuplicatesTokenFilterFactory args:{luceneMatchVersion: LUCENE_24 }

solr coldfusion coldfusion-10 cfsearch cfindex

2015-02-24T02:27:38.703

0 投票

1 回答

95 浏览

search - 如何将最后修改日期作为字段插入文档集合的 ColdFusion CFIndex 中？

如何使集合的 cfindex 包含一列，该列包含指定目录路径中各种文档的修改日期？文档似乎涵盖了数据库集合搜索的内容，但对文件/文件夹搜索保持沉默。

search solr coldfusion document cfindex

2015-11-04T16:30:57.820

0 投票

0 回答

54 浏览

coldfusion - cfindex 显示插入的记录，但 doccount 为 0

我在查询中使用 cfindex，但无法从索引中获取数据。当我检查它们的集合时，我的其他索引的文档计数大于 0，但即使刷新的状态具有值，这个也始终为 0。这是我的代码：

我认为没有任何理由显示创建 qExams 的查询，但我已经在索引之前转储了它，并且我确实注意到其中确实有数据。

结果#info#如下：

结果#qQizzes#如下：

为了清楚起见，我删除了路径和日期。但是正如您所看到的，大小不是 0，如果我说在索引中添加或删除自定义字段，它甚至会发生变化，但是文档计数始终为 0。

什么会导致每次都为0？

coldfusion cfindex

2016-02-05T15:54:52.063

0 投票

0 回答

70 浏览

solr - 在 solr 集合中包含文件名？

是否可以在 ColdFusion Solr 集合中索引文件，并以可搜索的方式包含文件名？

如果我搜索我知道已编入索引的文件名，并且集合的转储显示键和 url 包含该文件名，它会返回 0 个结果。

我尝试将文件名添加到中的 body 参数中cfindex，但这不起作用：

我知道您通常不会在 a 上包含 body type=file，但我想我会尝试。

solr coldfusion coldfusion-10 cfsearch cfindex

2017-05-02T09:17:09.640

0 投票

0 回答

116 浏览

solr - 有多少 ColdFusion 集合太多了？

我们在 Windows server 2012 R2 上使用 CF 11。有了我们的数据结构，我们需要使用一个非常大或大约 500 个小的 Solr 集合。无论哪种方式，都有哪些优点和缺点？是否有关于收藏数量的最佳实践的指南/参考？任何意见是极大的赞赏！

solr coldfusion coldfusion-11 cfindex

2017-05-23T16:31:36.500

0 投票

0 回答

167 浏览

coldfusion - CFINDEX 给出错误“您的文档包含超过 100000 个字符，因此已达到您请求的限制。”

在 ColdFusion 2016 中，我试图索引一个包含超过 100000 个字符的大文件。

我收到以下错误

org.apache.tika.sax.WriteOutContentHandler$WriteLimitReachedException：您的文档包含超过 100000 个字符，因此已达到您请求的限制。要接收文档的全文，请提高您的限制。（但是可以使用达到限制的文本）。

我在哪里将限制从 100000 增加到 10000000 ？

coldfusion apache-tika coldfusion-2016 cfindex

2019-05-10T10:19:11.770

0 投票

0 回答

62 浏览

solr - ColdFusion 11 更新 19 - 新 SOLR 集合“未找到”问题

我们在 CF 11 中使用了许多 SOLR 集合。在我们应用更新 19 之前创建的集合正在正确刷新并且工作正常。但是，我们安装更新 19 后创建的集合无法正常运行。这是我们看到的：

正在以正确的方式创建一个新集合：一个新目录（带有正确的子目录）出现在 /cfusion/collections 下。CF Administrator 中的 Data & services --> ColdFusion Collections 下会出现一个新集合。但是，运行这一行：抛出“org.apache.solr.client.solrj.SolrServerException”。
当我们尝试通过运行“http://localhost:8987/solr/#collection#/dataimport?command=delta-import&commit=true”来刷新该新集合时，我们会收到 404 Not Found 错误：新创建的集合刷新尝试时出错

我们的旧集合（在我们应用 CF 更新 19 之前创建）正在使用相同的命令正确刷新。

我们在更新 19 中破坏/遗漏了哪些可能导致此问题的内容？非常感谢任何想法或线索！

solr coldfusion jetty coldfusion-11 cfindex

2020-12-29T00:07:16.470

问题标签 [cfindex]

Reference