问题标签 [indexing-service]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
2471 浏览

ocr - 如何让索引服务和 MODI 通过 OCR 生成全文?

我已配置索引服务来索引我的文件,其中还包括保存为高分辨率TIFF文件的扫描图像。我还安装了 MS Office 2003+ 并正确配置了 MS Office Document Imaging (MODI),因此我可以对我的图像执行OCR,甚至可以将OCR的文本嵌入到 TIFF 中。

索引服务能够索引和查找那些手动 OCR 并使用文本数据重新保存的TIFF -s(使用 MS Document Imaging 工具)。

事实证明,与 Windows XP SP2 一起部署的数据执行保护 (DEP) 认为 MODI 是恶意的,并拒绝让它发挥作用。我已经能够通过完全关闭 DEP 来让它工作,但我发现这个解决方案并不优雅。

在不禁用 DEP 的情况下,是否有更好的解决方案来完成这项工作?

0 投票
2 回答
11876 浏览

windows-xp - 如何强制 Windows 索引“活动”

Windows 索引服务在检测到“用户处于活动状态”时会自行暂停。无论用户活动如何,是否有注册表项或其他内容可以使其继续索引?

说明:在 Windows XP 中

0 投票
2 回答
318 浏览

file - 无法浏览某些 pdf 和文档

我有一个网站,它使用 Microsoft 索引服务来索引和查询包含 pdf、rtf、mht 和 doc 类型的各种文档的目录。索引和查询运行良好(大部分情况下);但是,有些文件会加载,而有些则不会。

这是一个使用 IIS 6 运行站点的 Windows Server 2003 机器。

索引目录是站点根目录之外的子目录(即http://my.domain.com/files/)。

URL 中的文件路径准确无误;但是,我只能访问每种文件类型的一些文件。我无法访问的文件会给出 404 File Not Found。我可以通过 Windows 资源管理器打开所有文件;但是,尝试通过浏览器通过 http 打开它们是命中注定的。

有没有人遇到过这个问题并知道如何解决它?任何人都知道为什么我可以访问某些文件而不能访问其他文件?有没有人对尝试这个有什么建议(即所有者是否重要或类似的东西?)?


编辑: 这是错误文件的请求和响应标头:

GET /files/file1.pdf HTTP/1.1 接受:image/gif、image/jpeg、image/pjpeg、image/pjpeg、application/x-shockwave-flash、application/xaml+xml、application/vnd.ms-xpsdocument、 application/x-ms-xbap, application/x-ms-application, application/x-silverlight, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword, / Accept-Language: en-us用户代理:Mozilla/4.0(兼容;MSIE 8.0;Windows NT 5.1;Trident/4.0;.NET CLR 1.1.4322;.NET CLR 2.0.50727;.NET CLR 3.0.04506.30;.NET CLR 3.0.04506.590;. NET CLR 3.0.04506.648;.NET CLR 3.5.21022;.NET CLR 3.0.4506.2152;.NET CLR 3.5.30729)接受编码:gzip,放气代理连接:保持活动主机:my.domain.com

HTTP/1.1 404 Not Found Content-Length: 1635 Content-Type: text/html Server: Microsoft-IIS/6.0 X-Powered-By: ASP.NET Date: Mon, 01 Jun 2009 15:38:54 GMT [典型 404页面标记除外]

这是好文件的请求/响应标头:

GET /files/file2.pdf HTTP/1.1 接受:image/gif、image/jpeg、image/pjpeg、image/pjpeg、application/x-shockwave-flash、application/xaml+xml、application/vnd.ms-xpsdocument、 application/x-ms-xbap, application/x-ms-application, application/x-silverlight, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword, / Accept-Language: en-us用户代理:Mozilla/4.0(兼容;MSIE 8.0;Windows NT 5.1;Trident/4.0;.NET CLR 1.1.4322;.NET CLR 2.0.50727;.NET CLR 3.0.04506.30;.NET CLR 3.0.04506.590;. NET CLR 3.0.04506.648;.NET CLR 3.5.21022;.NET CLR 3.0.4506.2152;.NET CLR 3.5.30729)接受编码:gzip,放气代理连接:保持活动主机:my.domain.com

HTTP/1.1 200 OK 内容长度:352464 内容类型:application/pdf 上次修改时间:2009 年 1 月 13 日星期二 15:27:35 GMT 接受范围:字节 ETag:“74ccc5759375c91:2a47” 服务器:Microsoft-IIS/ 6.0 X-Powered-By:ASP.NET 日期:星期一,2009 年 6 月 1 日 15:50:33 GMT

0 投票
1 回答
224 浏览

asp.net - 如果 Windows 索引服务不索引 Web.Config,它可以重新启动应用程序池吗?

我正在与我的一位同事就这个问题进行轻微的辩论。

场景:网站有一个使用 Windows 索引服务编制索引的子目录。此目录中没有 web.config,并且索引服务未索引作为站点根目录的父目录。某些事情导致应用程序池在所谓的随机时间重新启动。

根据我在网上找到的信息,Windows 索引服务唯一会导致应用程序池重新启动的情况是它正在索引 web.config(或 machine.config)。我的同事说索引服务导致重新启动只是因为它位于根目录的子文件夹中。

那么......有没有人有这方面的任何信息或经验?如果索引服务正在索引根目录的子文件夹而不是根目录本身,是否会导致 IIS 重新启动站点的应用程序池?

编辑:有问题的子目录不是 bin 目录。我知道这也会导致这样的情况;但是,bin 目录不是索引服务的目标。

0 投票
1 回答
73 浏览

sharepoint - 如何最好地处理传递给 IFilter 的照片?

我正在实现一个用于索引图像格式的 IFilter。一个问题是照片 - 许多用户拥有大量照片,照片很大,加载和搜索照片上的文字非常耗时。

是的,有时人们使用相机而不是扫描仪来对文档进行数字化处理,但 IMO 的潜在问题远远超过了遇到使用照片相机数字化文档的可能性。所以我的实现根本不会从照片中提取文本。

一旦检测到给定文件是照片图像,IFilter 应该做什么 - 指示错误或返回空文本?

0 投票
1 回答
187 浏览

indexing - 索引服务器与带有破折号或圆点的远程服务器名称通信的问题

您好我遇到问题,访问远程索引服务器目录。服务器的名称中有 - 在其中,所以我将索引目录名称设置为:

即 num.num.num.num\name of catalog 或 an-example-server

使用 ole 数据连接从索引中提取结果时出现以下错误:

“初始化字符串的格式不符合从索引 39 开始的规范”

我试着把单引号和 &qoute; 没有运气 - 有人知道吗?

PS。这个 Microsoft 索引服务器问题!

0 投票
3 回答
816 浏览

c - 如何检查windows文件索引是ON还是OFF

C 中有一个 API 可以用来检查文件索引是打开还是关闭?代码表示赞赏。

0 投票
1 回答
347 浏览

c# - 索引服务:获取自定义属性的空列

我正在关注这个例子: http: //www.codinghorror.com/blog/2005/12/getting-started-with-indexing-service.html

但是,转换为数据集会显示我的自定义属性的空列。如果我对列使用路径或文件名,我会取回数据。我已设置要缓存的属性,尝试了两个级别,并已重新扫描完整。

我已经在我的桌面(windows vista 32 位)和 Windows 2008 R2 服务器上尝试了这个示例,结果相同。

0 投票
1 回答
81 浏览

indexing-service - 索引服务器问题

我有一个 HTML 文件,我通过 Index Server 遇到了问题。这是有问题的文字。

       (B)   每直线英里10,800美元

       (C)   每直线英里40,000美元

我的问题是粗体字。

  • 如果我搜索800,它会找到文档
  • 如果我搜索$10,它会找到文档
  • 如果我搜索$40,它会找到文档
  • 如果我搜索$10,80010,800$40,00040,000,无论我是否用双引号将文本括起来,它都不会找到该文档。

我想也许是逗号,但我可以在索引服务器存储库中找到其他文档,其中包含 40,000,它会找到它。

有任何想法吗?

0 投票
1 回答
702 浏览

c# - 查询远程索引服务数据库

我正在尝试从 ASP.NET 搜索远程 Windows 2003 服务器的索引服务。MS 站点上有此示例代码,但仅用于本地搜索。这是我到目前为止所得到的;此示例中的远程服务器称为“indexserver”,不在域中,并且有一个名为“system”的索引:

运行它会给我错误“多步 OLE DB 操作生成错误。如果可用,请检查 OLE DB 状态。没有完成任何工作”。

有谁知道如何让这个工作?我需要做的就是在索引中查询文件名并取回该文件的路径。