问题标签 [manifoldcf]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
mongodb - 为manifoldcf编写Mongo DB输出连接器
我们正在尝试通过 apache 歧管 CF 将存储库内容推送到 MongoDb。
而且我们没有找到任何自定义输出连接器的示例代码。可能吗?有人可以帮忙吗?
谢谢!!
elasticsearch - 使用 Tika 转换提取内容 - Manifold CF
我们正在使用 Manifold Cf 将 Documentum 内容索引到 Elasticsearch。我们无法从附件中获取内容,但元数据可用。
有没有办法使用 Tika 转换来获取内容?或者请提出一些获取内容的方法。
java - Manifoldcf documentum 爬行缓慢
我们正在使用 ManiFoldCF documentum 连接器从 DCTM 存储库中爬取数据,并将爬取的数据写入 MongoDB。使用限制值 500 触发爬网。但是每分钟的爬网速度非常慢,连接器仅获取 170 个文档。安装 MCF 的服务器配置了足够的内存和 8 个逻辑核心 (CPU)。有人可以在这里帮助我们提高爬行速度吗?
manifoldcf - ManifoldCF 和 Postgresql 抓取 150 万份文档
我们使用 ManifoldCF 和 Postgresql (9.6) 来抓取我们的网站。在 500.000 文档之前,爬行速度很好(大约 20.000 文档/小时)。在性能下降之后,我们可以看到爬行的长时间冻结(非常长)。我们怀疑postgresql 重建了intrinsiclink 表的索引。可以禁止这个吗?通过 postgresql 的设置?
谢谢丹
rest - Apache ManifoldCF:通过 REST API 获取存储库连接的历史报告
我正在尝试通过 ManifoldCF REST API 获取存储库连接的历史报告。根据文档:
应该可以使用以下 URL(连接名称:myConnection):
http://localhost:8345/mcf-api-service/json/repositoryconnectionhistory/myConnection
我也尝试使用一些历史查询参数:
http://localhost:8345/mcf-api-service/json/repositoryconnectionhistory/myConnection?report=simple
但我不确定我是否正确使用它们或它们应该如何附加到 URL,因为文档中没有提到它。问题也是我没有收到任何错误,而是一个空对象,因此很难调试。即使对于不存在的连接,API 也会返回一个空对象。
但是它适用于没有任何属性的资源,例如:
http://localhost:8345/mcf-api-service/json/repositoryconnectionjobs/myConnection
或者
http://localhost:8345/mcf-api-service/json/repositoryconnections/myConnection
提前感谢您的帮助。
apache - 在 solr 服务器重新启动时丢失 solr 数据
我是 Apache Manifold(版本 - 2.12)和 Solr(版本 - 7.6)和 Zookeeper(版本 3.14)的新手。我在 Solr 中创建了三个集合,其中两个的数据来自 Manifold,而一个来自通过简单的 solr API 手动插入的数据。当我在 Manifold 中运行作业时,我可以看到数据被插入到 Solr 中,并且可以通过查询 Solr 看到。
但是当我重新启动 solr 时,所有的分片和副本都会关闭并且永远不会恢复。此外,我无法重新加载集合,因为它总是给出超时错误。我尝试进行索引备份,然后尝试恢复它,但恢复也因超时错误而失败。我尝试了这个重新加载命令,从安装它们的同一台服务器恢复命令,但它仍然失败。看起来问题仅在于数据来自 Manifold 的集合,因为我通过 Solr API 插入数据的其他集合在重新启动后正常启动。我没有看到正确登录 solr 日志的任何错误。
如果我在进行配置时遗漏了任何东西,或者 solr 上存在某种锁定,因此我没有得到任何重新加载、恢复命令正常工作并且在重新启动 solr 时我失去了一切。
请建议。
elasticsearch - ApacheManifoldCF elasticsearch 输出连接器版本兼容性
我正在尝试将 elasticsearch 作为 apache ManifoldCF 的输出连接器连接。使用不工作的 elasticsearch 7.1.X 版本。
您能否建议 maniFoldCF 与最新的 elasticsearch 版本一起使用?
尝试使用 elasticsearch 配置存储库和输出插件。执行了一项工作,但在弹性搜索中没有任何结果。
数据应从 repo 爬取到 elasticsearch 索引。但是最新的弹性搜索版本并没有发生。
oracle - Alfresco Community Edition、ManifoldCF 和 Elasticsearch 优化全文搜索
如何集成数百万个文档 Alfresco 社区版 CMIS 存储库和存储相同文档元数据的 Oracle RDBMS 存储库,通过 Apache ManifoldCF 对 Elasticsearch 中的组合元数据进行索引以构建聚集索引并优化全文搜索?
我现在正在关注本教程。但我不太确定这是更好的方法。
感谢您的时间!
alfresco - 我需要在 ManifoldCF 中配置权限吗?
在 Apache ManifoldCF 上,我配置了一个 CMIS 存储库连接器,它只访问一个文档存储库。在配置阶段,我提供了管理员用户名和密码。我在分别连接到 MongoDB 输出连接器和 Elasticsearch 输出连接器的两个作业中使用此 CMIS 存储库连接器。我需要配置权限吗?