问题标签 [document-management]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
256 浏览

.net - 可扩展的 .Net 文档管理,价格低于 3 万美元

我希望回答销售人员试图在预算内进行销售时有时会向我们开发人员提供的问题之一。

我们有一个客户需要以下内容:

  • 支持 AD 身份验证的文档管理系统(即使服务器可能在另一个位置 - 可能在 VPN 上)
  • 我们能够批量导入大约 2000 个文档(比如说 PDF 和 Word 文档等)
  • 需要将一些文档标记为“外部”,然后允许我们编写他们网站的一部分,以便在“下载”部分显示文档
  • 相当不错的权限管理
  • 用 .Net 和 MSSQL 编写,以便我们可以在需要时进入游戏(通过 api 或直接)
  • 有很好的记录和支持,能够在一两个月内加入并完成部署。(我们还需要在 DM 之外做很多其他的事情)

外部软件的全部预算为 30-40K 美元。

这听起来像是一项不可能完成的任务,因为软件的预算和时间表有点痛苦,但这是工作,我们需要额外的开发和实施(更不用说导入)的预算 - 这将远远超过成本软件,但不足以支付提供相同级别功能集和美感的定制解决方案

0 投票
2 回答
1056 浏览

php - 在文档管理应用程序中检查文档副本和类似文档

更新:我现在为 ssdeep C API 编写了一个名为php_ssdeep的 PHP 扩展,以促进 PHP 中的模糊散列和散列比较。更多信息可以在我的博客上找到。我希望这对人们有所帮助。

我参与在 Linux 机器上用 PHP 编写自定义文档管理应用程序,该应用程序将存储各种文件格式(可能有 1000 个文件),我们需要能够检查之前是否已上传文本文档以防止数据库中的重复.

本质上,当用户上传一个新文件时,我们希望能够向他们展示一个重复文件或包含类似内容的文件列表。这将允许他们选择一个预先存在的文件或继续上传他们自己的文件。

类似的文档将通过查看其内容中的类似句子以及可能动态生成的关键字列表来确定。然后,我们可以向用户显示匹配百分比,以帮助他们找到重复项。

您能否推荐任何用于此过程的软件包以及您过去可能如何完成此操作的任何想法?

我认为可以通过获取所有文本内容和

  • 剥离空白
  • 删除标点符号
  • 转换为小写或大写

然后形成一个 MD5 散列来与任何新文档进行比较。例如,如果用户编辑文档以添加额外的段落分隔符,则删除这些项目应该有助于防止找不到重复项。有什么想法吗?

这个过程也可能作为夜间作业运行,如果计算要求太大而无法实时运行,我们可以在用户下次登录时通知用户任何重复项。然而,实时将是首选。

0 投票
3 回答
1065 浏览

.net - .NET 文档管理系统设计 - 性能问题

我需要开发一个具有以下规范的基本 .NET 文档管理系统:

  1. 数据应该是可移植的和自包含的,所以我会将文档(典型格式包括 Word、PDF、Excel 和 Powerpoint)序列化为二进制数据。然后,我会将上述二进制数据存储在 SQL Server 2005 数据库中。当用户需要下载文档时,系统会对二进制数据进行反序列化,并以原始格式呈现。

  2. 平均行大小不能大于 200k。

  3. 我们预计在三年内每月最多上传 500 份文件。

  4. 我们预计数据库的大小不会超过 6 GB

  5. 我们的最大目标是 20,000 人可能同时访问该系统。

我的问题是:为了提供可靠的性能、防止站点停机等,该技术需要有多强大?

我是一名新手开发人员,对这种架构和设计并不熟悉。

0 投票
2 回答
2495 浏览

content-management-system - 帮助为 DMS 选择 Alfresco 或 Nuxeo

我需要开发具有一些初始要求的 DMS(文档管理系统):

  1. 如果可能,DMS 应该是开源的
  2. 最初 DMS 应支持多达 500 个用户
  3. 系统应该在用户或内容方面具有可扩展性
  4. 文档/内容应存储在文件系统上
  5. 文件应该能够被标记以便以后销毁
  6. 必须具备工作流能力
  7. 必须具备版本控制能力
  8. 很高兴拥有 Liferay 门户的 SSO(单点登录)
  9. 很高兴有可能通过 Liferay 中的 portlet 公开一些功能
  10. 文件管理应通过网络界面完成
  11. 很高兴拥有共享驱动器功能
  12. 很高兴有关于添加/更改内容的事件和通知

目前我很怀疑在 Alfresco 和 Nuxeo 之间进行选择。

我将不胜感激在它们之间进行选择的任何帮助。

提前致谢

0 投票
1 回答
227 浏览

java - 是否存在 Objective-Java 集成库?

注意:这不是一个 Objective-C 问题,与 Objective-c 无关。

回复:目标:文档管理系统。http://www.objective.com/

我正在寻找一个与 Records Management Objective ver 交互的库。7系统。我想下载文件,并将文件保存到目标中。

该网站没有提及与第 3 方软件的集成。我的朋友 Google 与许多其他不相关的“客观”项目相匹配。

我在哪里可以找到这样的图书馆?如果可能的话还有文件?

0 投票
1 回答
1535 浏览

mysql - 使用 Alfresco CMS 时将文档存储到 DBMS 的原因是什么

我在想要实施文档管理系统的公司实习面试,他们正在考虑首先考虑开源解决方案,他们的首选是 Alfresco,但决定仍然不是最终的,我需要调查的部分工作是露天是最好的解决方案。

我从项目描述中看到的是,他们将使用 MySQL 数据库实现 Alfresco,而不是将 DBMS 仅用于文档元数据和索引,但他们实际上想在其中存储文档。根据公司简介,文档类型主要是 PDF 和 .doc,而不是图像。

我进行了一些研究,并且已经阅读了此处与将文件存储到数据库中相关的所有主题,而不是重复问题。因此,据我了解,通常不推荐存储 BLOBS,并且根据公司的概况及其归档的法律义务,我认为他们将不得不存储更多的文档。

我想尽我所能为面试做好准备,这就是为什么我想听听你对这些问题的看法:

  1. 您决定将文档存储到 DBMS 的原因是什么(特别是考虑到您正在安装 Alfresco,它将文件存储在 FS 中)???

  2. 您有专门将文档存储到 MySQL 数据库中的经验吗???

非常感谢所有的帮助,我对面试感到非常兴奋并且非常想要这次实习,所以这是我之前真正想了解的事情之一!

谢谢!!!!

0 投票
1 回答
271 浏览

web-applications - 条形码是唯一识别需要为 Web 应用程序数字化的物理文档的最佳方式吗?

我必须将几千个物理文档数字化,并将它们分配到将显示它们的 Web 应用程序的各种类别中。

我应该为每个文件生成条形码以唯一标识它们吗?

如果是这样,我怎样才能避免条形码出现在扫描的图像中?

有什么其他建议可以解决这个问题吗?

0 投票
1 回答
1282 浏览

document - Alfresco Document Management 支持所有文件类型?

快速提问....

我们正在尝试在这里就 dms 做出决定,Alfresco 已被推荐给我们。

Alfresco Document Management 是否支持所有文件类型?

谢谢!

0 投票
2 回答
132 浏览

ruby-on-rails - 您使用了哪些语言、框架和技术来实现文档搜索?

我在一家新公司工作,我们的目标之一是为我们的团队和客户实施文档搜索门户。我有点担心,如果我们在云中使用 Salesforce 或其他一些 ECM 等外部服务提供商,将来会有很多集成工作。从客户的角度来看,这些文档也将与我们的结构化内容存在于同一个存储桶中(存储在数据库中,而不是 MS Word 文档中)。

如果您实现了文档搜索,您使用了哪些语言、框架和技术?你有失败的故事吗?我使用开箱即用的东西没有问题,但我认为我们控制文档和访问它们的 API 很重要。如果我们完全定制,我想使用 Rails。

0 投票
1 回答
928 浏览

vb.net - 使用隐藏共享创建文档管理结构的设计建议

我需要在我的软件中添加一些文档管理功能。文件将按公司名称和项目名称分组。

应用程序需要使用客户端/项目的 ID 号访问这些文件夹,但最终用户也可以使用 Windows 资源管理器轻松浏览这些文件夹。

客户和项目将存储在数据库中。

我正在考虑让软件使用友好名称创建文件夹,然后使用带有 ID 号的隐藏共享来访问文件。

文件夹结构将是这样的

因此,在上面的示例中,将有一家名为“Company 1”的公司,其 ID 为“1234”。
使用 Windows 资源管理器浏览文件夹时,用户会看到

\\ServerName\Documents\Company1

你也可以访问同一个文件夹

\\ServerName\Documents\Company-1234$

通过使用隐藏共享,如果公司名称更改或由于某种原因重命名,它不会破坏应用程序中的链接,因为它使用基于永不更改的 ID 的隐藏共享。

在服务器上拥有数百个(可能是数千个)或隐藏共享会对性能造成巨大影响吗?

有没有人有任何建议或替代方案来提供此功能?