0

您好,我有一张图表,需要进行系统审查并给出结果...

图表图像位于此处....

示例图表 .pdf http://imageshack.us/photo/my-images/651/scorecardchartexample.gif/

http://imageshack.us/photo/my-images/651/scorecardchartexample.gif/

--假设图表是 .PDF 并且文本是可渲染的 IE “高亮”。

--假设图表每次都以完全相同的方式和相同的位置放置在页面上

--假设图表可以更改-也就是说,我需要能够上传 1000 个这些图表,所有这些图表都遵循完全相同的格式,但图表之间有一些替代信息。

——假设在 .NET 方面具有 VAST 专业知识,而在实际文本解释方面几乎没有专业知识。

--假设具有解释具有可编辑字段的 .PDF 的专业知识...我已经在这样做了,这仅限于我创建的 .PDF 并且能够在每个字段上放置值等。

--假设这个图表只能在一个单一的文本可呈现的.PDF中交付——也就是说——我们与一个创建这个图表的网站交互——这个网站没有API可以交互,我们必须从网页打印这个图表到PDF这就是我们所能做的……(政府网站)

使用 .NET 系统,我需要创建一个程序...或将现有应用程序合并到我的 .NET 系统中,它将查看此图表并能够分辨每个“X”代表什么...也就是说左边一英寸或下一行的“X”表示不同的结果(参见图表)

我需要该程序根据击中文件夹或其他任何内容的 .PDF 文档的触发器来执行搜索并返回结果。假设我们从头开始创建程序,我们可以处理这部分......否则我们将仅限于根据需要与现有应用程序进行交互。

我们对各种策略持开放态度。假设存在这样的类或对象,我们正在考虑根据文档中的位置读取文本,例如 X、Y 之类的东西。另一个理想的路线是某种 stringBuffer(假设 C#),但需要能够导航图表网格线,并且需要计算空格以准确解释“X”的位置以及“X”的含义根据它的位置。第三个选项,我们不知道的事情。

如果某件事存在并且经过验证并且是真实的,那当然是最好的。然后是使用 .NET 和 C# 与它交互的任何提示。

非常感谢大家提前Code Gawds!

卷轴

4

1 回答 1

0

好的,我们找到了一些名为 ClearImage 的软件——它并不便宜,但非常简洁。它将以 Adob​​e PDF 分析文档以查找表单字段的相同方式分析任何图像。在清晰的图像完成之后,它会为您提供一个“blob”列表,然后您可以指定每个 blob 的含义并给它一个唯一的标识符。这允许基于图像中的“blob”位置进行自动值声明。

它还允许对图像进行“指纹”排序,因此如果要显示相同的图像,它可以识别它......在我的例子中,我们有 3 个不同的图表模板,实际上每个模板都会因为不同而有所不同图表,但最终每个模板都具有与图表的倍数相同的布局……这有助于我们的系统识别输入的图表,然后在第一次检查之后,继续对每个 blob 进行任何化处理。

无论如何,如果其他人应该遇到这个问题并且需要这种类型的功能,那么值得一看。我不想让它无人回答。当我们了解更多信息时,我可能会更新它。我知道这不完全是一个编码问题,但这种类型的任务是编码密集型的,如果有人想要执行相同的任务,他们可能会在这里找到自己的方式。我将努力本着 stackoverflow 的精神更新有关集成和对象等的评论。

如果有人对此软件有更多关于编码的问题,您可以在这里提问或发布新问题,我们将很乐意发布我们使用(在 C# 中)的代码(方法、类对象等),以便将其集成到我们/您的计划。

于 2013-02-23T06:05:26.900 回答