我不是程序员,但我相信这个社区可以提供帮助。
我在 LAN 共享中有大量 VSD 文件,我想为其创建一个简单的可搜索索引。我希望能够以明文形式获取每个 VSD 文件的内容,以便在可用于搜索 clear txt 输出的 Windows 或 unix shell 脚本中进行操作。
你们中的任何人都可以帮忙吗?
我不是程序员,但我相信这个社区可以提供帮助。
我在 LAN 共享中有大量 VSD 文件,我想为其创建一个简单的可搜索索引。我希望能够以明文形式获取每个 VSD 文件的内容,以便在可用于搜索 clear txt 输出的 Windows 或 unix shell 脚本中进行操作。
你们中的任何人都可以帮忙吗?
您可以探索几个选项:
这需要有一个可以为您索引 Visio 格式的 IFilter。下面的链接是微软提供的一个 IFilter。
Visio IFilter 2003 加载项:Visio 文件中的文本搜索
注释
免责声明:我从未安装过 IFilter,所以我无法评论它的工作情况。
如果您只需要形状的纯文本,这非常简单。如果您需要从自定义属性之类的内容中获取文本,那么它会稍微复杂一些。如果你走这条路,我构建了一个库来帮助更轻松地使用 Visio 2007对象模型 - 在 Codeplex.com 上查找一个名为VisioAutomation的项目
注释
这种技术意味着将 visio 文件保存(或转换)为 XML 格式的 VDX 文件。您可以轻松地从 XML 中获取纯文本。
注释
我有直接使用 VDX 格式的经验 - 编写代码来处理它非常容易。
您可以使用 Visoi 开箱即用地做到这一点
Visio 2003 转到工具 -> 报告。
Visio 2007 转到数据 -> 报告。
Visio 2010 Beta 转到查看 -> 共享报告。(感谢弗朗西斯科)
这些说明适用于 Visio 2007。
制作一个新报告并选择所有页面上的形状或当前页面上的形状。
然后仅选择(您可能希望显示所有属性以确保未选中其他任何内容)
给它一个标题,例如:纯文本报告
给它一个名字,例如:Text_Only_Report
然后选择运行并将其导出到 Excel、HTML、Visio Shape 或 XML
资料来源:http: //kenfallon.com/getting-text-out-of-visio-drawings/
Microsoft 提供了一个很好的界面来操作 Visio 文档的内容。可以创建一个自定义工具来检查您共享中的每个 VSD 文件,提取您感兴趣的信息,并以您想要的任何文本格式保存该信息。
首先定义您对这些 VSD 文件感兴趣的信息。
SVG 是另一种可能对您有用的“明文”格式。使用 UNIX shell 命令 vsd2svg,您可以自动将所有 VSD 文件转换为 SVG。http://dia-installer.de/vsd2svg
感谢你们的帮助,我已经使用安装了索引服务 visio ifilter 的 sever 2003 的解决方案。该索引针对 UNC 共享运行,我从网站上摘录了一份指南,为索引查询引擎构建 IIS 前端。似乎在安静的测试单元上工作,但我还没有针对主存储库进行设置。
您的建议当然会给我进一步阅读的想法。
非常感谢大家!