我有一个需要转换为 SharePoint 的 HTML 帮助系统。两个最耗时的项目是更改文档链接和收集元数据。但是,我很幸运,因为这些数据很容易访问。每个文件都是一个 HTML 文档,简化如下:
<body>
<!--- Metadata follows
Procedure Name: my document
Procedure Number: xxxxx
Use: freeform text explaining when procdure is used
Revision Date: xx/xx/xx
By: responsible party for revision
<!--- end metadata
<h1>Procedure Name<\h1>
<p>procedure background and narrative, with links, as needed, to other documents at \\documentation-server\path\document-name.html
<\body>
我可以成功地提取和操作正确的字符串,并且我正在尝试将该过程合并到一个自动化解决方案中。然而,由于这是我第一次尝试文件 i/o,所以我对下一步该做什么有点模糊。
在一个完美的世界中,给定一个路径,我想逐步遍历路径中的每个 *.html 文件。我似乎找不到一个类/方法来做到这一点。newInputStream
并newOutpuStream
给我文件访问权限,但我需要提供路径和文件参数。该FileVisitor
界面似乎只与文件属性交互并执行删除/复制/重命名类型的功能。
有没有什么东西可以将这些组合成一个函数,该函数将逐步遍历路径中的每个文件,打开它并允许我逐行解析,然后关闭文件并移至下一个重复?
我的另一个想法是创建一个文件名数组,然后将该数组输入newInputStream
.
建议?