0

我有 pdf 文件,在页面的右上角和左上角有安全标记,我将它们转换为 .pdb 文件以在我的手机上读取它们,并将安全标记中的内容放入 .pdb 文件中,这样每隔几页就有:

PDF Transform

PDF Transform

Y

Y

Y

er

Y

er

B

2

B

2

B

.0

B

.0

A

A

Click here to buy

Click here to buy

w

w

w

w

w .

w

A B B YY.com

.A B BYY.com

我尝试使用将它们转换为多种类型的文件,calibre但它显示在所有文件中。

如果我将它们转换为.txt文件,任何人都可以制作一个批处理文件来删除多个文件中的这些文本行吗?

4

1 回答 1

0

我不确定您使用的是哪个操作系统,但这将适用于 *nix,安装了 SED 的 osx,不确定您是否可以在 Windows 中使用 SED:

for filename in *.txt; do sed ${filename} -e '1,20d' -e '/^PDF Transform/,/^A B B YY\.com/d' > newfiles/${filename}; done

如果您知道第 1-20 行是静态的并且位于文件内部的相同位置,则第一个 -e 命令会删除第 1-20 行。第二个 -e 命令将删除 PDF Transform 和 YY.com 之间的所有内容,包括这些行。您可以使用多个或一个 -e 命令来获得所需的内容。它假定 newfiles 文件夹确实存在。我没有对此进行测试,因此正则表达式可能已关闭。

于 2012-09-18T04:13:15.840 回答