这是一个奇怪的问题,至少对我来说是这样,因为我不完全理解这其中的全部内容。基本上,我一直在执行此过程,将抓取的文档(例如网页)保存到.txt
文件中。然后我可以很容易地使用 Perl 来读取这个文件并将每一行放入一个数组中。但是,它不是根据文档中的任何可见内容来执行此操作的(即,它不是通过 HTML 换行符进行的);它只是根据.txt
格式知道新行在哪里。
但是,我想删掉这个过程,只在一个变量中做同样的事情,所以我会把.txt
文件的内容放在一个字符串中,然后我想以同样的方式解析它, 逐行。对我来说,问题是我不太了解它是如何工作的,因为我真的不明白 Perl 如何能够判断新行在哪里(假设我不经常使用 HTML 换行符)只是一个基于网络的 .txt 文件(它作为网页呈现给我的刮板 www:mechanize)我正在刮,所以没有 HTML 可供使用)。我想我可以使用其他参数(例如空格)来执行此操作,但我很想知道是否有办法逐行执行此操作。任何信息表示赞赏。
我想减少文件的实际保存,以减少与我使用的服务器上的权限相关的问题,并且我也很好奇我是否可以让这个过程更有效率。