如果这些行只是文本并且长度可变,则您无法知道哪一行是#97;唯一使它排在第 97 位的是之前有 96 行。
所以你需要阅读整个文件(这就是 SplFileObject 所做的):
$fp = fopen("keywords.txt", "r");
while($line--)
{
if (feof($fp))
// ERROR: line does not exist
$text = fgets($fp, 1024); // 1024 = max length of one line
}
fclose($fp);
但是如果你可以在每行之前存储一个行号,即文件是
...
95 abbagnale
96 abbatangelo
97 abbatantuono
98 ...
然后你可以实现一种二进制搜索:
- start with s1 = 0 and s2 = file length
- read a keyword and line number at seek position s3 = (s1+s2)/2 (*)
- if line number is less than desired, s1 = s3; else s2 = s3; and repeat previous step.
- if line number is the one desired, strip the number from the text and you get the keyword.
(*) 由于该行很可能不会完全从 s# 开始,因此您需要两个fget:一个用于去除虚假的 half 关键字,第二个用于读取行号。当您“关闭”时,读取更大的块并将其分成几行会更快。例如,您查找第 170135 行并读取第 170180 行:您最好将查找位置回退一千字节,读入一千字节的数据,然后在其中查找 170135。
或者,如果各行的长度相差不大,则值得存储固定大小的行(这里的“#”实际上应该是空格,并且在行长中您需要计算行终止符,\n或 \r\n):
abbagnale#########
abbatangelo#######
abbatantuono######
然后,假设每个关键字是 32 个字节,
$fp = fopen("keywords.txt", "r");
fseek($fp, 97 * 32, SEEK_SET);
$text = trim(fgets($fp, 32));
fclose($fp);
或多或少是瞬时的。
但是,如果文件位于远程服务器上,您仍然需要下载整个文件(直到所需的行),并且通过在可以运行搜索的远程服务器上放置一个“扫描仪”脚本来为您提供更好的服务。然后你可以运行
$text = file_get_contents("http://www.mysite.com/keywords.php?line=97");
并在几毫秒内获得您的线路。