您正在寻找的也称为递归目录遍历。这意味着,您将浏览所有目录并列出其中的子目录和文件。如果有一个子目录,它也会被遍历等等 - 所以它是递归的。
正如您可以想象的那样,这是您在编写软件时所需要的一种常见的东西,而 PHP 会为您提供支持。它提供了一个RecursiveDirectoryIterator
目录可以递归迭代和RecursiveIteratorIterator
执行遍历的标准。然后,您可以通过简单的迭代轻松访问所有文件和目录,例如通过foreach
:
$rootpath = '.';
$fileinfos = new RecursiveIteratorIterator(
new RecursiveDirectoryIterator($rootpath)
);
foreach($fileinfos as $pathname => $fileinfo) {
if (!$fileinfo->isFile()) continue;
var_dump($pathname);
}
这个例子首先指定了你要遍历的目录。我一直在服用当前的:
$rootpath = '.';
下一行代码有点长,它确实实例化了目录迭代器,然后是迭代器迭代器,这样树状结构就可以在单个/平面循环中遍历:
$fileinfos = new RecursiveIteratorIterator(
new RecursiveDirectoryIterator($rootpath)
);
$fileinfos
然后用一个简单的迭代这些foreach
:
foreach($fileinfos as $pathname => $fileinfo) {
在其中,有一个测试可以跳过所有目录的输出。这是通过使用SplFileInfo
被迭代的对象来完成的。它由递归目录迭代器提供,在处理文件时包含许多有用的属性和方法。例如,您还可以返回文件扩展名、关于大小和时间的基本名称信息等等。
if (!$fileinfo->isFile()) continue;
最后,我只输出作为文件完整路径的路径名:
var_dump($pathname);
示例输出如下所示(在 Windows 操作系统上):
string(12) ".\.buildpath"
string(11) ".\.htaccess"
string(33) ".\dom\xml-attacks\attacks-xml.php"
string(38) ".\dom\xml-attacks\billion-laughs-2.xml"
string(36) ".\dom\xml-attacks\billion-laughs.xml"
string(40) ".\dom\xml-attacks\quadratic-blowup-2.xml"
string(40) ".\dom\xml-attacks\quadratic-blowup-3.xml"
string(38) ".\dom\xml-attacks\quadratic-blowup.xml"
string(22) ".\dom\xmltree-dump.php"
string(25) ".\dom\xpath-list-tags.php"
string(22) ".\dom\xpath-search.php"
string(27) ".\dom\xpath-text-search.php"
string(29) ".\encrypt-decrypt\decrypt.php"
string(29) ".\encrypt-decrypt\encrypt.php"
string(26) ".\encrypt-decrypt\test.php"
string(13) ".\favicon.ico"
如果存在不可访问的子目录,则以下将引发异常。实例化时,可以使用一些标志来控制此行为RecursiveIteratorIterator
:
$fileinfos = new RecursiveIteratorIterator(
new RecursiveDirectoryIterator('.'),
RecursiveIteratorIterator::LEAVES_ONLY,
RecursiveIteratorIterator::CATCH_GET_CHILD
);
我希望这是有益的。您还可以将其包装到您自己的类中,您还可以提供一个FilterIterator
来决定是否应该列出文件foreach
。
RecursiveDirectoryIterator
和组合的力量RecursiveIteratorIterator
来自于它的灵活性。上面没有提到的是所谓FilterIterator
的 s。我想我添加了另一个例子,它利用了两个自己编写的,将它们放在一起来组合它们。
- 一种是过滤掉所有以点开头的文件和目录(在 UNIX 系统上这些文件和目录被视为隐藏文件,因此您不应将这些信息提供给外部)和
- 另一个仅将列表过滤为文件的方法。那是以前在foreach 中的检查。
此用法示例中的另一个更改是使用从迭代的根路径开始返回子路径的getSubPathname()
函数,因此您正在寻找的那个。
此外,我明确添加了防止遍历的SKIP_DOTS
标志.
和..
(技术上不是真正必要的,因为过滤器会过滤它们以及它们是目录,但我认为它更正确)并作为路径返回,UNIX_PATHS
因此路径字符串始终是 unix-无论底层操作系统如何,都喜欢路径如果稍后通过 HTTP 请求这些值,这通常是一个好主意,就像您的情况一样:
$rootpath = '.';
$fileinfos = new RecursiveIteratorIterator(
new FilesOnlyFilter(
new VisibleOnlyFilter(
new RecursiveDirectoryIterator(
$rootpath,
FilesystemIterator::SKIP_DOTS
| FilesystemIterator::UNIX_PATHS
)
)
),
RecursiveIteratorIterator::LEAVES_ONLY,
RecursiveIteratorIterator::CATCH_GET_CHILD
);
foreach ($fileinfos as $pathname => $fileinfo) {
echo $fileinfos->getSubPathname(), "\n";
}
此示例与前一个示例类似,尽管$fileinfos
is build 的配置方式略有不同。特别是关于过滤器的部分是新的:
new FilesOnlyFilter(
new VisibleOnlyFilter(
new RecursiveDirectoryIterator($rootpath, ...)
)
),
所以目录迭代器被放入一个过滤器中,过滤器本身被放入另一个过滤器中。其余的没有改变。
这些过滤器的代码非常简单,它们使用的accept
函数要么是,要么true
是false
要采取或过滤掉:
class VisibleOnlyFilter extends RecursiveFilterIterator
{
public function accept()
{
$fileName = $this->getInnerIterator()->current()->getFileName();
$firstChar = $fileName[0];
return $firstChar !== '.';
}
}
class FilesOnlyFilter extends RecursiveFilterIterator
{
public function accept()
{
$iterator = $this->getInnerIterator();
// allow traversal
if ($iterator->hasChildren()) {
return true;
}
// filter entries, only allow true files
return $iterator->current()->isFile();
}
}
又是这样。当然,您也可以将这些过滤器用于其他情况。例如,如果您有另一种目录列表。
还有另一个示例性的输出$rootpath
:
test.html
test.rss
tests/test-pad-2.php
tests/test-pad-3.php
tests/test-pad-4.php
tests/test-pad-5.php
tests/test-pad-6.php
tests/test-pad.php
TLD/PSL/C/dkim-regdom.c
TLD/PSL/C/dkim-regdom.h
TLD/PSL/C/Makefile
TLD/PSL/C/punycode.pl
TLD/PSL/C/test-dkim-regdom.c
TLD/PSL/C/test-dkim-regdom.sh
TLD/PSL/C/tld-canon.h
TLD/PSL/generateEffectiveTLDs.php
没有更多.git
或.svn
目录遍历或文件列表,如.builtpath
或.project
。
FilesOnlyFilter
和注意事项LEAVES_ONLY
:
过滤器明确拒绝使用基于对象的目录和SplFileInfo
链接(仅存在的常规文件)。所以它是一个真正的基于文件系统的过滤。由于默认标志(示例中也使用了此处) ,因此
附带了另一种仅获取非目录条目的方法。此标志不能用作过滤器,并且独立于底层迭代器。它只是指定迭代不应返回分支(此处:目录迭代器中的目录)。RecursiveIteratorIterator
LEAVES_ONLY