我需要通过终端或 MATLAB 获取文件夹中的所有 .html 文件,但问题是这些 .html 文件在文件中没有明确的 .html 扩展名。在这种情况下,我还尝试捕获也是 .GIF 文件但没有明确扩展名的文件。
我编写了一个脚本,可以在 MATLAB 中执行此操作,该脚本调用 unix 函数基本上循环文件夹中的所有文件,读取它们并获取它们的扩展名,最后将它们从文件夹中删除。
我的代码成功地做到了,但时间太长(可能大约一个小时)。该文件夹中大约有 12'000 个文件,但我正在寻找更省时的文件,尽管它的大小。我确定终端中有两三行的快捷方式。
close all; clear all;
Z=dir('./');
file_number=length(Z)-2;
stats=[];
stats2=[];
for i=1:file_number
file_name=Z(i+2).name;
command=['cat ' file_name ' | grep GIF'];
stats=~unix(command);
command2=['cat ' file_name ' | grep html'];
stats2=~unix(command2);
if stats==1 || stats2==1
command3=['rm ' file_name];
unix(command3);
end
if rem(i,100)==0
disp(i);
end
end
另一个重要细节:我的文件名称中没有 .html 或 .gif。我知道他们有这种类型是因为他们的幻数(并且通过右键单击并查看文件属性)。我的文件名是“1”、“2”、...、“7”、...“11498”。理想情况下,它们是“1.html”、“2.gif”、“3.jpg”等……但事实并非如此。