matlab - 在 Matlab 中从在线数据服务器中提取文件名

Question

我正在尝试编写一个脚本，允许我从数据服务器下载大量（1000 个）数据文件（例如，http ://hydro1.sci.gsfc.nasa.gov/thredds/catalog/GLDAS_NOAH10SUBP_3H/2011/345 /）。不幸的是，每个目录中的文件名的格式不同（它们的创建时间被附加到文件名的末尾）。我需要能够指定文件名来对数据进行子集化（我有一个用于这些数据类型的特殊工具）并下载它。我在 matlab 中找不到可以提取文件名的函数。

我查看了 URLREAD，但它会下载包括 html 代码在内的所有内容。

谢谢你的帮助！

score 0 · Accepted Answer

您可以轻松解析链接。

x=urlread(url)
links=regexp(x,'<a href=''([^>]+)''>','tokens')

读取每个链接，您必须过滤所有不需要的链接。

例如，这将获取所有 grb 文件：

a=regexp(x,'<a href=''([^>]+.grb)''>','tokens')

matlab - 在 Matlab 中从在线数据服务器中提取文件名

1 回答 1

Related

Reference