0

我正在尝试编写一个脚本,允许我从数据服务器下载大量(1000 个)数据文件(例如,http ://hydro1.sci.gsfc.nasa.gov/thredds/catalog/GLDAS_NOAH10SUBP_3H/2011/345 /)。不幸的是,每个目录中的文件名的格式不同(它们的创建时间被附加到文件名的末尾)。我需要能够指定文件名来对数据进行子集化(我有一个用于这些数据类型的特殊工具)并下载它。我在 matlab 中找不到可以提取文件名的函数。

我查看了 URLREAD,但它会下载包括 html 代码在内的所有内容。

谢谢你的帮助!

4

1 回答 1

0

您可以轻松解析链接。

x=urlread(url)
links=regexp(x,'<a href=''([^>]+)''>','tokens')

读取每个链接,您必须过滤所有不需要的链接。

例如,这将获取所有 grb 文件:

a=regexp(x,'<a href=''([^>]+.grb)''>','tokens')
于 2013-11-08T20:52:13.297 回答