1

我的目标是从搜索功能下载内容,使用关键字(“墨西哥”)从指定的网站到使用 Matlaburlread功能的字符串。

例如,我有以下 URL

FirstfullURL = ['http://www.economist.com/'];
SecondfullURL = ['http://www.foxnews.com/'];

我提取内容:

Firststring = urlread(FirstfullURL);
Secondstring = urlread(SecondfullURL); 

如何使用我的关键字(“墨西哥”)在这些网站中进行搜索,然后下载与该关键字相关的所有信息?

理想情况下,我想指示每个 URL 跳转到搜索功能并进行指定的研究。

我尝试使用 GET 选项,但它没有通过网站搜索功能查看。

Firststring = urlread(FirstfullURL,'Get',{'term','Mexico'});

你能给我一些如何解决这个挑战的想法吗?

4

2 回答 2

0

您需要一个 HTML 解析器,否则这将变得乏味。如果您了解 Java,JSoup 可以很好地工作。

于 2013-05-22T14:13:41.313 回答
0

您是想在经济学家的首页搜索“墨西哥”这个词,还是想使用经济学家网站的搜索功能?

更清楚地说:您想要与按 CTRL+F 相同的结果还是想要使用网站上的搜索按钮?

如果你想要后者,你需要另一个 URL 而不是“economist.com”,在这种情况下使用

http://www.economist.com/search/apachesolr_search/<keyword> 

在其他情况下,您将不得不修改 GET-Params,Firefox 的 LiveHTTP-Headers-Extension 可以找到这些。

如果你想做第一个:

 A = urlread('http://theeconomist.com');
 findstr('Economist', A)

工作得很好。但我同意 Joshua 的观点:Matlab 可能不是这样做的最佳选择。

于 2013-05-22T21:51:31.203 回答