链接http://www.lyricsfreak.com/search.php不可用,这就是它显示错误的原因。当您说它有时会列出时,实际发生的是重定向到主页。因此,您可以使用主页链接http://www.lyricsfreak.com/而不是使用http://www.lyricsfreak.com/search.php
基于评论的示例
行。我想您想在使用 jsoup 从 java 程序中搜索后阅读曲目。Lyricsfreak 的问题是它在返回结果之前检查源。如果源查询不是 Lyricsfreak.com 它会重定向到 access_error.htm 并使用下面的脚本从那里再次提交以在 3.5 秒后获得结果
<script type="text/javascript">
var redirect_url = document.location.href.match(/\?(.*)/);
redirect_url = redirect_url ? '/search.php?' + redirect_url[1] : '/';
setTimeout(function() { document.location.href = (redirect_url); }, 3500);
</script>
因此,您可以在这里做的是referrer
通过 jsoup 将其设置为“lyricsfreak.com”,它会在没有 access_error 的情况下为您提供正确的结果。所以示例代码如下。当然,您可以以更好的方式解析页面,但这只是为了给您一个想法。
import java.util.ArrayList;
import java.util.List;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
public class LyricsParser {
public static void main(String[] args) throws Exception {
String SEARCH_STRING = "Madonna";
String URL = "http://www.lyricsfreak.com/search.php?a=search&type=song&q=";
List<String> artists = new ArrayList<String>();
List<String> songs = new ArrayList<String>();
List<String> hits = new ArrayList<String>();
Document doc = Jsoup.connect(URL + SEARCH_STRING)
.referrer(URL + SEARCH_STRING).get();
for(Element tracks : doc.select("td.colfirst")){
for(Element links : tracks.getElementsByTag("a")){
artists.add(links.text());
}
}
for(Element tracks : doc.select("td > a.song")){
for(Element links : tracks.getElementsByTag("a")){
songs.add(links.text());
}
}
for(Element tracks : doc.select("td.colast")){
hits.add(tracks.text());
}
int length = artists.size();
for(int i=0; i<length; i++){
System.out.println("[" + artists.get(i) + ",\t" + songs.get(i) + ",\t" + hits.get(i+1) + "]");
}
}
}