1

嗨 Um 对 java 很陌生,并且希望在用户进入域时构建站点地图生成器。Um 正在寻找源代码和 API 来执行此操作。如果有人能提供帮助,我将不胜感激。

4

2 回答 2

4

你需要下载

JDK 6
sitemapgen4j-1.0.1.jar

例子 :

import java.io.File;
import java.net.MalformedURLException;
import java.util.Date;

import com.redfin.sitemapgenerator.ChangeFreq;
import com.redfin.sitemapgenerator.WebSitemapGenerator;
import com.redfin.sitemapgenerator.WebSitemapUrl;

public class SitemapGenerator {

  public static void main(String[] args) throws MalformedURLException {

    WebSitemapGenerator webSitemapGenerator = WebSitemapGenerator.builder("http://www.example.com", new File("C:\\sitemap"))
    .gzip(true).build();

    WebSitemapUrl webSitemapUrl = new WebSitemapUrl.Options("http://www.example.com/test1.html")
      .lastMod(new Date()).priority(1.0).changeFreq(ChangeFreq.HOURLY).build();

    webSitemapGenerator.addUrl(webSitemapUrl);
    webSitemapGenerator.addUrl("http://www.example.com/test2.html");
    webSitemapGenerator.write();
  }
}

更多信息:http ://code.google.com/p/sitemapgen4j/

于 2012-07-03T04:02:33.907 回答
0

您可以查看 Heritrix,这是一个用 Java 编写的开源网络爬虫。它支持解释“robots.txt”文件等高级功能,并带有一堆非常有用的命令行工具。

维基百科条目

Heritrix 主页

于 2012-06-13T13:10:38.543 回答