0

我想从网站中解析出这个字符串并识别并将颜色存储在一个变量中(假设它的绿色分配值为 0,或者是否为其他 1)。

<tr><td class="mapbuttons" align=right>
<a href="http://www...."><font color=green>TEXT <font color=#ff8000>(2)</font>3/14</font></a>

我找到了这个演示代码:

import java.net.*;
import java.io.*;
public class WebSiteReader {
  public static void main(String args[]){
       String nextLine;
       URL url = null;
       URLConnection urlConn = null;
       InputStreamReader  inStream = null;
       BufferedReader buff = null;
       try{
          // Create the URL obect that points
          // at the default file index.html
          url  = new URL("http://www.yahoo.com" );
          urlConn = url.openConnection();
         inStream = new InputStreamReader( 
                           urlConn.getInputStream());
           buff= new BufferedReader(inStream);

       // get the values I want here

     } catch(MalformedURLException e){
       System.out.println("Please check the URL:" + 
                                           e.toString() );
     } catch(IOException  e1){
      System.out.println("Can't read  from the Internet: "+ 
                                          e1.toString() ); 
  }
 }
}

1) 正确吗?我的意思是我只需要用我想要的代码替换注释,对吧?2)你能帮我写代码吗,因为我是java新手以及如何“玩”文本?

4

1 回答 1

2

使用JSoup完成繁重的工作(为您解析 HTML)。解析 HTML 真的很困难,因为那里的很多东西都是损坏的 HTML。

类似于下面的东西(丝毫没有测试应该选择第一个字体元素并提取颜色属性的值。

Document doc = Jsoup.connect("http://www.yahoo.com").get();
Element fontTag = doc.select("font").first();
string theColor = fontsTag.attr("color");
于 2012-04-19T11:02:08.270 回答