我需要一些帮助来从链接( http://www.informatik.uni-trier.de/~ley/pers/hd/k/Kumar:G=_Praveen.htm)中提取表中的子字符串。
我只需要提取作者的姓名并将其存储到二维数组中。例如:
a[0][0]= G. Praveen kumar a[0][1]= Anirban Sakar. a[1][0]= G. Praveen Kumar, a[1][1]= Arjun Kumar Murmu, a[1][2]= Biswas Parajuli , a[1][3]= Prasenjit Choudhury
以此类推下一行(直到表格末尾)...我尝试过的代码如下..
我需要提取作者的姓名(子字符串)并存储在二维数组中,因为名称用逗号分隔,并且:后跟文章的名称。我不希望将文章的名称存储在二维数组,但只有人的名字,而表的结尾。
任何帮助,将不胜感激。提前致谢。
package codetrial;
import java.io.*;
import java.lang.String.*;
import org.jsoup.*;
import org.jsoup.nodes.*;
import java.io.BufferedWriter.*;
import java.io.FileWriter.*;
import java.io.IOException.*;
import java.util.*;
import org.apache.commons.lang.StringUtils;
public class Main {
public static void main(String[] args) {
try{
String a;
final String url="http://www.informatik.unitrier.de/~ley/pers/hd/k/Kumar:G=_Praveen.html";
Document doc = Jsoup.connect(url).get();
for(Element element : doc.select("table div.data") ) {
a = element.text();
String[] names = a.split(", "); // comma and space
String name_one = StringUtils.substringBetween(url, " ", ",");
String name_two = StringUtils.substringBetween(url, ",", ":");
System.out.println("person1 = " + name_one);
System.out.println("person2 = " +name_two);
for(String name : names) {
System.out.println(name);
}
}
} catch (IOException e) {
e.printStackTrace();
}
}
}