我已经使用 pdfbox for java 从 pdf 中抓取了一个文件,输出如下:
Tribhuvan University
Institute of Engineering
Entrance Examination Board
BE/BArch Entrance Examination 2070
Pass List
ROLLNO NAME GENDER DISTRICT Percent Rank
1001 AADARSH DEO MALE Saptari 51.429 3442
1002 AADARSH MALLA MALE Bajhang 43.429 5714
1003 AADARSHA KHANAL MALE Rupandehi 40.571 6709
该列表继续重复每页中的前 6 行 [150 页]。我需要做的是在java中选择以整数值开头的行,并使用以整数值开头的列表创建一个新文件。