我想从 pdf 中提取信息。
以下是策略的摘录,其中使用https://github.com/yob/pdf-reader/将 pdf 转换为 txt 文档。
Vehicle Description 2007, PORSCHE, CAYMAN 3.2
Registration Number USD-2394 Vin Number FSDFKJL23123KFAS
MY COVER DETAILS
Cover USD37.45
我想提取例如车辆描述和保险费用:
vehicle.description => "2007, PORSCHE, CAYMAN 3.2"
vehicle.registration => "USD-2394"
vehicle.cost_of_cover => "37.45"
任何人都可以就适当的方法提出建议。问题是策略的布局可能会发生变化,但数据大多是相同的,只是值不同。
如果正则表达式是要走的路,任何人都可以提供示例代码。