这是交易,我正在处理一个 OCR 文本文档并使用 RegEx 从中获取 UPC 信息。那部分我已经想通了。然后我查询一个数据库,如果我没有该 UPC 的记录,我需要返回到文本文档并获取产品的描述。
收据上的格式是:
NAME OF ITEM 123456789012
OTHER NAME 987654321098
NAME 567890123456
所以,当我第二次回去寻找物品的名称时,我完全不知所措。我知道如何到达 UPC 所在的行,但是如何使用正则表达式之类的东西来获取 UPC 之前的名称?或者其他一些方法。我正在考虑以某种方式存储整行,然后用 PHP 解析它,但也不知道如何获取该行。
使用 PHP。