我在一个名为pdfText
.
接下来,我将遍历一个包含要在pdfText
-string 中找到/搜索的子字符串的数组。
子字符串之一是Invoice
.
两者pdfText
和我正在搜索的子字符串都转换为小写。
如果在 中找到至少一个子字符串pdfText
,则布尔值设置为 true。
现在,我有一个示例,其中pdtText
包含“...要开具发票的净额...”。这是文本中“发票”的唯一变体。如果我使用,这当然会返回 true
substring = "Invoice" ... pdfText.contains(substring.ToLower)
.
但在这种情况下,我需要它返回 false。我只需要找到完全匹配。
另一个例子,如果pdfText
包含 '...这是一张发票。请支付....要开具发票的净金额...' 由于第一个发票匹配,布尔值应设置为 true,但第二个发票(非)匹配则不应设置为真。
所以我正在寻找的是在字符串Invoice
中找到一个子字符串pdfText
,并确保该子字符串不是较长单词的一部分invoiced, invoice-process etc.
。请注意,那invoice.
应该返回True
.
我相信这应该是可能的,但目前还不能解决这个问题。我可能需要使用正则表达式?