假设字符串:
item1, item1N, item1Z, item1fhg, item1_any_letters, item2, item3, item3N, item3H
我的目标输出很简单
item1, item2, item3
这是目前大约 100,000 行的 Excel 文件,但如果需要临时可以迁移到另一个程序等。
本质上,我需要确定重复项(任何以数字结尾的初始短语),而不考虑数字后面的字母。一些短语可能也有例如“Brand item2, Brand item34”,重复的唯一决定因素是数字之后的任何和所有术语。
关于从哪里开始的任何想法?每个字符串通常包含 2 到 500 个值,以逗号和空格分隔。最终值后面没有逗号。