这个问题类似于我在这个网站和其他在线网站上发现的许多其他关于正则表达式的问题。但是,在尝试实施它们时,这些解决方案不起作用。由于我自己的无知,它不起作用,但我想获得以下帮助:
我想做什么:
我正在将数据导入我们的新数据库。大部分转换是在几个月前完成的,现在我需要转换所有新数据。
一般环境信息:
要正确转换一个特定字段,我需要使用正则表达式。新数据库中的字段可以包含以下 3 个值中的任何一个:
- Kid
- No Mail
- Household
但是,源文件中的列有更多我想忽略的值。
导入程序具有创建“字典”的功能,可以将其应用于特定字段以将导入的值转换为数据库中的标准值。这对于修复常见的拼写错误等非常有用。
字典很简单。你有一个正确值的列表,每个正确的值可以有许多不正确的值。
例如:
CORRECT VALUE IMPORT VALUES
Kid kid
kids
Child
Minor
在导入值列表中,您还可以输入正则表达式。
要解决的问题:
这是字典文件的示例:
CORRECT VALUE LIST IMPORT VALUE
- Kid Kid
KID
- No Mail No Mail
NO MAIL
- Household HH
- OTHER Regex expression to match: Anything else
例子:
输入值:
KID
转换为Kid
HH
转换为Household
John
转换为OTHER
Do Not Call
转换为OTHER
NO MAIL
转换为No Mail
ABCD
转换为OTHER
到目前为止我做了什么:
这是我在网上找到并适应我的情况:
在codinghorror.com上找到的公式:
(?!kid|KID|Kid\b)\b\w+
- 这适用于“KID”,但当我出于某种原因添加任何其他内容时失败
在 stackoverflow.com 上找到的公式:
^(?!kid$).*
- 匹配一切 - 甚至是“孩子”
^((?!kid).)*$
- 相同的
这是我第一次使用正则表达式,我只需要一点帮助就可以开始使用它。
因此,您可以给我的任何帮助或指示将不胜感激。
谢谢!