我正在开发一个个人项目,该项目旨在打开用户指定的文件,然后接受用户输入并将该输入用作正则表达式来搜索文件。这样做的目的是更深入地了解正则表达式的工作原理以及如何将它们合并到程序中。
我的问题在于用户给我的所有输入都被格式化为字符串。所以(如果我错了,请纠正我),输入 [az]+ 将导致搜索表达式“[az]+”。如果我想要 r"[az]+" 作为我的搜索表达式,这是一个问题,因为将其作为用户输入将给我 "r"[az]+"" (再次,如果我错了,请纠正我)。这显然不适用于正则表达式。如何格式化输入以使 r"[az]+" 的输入保持为 r"[az]+"?
这是有问题的代码部分。函数参数中的 textFile 是从程序的另一部分导入的,用于正则表达式搜索:
def new_search_regex(textFile):
"""Query for input, then performs RegEx() with user's input"""
global totalSearches
global allSearchResults
# ask user for regular expression to be searched
expression = raw_input("Please enter the Regular Expression to be searched: ")
# perform initial regex search
foundRegex = re.search(expression, textFile)
# if Regex search successful
if foundRegex != None:
# Do complete regex search
foundRegex = re.findall(expression, textFile)
# Print result
print "Result: " + str(foundRegex)
# Increment global total
totalSearches += 1
# create object for result, store in global array
reg_object = Reg_Search(totalSearches, expression, foundRegex)
allSearchResults.append(reg_object)
print "You're search number for this search is " + str(totalSearches) # Inform user of storage location
# if Regex search unsuccessful
else:
print "Search did not have any results."
return
注意:最后我为结果创建一个对象,并将其存储在一个全局数组中。
这也是假设用户现在可以胜任地输入非系统破坏正则表达式。不过,我很快就会开始添加错误检查,例如在用户输入上使用 .escape。这将如何影响我的情况?它会对用户造成严重破坏,包括输入中的“?