4

我正在向 cdr (chordpro) 转换器编写文本,但在检测表单上的和弦线时遇到问题:

               Cmaj7    F#m           C7    
Xxx xxxxxx xxx xxxxx xx x xxxxxxxxxxx xxx 

这是我的python代码:

def getChordMatches(line):
    import re
    notes = "[CDEFGAB]";
    accidentals = "(#|##|b|bb)?";
    chords = "(maj|min|m|sus|aug|dim)?";
    additions = "[0-9]?"
    return re.findall(notes + accidentals + chords + additions, line)

我希望它返回一个列表 ["Cmaj7"、"F#m"、"C7"]。上面的代码不起作用,我一直在努力处理文档,但我没有得到任何结果。

为什么将类和组链接在一起不起作用?

编辑

谢谢,我最终得到了以下内容,它涵盖了我的大部分需求(例如,它与 E#m11 不匹配)。

def getChordMatches(line):
    import re

    notes = "[ABCDEFG]";
    accidentals = "(?:#|##|b|bb)?";
    chords = "(?:maj|min|m|sus|aug|dim)?"
    additions = "[0-9]?"
    chordFormPattern = notes + accidentals + chords + additions
    fullPattern = chordFormPattern + "(?:/%s)?\s" % (notes + accidentals)
    matches = [x.replace(' ', '').replace('\n', '') for x in re.findall(fullPattern, line)]
    positions = [x.start() for x in re.finditer(fullPattern, line)]

    return matches, positions
4

3 回答 3

3

您应该通过更改(...)(?:...).

accidentals = "(?:#|##|b|bb)?";
chords = "(?:maj|min|m|sus|aug|dim)?";

在线查看它:ideone


当您捕获组时它不起作用的原因是它只返回这些组而不是整个匹配。从文档中:

re.findall(pattern, string, flags=0)

返回字符串中模式的所有非重叠匹配,作为字符串列表。从左到右扫描字符串,并按找到的顺序返回匹配项。如果模式中存在一个或多个组,则返回组列表;如果模式有多个组,这将是一个元组列表。空匹配包含在结果中,除非它们触及另一个匹配的开始。

于 2012-12-25T13:43:01.977 回答
3

编写详细的正则表达式有特定的语法

regex = re.compile(
    r"""[CDEFGAB]                 # Notes
        (?:#|##|b|bb)?            # Accidentals
        (?:maj|min|m|sus|aug|dim) # Chords
        [0-9]?                    # Additions
     """, re.VERBOSE
)
result_list = regex.findall(line)

这可以说比将字符串连接在一起更清晰一些

于 2012-12-25T13:50:57.047 回答
2

您需要使组不捕获:

def getChordMatches(line):
    import re
    notes = "[CDEFGAB]";
    accidentals = "(?:#|##|b|bb)?";
    chords = "(?:maj|min|m|sus|aug|dim)?";
    additions = "[0-9]?"
    return re.findall(notes + accidentals + chords + additions, line)

结果:

['Cmaj7', 'F#m', 'C7']
于 2012-12-25T13:45:31.070 回答