1

我已经在这里获得了创建报价提取功能的帮助。非常感谢,灵魂融合!

现在我正在寻找提取被引用文本和被引用人的正则表达式 (PHP)。人应该在一个索引(子字符串)中,文本在另一个索引(子字符串)中。

对于英文文本,soulmerge 提出了这些正则表达式:

  • /"(.*?)[,.]?\h*"\h*said\h*(.*?)\./
  • /"(.*?)\h*"(.*)said/
  • /\.\h*(.*)(once)?\h*said[\-]*"(.*?)"/

我想将以下德语直接语音示例“翻译”为正则表达式:

  • “这是一个报价”,sagte PERSON ...
  • “这是一个报价单!”,sagte PERSON ...
  • “这是报价单?”,sagte PERSON ...
  • PERSON sagte:“这是一段引文。”
  • PERSON sagte:“这是一个报价单!”
  • PERSON sagte:“这是报价单?”

有人可以帮我为这些直接语音形式建立足够的正则表达式吗?

我希望你能帮助我。非常感谢您!

4

1 回答 1

1
  • /"(.+)",\s*sagte\s+(.+)/
  • /(.+)\s+sagte:\s*"(.+)"/

请注意,person 和 question 变量在第二个正则表达式中是相反的。

于 2009-08-30T21:14:15.847 回答