3

我对正则表达式完全陌生。我只是想知道这是否可能。(如果解释令人困惑或过于复杂,我很抱歉)说,我只想找到并替换这个特定的粗体标题:

“正如第一章所讨论的,财务报表的用户可以归类为资源提供者。(空间)(空间)用户和决策(空间)(空间)这方面的一个例子。(空间)(空间)的性质和目的财务分析(空格)(空格)我们已经确定,财务分析涉及以相对术语表示财务报表中报告的数字。”

对此:

“如第 1 章所述,财务报表的用户可以归类为资源提供者。
(新行)用户和决策制定(标签空间)一个例子。
(新行)财务分析的性质和目的(标签空间)我们已经确定,财务分析涉及在财务报表中以相对术语表示报告的数字。”

由于我目前对正则表达式的了解有限,我尝试将其分解为 2 个部分:


1. 找到“. (space)(space)Nature ” :
[(.)]\s\s[(AZ)]\w+
to \n$&


2.求“分析(空间)(空间)我们”:
[(az)]\w+\s\s[(AZ)]
到??

所以,我的问题是是否可以只为
. (空间)(空间)用户和决策(空间)(空间)一个
(space)(space)财务分析的性质和目的(space)(space)我们

又换成上面的例子?

谢谢!

PS。这种奇怪的编辑背后的原因是将其作为 txt 上传到 anki 抽认卡软件而无需进一步编辑。
如果我要从厚厚的教科书中编辑整个文本(每章 x20 左右的章节 x5 教科书等等可以包含超过 1000 次编辑),我目前的方法可能会非常费力。
仅供参考,在 anki 和其他几个抽认卡软件中,tab 是前面/问题和后面/答案之间的字段分隔符。
双空格[ ][ ]用于在使用查找和替换时将特定标题与单个空格分开;这是我自己预先设置好的。
新行 (\n) 用于添加新的单独抽认卡。
Anki(和其他几种抽认卡软件)支持 html,所以我通常通过使用 notepad++ 和正则表达式从 pdf 复制文本来添加多张卡片,查找并替换句子的多个标题或第一个单词以适应 anki 抽认卡的问题/前面部分,而休息成为答案部分;然后将其导入anki。如果可以自动化所有查找部分,我可以节省大量时间!

4

2 回答 2

1

经过一段时间的谷歌搜索和修补,我想我终于找到了答案!:D
[ ]{2,}([AZ])[\w ]{1,}[ ]{2,}
替换为
\n$&\t\t

http://regexr.com/3db4o

灵感来自: 正则
表达式,用于按空格分割的多个单词
Python 正则表达式:包括字符范围内的空格
http://www.rexegg.com/regex-quickstart.html 和@Jan 的答案

于 2016-04-30T09:22:16.277 回答
0

我看到您正在尝试匹配以大写字母开头的单词组合,单词之间有一个空格,并用两个空格块括起来。

这是一个满足这些条件的正则表达式:

/[^\S\r\n]{2,}[A-Z]\w*(?:[^\S\r\n]\w+)*[^\S\r\n]{2,}/g

查看正则表达式演示(替换为\n$&\t\t

请注意,[\w ]{1,}它将匹配一个单词字符或空格 1 次以上,并且可以在单词之间允许超过 1 个空格。但是,如果您需要匹配一行上的最后2 个空格块,这可能会很好。请注意,您需要在上述模式中+的第二个之后添加一个。[^\S\r\n]

于 2016-05-05T18:34:28.393 回答