鉴于维基百科文章的文本(参见http://test.wikipedia.org/w/index.php?title=Paris&action=raw),我想提取所有需要引用的部分。在 Wikipedia 标记中,需要引用由 表示,{{Citation needed}}
而章节标题由两个等号表示主要部分(例如==Section 1==
)或三个等号(例如===Section 1A===
)表示小节。
我的正则表达式:
/(={2,3}[^==]+={2,3}[^==]+\{{2}Citation needed[^}}]*\}{2}[^==]*)(={2,3}[^==]+={2,3})?/g
我的正则表达式适用于许多部分,但不适用于其他部分,我不明白为什么。
匹配:
===法国首都=== [[文件:爱丽舍宫,巴黎 2005.jpg|thumb|right|[[爱丽舍宫]],[[法国总统|法国总统]]]]] 巴黎是法国国民政府的所在地。对于行政长官来说,这两位首席官员各有自己的官邸,同时也是他们的办公室。[[法国总统]]居住在[[巴黎第八区|第八区]]的[[爱丽舍宫]],而[[法国总理|总理]]的席位在[[Hôtel Matignon]] 在[[巴黎第七区|第七区]]。政府部门分布在城市的各个地方;许多位于马蒂尼翁附近的第七区。
法国议会的两院也位于[[左岸|左岸]]。上院 [[法国参议院|参议院]] 在 [[巴黎第六区|第六区]] 的 [[卢森堡宫]] 举行会议,而更重要的下院 [[Assemblée] Nationale]],在 [[巴黎第七区|7th]] 的 [[Palais Bourbon]] 见面。[[法国参议院议长名单|参议院议长]]是法国仅次于共和国总统的第二高公职人员,居住在“小卢森堡”,是[[Palais]的一个较小的宫殿附属建筑。卢森堡]]。{{需要引用|日期=2010 年 6 月}}
不匹配:
===社区间=== 上述变化中很少有考虑到巴黎作为[[聚集]]的存在。与 [[Lille]] 和 [[Lyon]] 等法国大部分主要城市地区不同,巴黎市区没有 [[commune in France#Intercommunality|intercommunal]] 实体,没有处理整个地区密集的城市核心;巴黎对其郊区的疏离在今天确实是一个问题,许多人认为 {{Who|date=April 2011}} 是内乱的主要原因,例如 2005 年的郊区骚乱。这些不幸事件的直接结果是更有效的大都市结构以覆盖巴黎市和一些郊区的提议,从松散的“大都会会议”的社会主义理念(''
这种不一致的主要原因之一是法国政府在如此巨大的聚集地面前感到恐惧,并渴望挖掘其财富。{{需要引用|date=2011 年 4 月}} 自中世纪以来,特别是自 1649 年的麻烦(拉弗朗德)以来,巴黎一直被认为是危险的源头。威权国王路易十四将凡尔赛建造为新的政治中心,远离危险的城市人群。国家与城市之间的冲突随着 1871 年革命(公社)达到高潮:波尔多的法国议会决定巴黎不再是首都,而巴黎公社则讨论宣布巴黎独立于法国。自那时候起,法国中央集权国家的基础之一是广泛分配巴黎的财富,同时剥夺集聚区并将其划分为 8 个部门和 1200 个公社。(有关对巴黎长期敌意的分析,请参阅 [http://www-ohp.univ-paris1.fr/] {{Verify source|date=April 2011}})。在法国的 22 个大都市地区中,有 19 个定期获得补贴——主要来自巴黎的资源——而巴黎郊区则缺乏必要的设备。
我的正则表达式有什么问题?
编辑:下面的新工作正则表达式!
/(={2,3}((?!==).)+={2,3}((?!==)[^])+\{{2}Citation needed((?!}})[^])*\}{2}((?!==)[^])*)/g
说明:匹配任何节或小节标题(==Section== 或 ===Subsection===),后跟不是两个等号的任何内容,然后是类似 {{Citation needed}} 的字符串,然后是其他所有内容那不是两个等号。