0

以下是来自 Wikisource 页面的数据;-

{{:MediaWiki:Proofreadpage_index_template
|Type=book
|Title=மணி பல்லவம் 1
|Language=ta
|Author=நா. பார்த்தசாரதி
|Translator=
|Illustrator=
|Editor=
|Volumes=5
|School=
|Publisher=தமிழ்ப் புத்தகாலயம்
|Address=சென்னை
|Year=ஏழாம் பதிப்பு 2000
|Source=pdf
|Image=1
|Number of pages=295
|File size=19.88
|Category=
|Progress=C
|Pages=<pagelist 
1=நூலட்டை
2= உரிமம்
4=பதிப்பு
|Remarks=மேம்படுத்திய உள்ளடக்கத்தரவு

1. இந்திர விழா 12

2. சக்கரவாளக் கோட்டம் 22

3. கதக்கண்ணன் வஞ்சினம் 26

|Width=
|Css=
|Header=
|Footer=
|Key=
|ISBN=
|OCLC=
|LCCN=
|BNF_ARK=
|ARC=
}}

我想删除两个参数之间的一些特定数据,即从|Remarks=|Width=开始。我尝试了以下代码,但它删除了参数“|Remarks=”之后的所有数据,而不是我上面提到的。如何仅删除上述参数之间的数据?

我的测试代码;-

#-*- coding: utf-8 -*-
import random, csv, time, subprocess, re, pywikibot

wikiPage1 = 'அட்டவணை:மணி பல்லவம் 1.pdf'
site = pywikibot.Site('ta', 'wikisource')
page1 = pywikibot.Page(site, wikiPage1)

res1 =  re.sub(r'\|Remarks= *.*(?s)', '|Remarks=' , page1.text)

print(res1)
4

1 回答 1

0

评论很有​​用。当我点击有用的评论时,它会被删除。为什么?无论如何,我的重新编码如下;- wiki 页面结果根据需要是肯定的。它将帮助创建 2000 多本书。非常感谢,兄弟。对不起,我忘记了你的名字,对不起。

#-*- coding: utf-8 -*-
import random, csv, time, subprocess, re, pywikibot
    
அட்டவணைப்பெயர் = 'அட்டவணை:மணி பல்லவம் 1.pdf'

site = pywikibot.Site('ta', 'wikisource')
page1 = pywikibot.Page(site, அட்டவணைப்பெயர்)


with open('0trans-தற்போதுள்ளநடுப்பகுதிவார்ப்புருஇப்ப26-கோப்பு.csv') as இடுகோப்பு3:
    இடுகோப்புத்தரவு3 = இடுகோப்பு3.read()
    #print(இடுகோப்புத்தரவு3)
    
#res1 =  re.sub(r'\|Remarks= *.*(?s)', '|Remarks=' , page1.text)
    page1.text = re.sub(r'(?<=\|Remarks=)[\s\S]*?(?=\|Width=)', '\n' + இடுகோப்புத்தரவு3 + '\n', page1.text)
    
    print(page1.text)
    
    page1.save(summary='+ உள்ளடக்கத்தரவில் வார்ப்புருக்கள் இடப்பட்டன') 
于 2020-07-31T00:26:05.760 回答