1

我尝试使用记事本、word-pad 和 notepad++ 打开 XML,但它看起来被编码为某种主题标签字符串。但它会在使用几乎任何浏览器(如 edge、Firefox、资源管理器)打开时显示实际数据。我不知道我哪里错了。这是写之前的xml文件。

<?xml version="1.0" encoding="UTF-8"?>

-<COUNTER_document totalnoofwords="393" totalnoofsentences="13" noofwordswithSWR="265" newspaper="daily_waqt" newsdate="02.12.14" filename="0001p.xml" domain="sports" classification="PD">

<headline>بنگلہ دیش کا زمبابوے کا ون ڈے سیریز میں 5-0 سے وائٹ واش</headline>

<body>میر پور(وقت نیوز) بنگلہ دیش نے 5 میچوں کی سیریز کےآ خری میچ میں بھی فتح حاصل کر کے سیریز میں وائٹ واش کر دیا،زمبابوے ایک میچ بھی نہ جیت سکا۔آخری میچ میں زمبابوے کے 129 رنز کا ہدف بنگال ٹائیگرز نے 24.3 اوورز میں 5 وکٹوں کے نقصان پر حاصل کر لیا۔بنگلہ دیش کے شیر بنگلہ سٹیڈیم میر پور میں کھیلے گئے آخری ایک روزہ میچ میں زمبابوے کے کپتان چکمبورا نے ٹاس جیت کے بینٹگ کا فیصلہ کیا جو ان کی ٹیم کیلئے ڈراؤنا خواب ثابت ہوا اور پوری ٹیم 30 اوورز میں 128 رنز بنا کر پویلین لوٹ گئی زمبابوے کی پہلی وکٹ 16 رنز پر گری جب سکندر رضا صرف 9 رنز بنا کر مشرقی مرتضی کی بال پر آؤٹ ہوئے اس کے بعد مساکد ازااور سباندا کی پارٹنرشپنے ٹیم کا سکور95 رنز تک پہنچا دیا ۔مساکدازا 52 رنز بنا کر جبیر الحسن کا شکار بنے جبکہ سباندا نے 37 رنز کی اننگز کھیلی اس کے بعد کئی بھی زمبابوے کا کھلاڑی جم کر نہ کھیل سکا۔بنگال ٹائیگرز کی جانب سے عمدہ باؤلنگ کے نتیجے میں کپتان چکمبورا سمیت 8 کھلاڑی ڈبل فیگر کراس نہ کر سکے ۔بنگلہ دیش کی جانب سے ایک روزہ میچوں میں ڈیبیو کرنے والے تیج السلام نے اپنے پہلے ہی میچ میں ہیٹرک کی اسلام نے 7 اوورز میں صرف 14 رنز دئے اور چار کھلاڑیوں کع آؤٹ کیا جبکہ شکیب الحسن نے 30 رنز دیکر 3 اور جبیر الحسن نے41 رنز دیکر2 کھلاڑیوں کو پویلین کی راہ دکھائی ۔ 128 رنز کے جواب میں بنگال ٹائیگرز نے بیٹنگ شروع کی مشکلات کا سامنا رہا ان کے بھی ابتدائی 3 کھلاڑی 47 رنز پر پویلین لوٹ گئے۔ تمیم اقبال 10، انعام الحق8 رنز بنا کر آؤٹ ہوئے،آل راؤنڈر شکیب الحسن بغیر کوئی رنز بنائیپویلین لوٹ گئے وکٹ کیپر مشفق الرحیم صرف 11 رنز بنا کر چتارہ کا شکار بن گئے۔محمد اللہ نے51 رنز کی میچ وننگ اننگز کھیلی جبکہ صابر رحمٰن13 رنز بنا کر ناٹ آؤٹ رہے۔ زمبابوے کی جانب سے چتارہ نے 3 اور پنیا نگارا نے 2 کھلاڑیوں کو آؤٹ کیا ۔فتح کے ساتھ بنگلہ دیش نے سیریز میں وائٹ واش کر دیا۔زمبابوے کی ٹیم کوئی میچ نہ جیت سکی،تیج السلام کو میچ کا بہترین ایوارڈ دیا گیا جبکہ سیریز کا بہترین کھلاڑی مشفق الرحیم کو قرار دیا گیا۔</body>

</COUNTER_document>

这是我使用的代码:

import xml.etree.ElementTree as ET
from googletrans import Translator
import glob
import time

path="D:\\Counter\\*.*"

#Access All the files from given folder
file_list = glob.glob(path)
print(file_list)

#Load each file at a time.
my_list=[]
for file in glob.glob(path):

 #Translate object
 translator = Translator()
 mytree = ET.parse(file)
 myroot = mytree.getroot()
 for urdu in myroot.iter('body'):
    content= urdu.text

 result = translator.translate(content, dest='zh-cn')
 time.sleep(5)

 final= translator.translate(str(result), dest='ur')
 time.sleep(5)
 
 urdu.text = str(final)
 mytree.write(file)

这是用某种hastag字符串编码的xml的最终结果

<headline>&#1576;&#1606;&#1711;&#1604;&#1729; &#1583;&#1740;&#1588; &#1705;&#1575; &#1586;&#1605;&#1576;&#1575;&#1576;&#1608;&#1746; &#1705;&#1575; &#1608;&#1606; &#1672;&#1746; &#1587;&#1740;&#1585;&#1740;&#1586; &#1605;&#1740;&#1722; 5-0 &#1587;&#1746; &#1608;&#1575;&#1574;&#1657; &#1608;&#1575;&#1588;</headline>
<body>Translated(src=zh-CN, dest=ur, text=Translated(src=ur, dest=zh-cn, text=Mirpur (&#1608;&#1602;&#1578; &#1606;&#1740;&#1608;&#1586;) &#1576;&#1606;&#1711;&#1604;&#1729; &#1583;&#1740;&#1588; &#1606;&#1746; &#1662;&#1575;&#1606;&#1670; &#1605;&#1740;&#1670;&#1608;&#1722; &#1705;&#1740; &#1587;&#1740;&#1585;&#1740;&#1586; &#1705;&#1575; &#1570;&#1582;&#1585;&#1740; &#1605;&#1740;&#1670; &#1580;&#1740;&#1578; &#1705;&#1585; &#1587;&#1740;&#1585;&#1740;&#1586; &#1605;&#1740;&#1722; &#1608;&#1575;&#1574;&#1657; &#1608;&#1575;&#1588; &#1705;&#1585; &#1583;&#1740;&#1575;&#1548; &#1586;&#1605;&#1576;&#1575;&#1576;&#1608;&#1746; &#1575;&#1740;&#1705; &#1576;&#1726;&#1740; &#1605;&#1740;&#1670; &#1606;&#1729;&#1740;&#1722; &#1580;&#1740;&#1578; &#1587;&#1705;&#1575;&#1748; &#1576;&#1606;&#1711;&#1604;&#1729; &#1583;&#1740;&#1588; &#1605;&#1740;&#1722; &#1570;&#1582;&#1585;&#1740; &#1585;&#1608;&#1586; &#1605;&#1604; &#1662;&#1608;&#1604; &#1705;&#1746; &#1588;&#1740;&#1585; &#1576;&#1606;&#1711;&#1604;&#1729; &#1575;&#1587;&#1657;&#1740;&#1672;&#1740;&#1605; &#1605;&#1740;&#1722; &#1729;&#1608;&#1606;&#1746; &#1608;&#1575;&#1604;&#1746; &#1575;&#1606;&#1657;&#1585;&#1606;&#1740;&#1588;&#1606;&#1604; &#1605;&#1740;&#1670; &#1605;&#1740;&#1722; &#1586;&#1605;&#1576;&#1575;&#1576;&#1608;&#1746; &#1705;&#1746; &#1705;&#1662;&#1578;&#1575;&#1606; &#1670;&#1705;&#1605;&#1576;&#1608;&#1604;&#1575; &#1606;&#1746; &#1657;&#1575;&#1587; &#1580;&#1740;&#1578;&#1606;&#1746; &#1705;&#1575; &#1601;&#1740;&#1589;&#1604;&#1729; &#1705;&#1740;&#1575; &#1580;&#1608; &#1575;&#1606; &#1705;&#1740; &#1657;&#1740;&#1605; &#1705;&#1746; &#1604;&#1740;&#1746; &#1575;&#1740;&#1705; &#1672;&#1585;&#1575;&#1572;&#1606;&#1575; &#1582;&#1608;&#1575;&#1576; &#1578;&#1726;&#1575;&#1548; &#1657;&#1740;&#1605; &#1606;&#1746; 30 &#1605;&#1740;&#1670;&#1608;&#1722; &#1605;&#1740;&#1722; 128 &#1662;&#1608;&#1575;&#1574;&#1606;&#1657;&#1587; &#1576;&#1606;&#1575;&#1574;&#1746;&#1748;&#1662;&#1726;&#1585; &#1608;&#1729; &#1662;&#1608;&#1740;&#1604;&#1740;&#1606; &#1604;&#1608;&#1657; &#1711;&#1574;&#1746;&#1748;&#1580;&#1576; &#1587;&#1705;&#1606;&#1583;&#1585; &#1585;&#1590;&#1575; &#1606;&#1746; &#1589;&#1585;&#1601; 9&#1662;&#1608;&#1575;&#1574;&#1606;&#1657;&#1587; &#1576;&#1606;&#1575;&#1574;&#1746;&#1548;&#1586;&#1605;&#1576;&#1575;&#1576;&#1608;&#1746; &#1705;&#1740; &#1662;&#1729;&#1604;&#1740; &#1608;&#1705;&#1657; 16&#1662;&#1608;&#1575;&#1574;&#1606;&#1657;&#1587; &#1662;&#1585; &#1711;&#1585;&#1740;&#1748;&#1605;&#1585;&#1578;&#1590;&#1740;&#1648; &#1605;&#1585;&#1578;&#1590;&#1740;&#1648; &#1705;&#1740; &#1711;&#1740;&#1606;&#1583; &#1662;&#1585; &#1570;&#1574;&#1608;&#1657; &#1729;&#1608;&#1574;&#1746;&#1748;&#1605;&#1587;&#1575;&#1705;&#1575;&#1583;&#1586;&#1575; 52&#1662;&#1608;&#1575;&#1574;&#1606;&#1657;&#1587; &#1576;&#1606;&#1575; &#1705;&#1585; &#1580;&#1576;&#1740;&#1585; &#1575;&#1604;&#1581;&#1587;&#1606; &#1705;&#1575; &#1588;&#1705;&#1575;&#1585; &#1576;&#1606;&#1746; &#1580;&#1576; &#1705;&#1729; &#1587;&#1576;&#1575;&#1606;&#1672;&#1575; &#1606;&#1746; 37&#1575;&#1606;&#1606;&#1711;&#1586; &#1705;&#1726;&#1740;&#1604;&#1606;&#1746; &#1705;&#1746; &#1576;&#1593;&#1583; &#1586;&#1605;&#1576;&#1575;&#1576;&#1608;&#1746; &#1705;&#1746; &#1705;&#1574;&#1740; &#1705;&#1726;&#1604;&#1575;&#1681;&#1740; &#1575;&#1740;&#1705; &#1587;&#1575;&#1578;&#1726; &#1705;&#1726;&#1740;&#1604;&#1606;&#1746; &#1587;&#1746; &#1602;&#1575;&#1589;&#1585; &#1585;&#1729;&#1746;&#1748; &#1575;&#1604;&#1575;&#1587;&#1604;&#1575;&#1605;&#1548; &#1575;&#1662;&#1606;&#1746; &#1608;&#1606; &#1672;&#1746; &#1672;&#1740;&#1576;&#1740;&#1608; &#1605;&#1740;&#1722;&#1548; &#1576;&#1606;&#1711;&#1604;&#1729; &#1583;&#1740;&#1588; &#1606;&#1746; &#1575;&#1662;&#1606;&#1746; &#1662;&#1729;&#1604;&#1746; &#1729;&#1740; &#1705;&#1726;&#1740;&#1604; &#1605;&#1740;&#1722; &#1729;&#1740;&#1657; &#1657;&#1585;&#1705; &#1705;&#1740;&#1548; &#1575;&#1587; &#1606;&#1746; &#1589;&#1585;&#1601; 14 &#1576;&#1575;&#1585; &#1583;&#1608;&#1681; &#1604;&#1711;&#1575;&#1574;&#1740; &#1575;&#1608;&#1585; 4 &#1705;&#1726;&#1604;&#1575;&#1681;&#1740;&#1608;&#1722; &#1705;&#1608; &#1711;&#1585;&#1575;&#1740;&#1575;&#1548; &#1580;&#1576; &#1705;&#1729; &#1588;&#1705;&#1740;&#1576; &#1575;&#1604;&#1581;&#1587;&#1606; &#1606;&#1746; 3 &#1576;&#1575;&#1585; 30 &#1575;&#1608;&#1585; &#1580;&#1576;&#1740;&#1585; &#1575;&#1604;&#1581;&#1587;&#1606; &#1606;&#1746; 41 &#1576;&#1575;&#1585; &#1583;&#1608;&#1681; &#1604;&#1711;&#1575;&#1574;&#1740;&#1748; &#1548;2&#1705;&#1726;&#1604;&#1575;&#1681;&#1740;&#1608;&#1722; &#1705;&#1608; &#1662;&#1608;&#1740;&#1604;&#1740;&#1606; &#1705;&#1575; &#1585;&#1575;&#1587;&#1578;&#1729; &#1583;&#1705;&#1726;&#1575;&#1740;&#1575;&#1748;128&#1662;&#1608;&#1575;&#1574;&#1606;&#1657;&#1587; &#1705;&#1575; &#1587;&#1575;&#1605;&#1606;&#1575; &#1705;&#1585;&#1606;&#1746; &#1608;&#1575;&#1604;&#1746; &#1576;&#1606;&#1711;&#1575;&#1604;&#1586; &#1606;&#1746; &#1711;&#1740;&#1606;&#1583; &#1705;&#1608; &#1605;&#1575;&#1585;&#1606;&#1575; &#1588;&#1585;&#1608;&#1593; &#1705;&#1585; &#1583;&#1740;&#1575; &#1605;&#1588;&#1705;&#1604;&#1575;&#1578; &#1705;&#1575; &#1587;&#1575;&#1605;&#1606;&#1575; &#1705;&#1585;&#1578;&#1746; &#1729;&#1608;&#1574;&#1746; &#1575;&#1606; &#1705;&#1746; &#1657;&#1575;&#1662; 3&#1705;&#1726;&#1604;&#1575;&#1681;&#1740; &#1576;&#1726;&#1740; 47&#1662;&#1608;&#1575;&#1574;&#1606;&#1657;&#1587; &#1604;&#1746; &#1705;&#1585; &#1604;&#1608;&#1657;&#1746;&#1548; &#1578;&#1605;&#1740;&#1605; &#1575;&#1602;&#1576;&#1575;&#1604; 10&#1548; &#1575;&#1606;&#1593;&#1575;&#1605; &#1575;&#1604;&#1581;&#1602; 8&#1585;&#1606;&#1586; &#1705;&#1746; &#1587;&#1575;&#1578;&#1726; &#1606;&#1605;&#1575;&#1740;&#1575;&#1722; &#1585;&#1729;&#1746;&#1748; &#1578;&#1605;&#1575;&#1605; &#1576;&#1575;&#1729;&#1585;. &#1570;&#1604; &#1585;&#1575;&#1572;&#1606;&#1672;&#1585; &#1588;&#1705;&#1740;&#1576; &#1575;&#1604;&#1581;&#1587;&#1606; (&#1705;&#1608;&#1574;&#1740; &#1606;&#1729;&#1740;&#1722;) &#1575;&#1587;&#1705;&#1608;&#1585; &#1606;&#1729;&#1740;&#1722; &#1705;&#1740;&#1575; &#1578;&#1726;&#1575;. &#1711;&#1608;&#1604; &#1705;&#1740;&#1662;&#1585; &#1605;&#1588;&#1601;&#1602; &#1585;&#1590;&#1740; &#1575;&#1604;&#1604;&#1729; &#1593;&#1606;&#1729; &#1606;&#1746; &#1575;&#1587;&#1746; (11) &#1575;&#1606;&#1729;&#1608;&#1722; &#1606;&#1746; &#1705;&#1729;&#1575; &#1705;&#1729; &#1705;&#1746; &#1576;&#1593;&#1583; &#1589;&#1585;&#1601; 11 &#1585;&#1606;&#1586; &#1604;&#1608;&#1657; &#1570;&#1574;&#1746;. &#1575;&#1587; &#1605;&#1740;&#1722; &#1705;&#1575;&#1605;&#1740;&#1575;&#1576; &#1729;&#1608;&#1711;&#1740;&#1575; &#1575;&#1608;&#1585; &#1576;&#1575;&#1729;&#1585; &#1657;&#1726;&#1729;&#1585;&#1746; &#1585;&#1729;&#1746;. &#1605;&#1740;&#1722; &#1586;&#1605;&#1576;&#1575;&#1576;&#1608;&#1746;&#1548; Chatara 3 &#1608;&#1705;&#1657;&#1608;&#1722; &#1580;&#1740;&#1578; &#1705;&#1585; &#1587;&#1746; Panya &#1606;&#1575;&#1711;&#1585; 2 &#1580;&#1740;&#1578; &#1604;&#1740;&#1575; &#1608;&#1705;&#1657;&#1740;&#1722;&#1548; &#1575;&#1587; &#1601;&#1578;&#1581; &#1705;&#1746; &#1587;&#1575;&#1578;&#1726; &#1729;&#1740; &#1576;&#1606;&#1711;&#1604;&#1729; &#1583;&#1740;&#1588; &#1606;&#1746; &#1587;&#1740;&#1585;&#1740;&#1586; &#1575;&#1662;&#1606;&#1746; &#1606;&#1575;&#1605; &#1705;&#1585; &#1604;&#1740;&#1548; &#1586;&#1605;&#1576;&#1575;&#1576;&#1608;&#1746; &#1606;&#1746; &#1705;&#1608;&#1574;&#1740; &#1576;&#1726;&#1740; &#1605;&#1740;&#1670; &#1606;&#1729;&#1740;&#1722; &#1580;&#1740;&#1578;&#1575;&#1548; &#1605;&#1588;&#1601;&#1602; &#1575;&#1604;&#1585;&#1581;&#1740;&#1605; &#1705;&#1608; &#1705;&#1726;&#1740;&#1604; &#1705;&#1575; &#1576;&#1729;&#1578;&#1585;&#1740;&#1606; &#1705;&#1726;&#1604;&#1575;&#1681;&#1740; &#1602;&#1585;&#1575;&#1585; &#1583;&#1740;&#1575; &#1711;&#1740;&#1575;&#1748;, &#1578;&#1604;&#1601;&#1592;=[[], []], extra_data=" {'translat..." ), pronunciation=None, extra_data="{'translat...")</body>
</COUNTER_document>
4

0 回答 0