0

我如何使用 python 保存从网站获得的源代码,然后将其保存为 .html 或 .txt 文件以用于我正在处理的项目

我用这样的东西来获取代码

from PAM30 import PAMIE
import win32com.client 
ie =PAMIE() 
website="http://example.url"
ie.navigate(website)
ie.setTextBox("account","my_user")
ie.setTextBox("pw","my_pass")
shell = win32com.client.Dispatch("WScript.Shell")
shell.SendKeys("{ENTER}", 0)
data = ie.outerHTML()

print(data)
4

2 回答 2

1
from PAM30 import PAMIE
import win32com.client 
ie =PAMIE() 
website="http://example.url"
ie.navigate(website)
ie.setTextBox("account","my_user")
ie.setTextBox("pw","my_pass")
shell = win32com.client.Dispatch("WScript.Shell")
shell.SendKeys("{ENTER}", 0)
data = ie.outerHTML()

with open("out.txt", "w") as f:
    f.write(data)

保存到“out.txt”。你也可以改变它。

对于 unicode 错误,请尝试codecsmodule.

import codecs

with codecs.open("out.html", "w", encoding="utf-8") as f:
    f.write(data)
于 2013-04-17T03:58:56.750 回答
1

我不确定我是否完全理解您的问题,但这是我使用 urllib2 提出的解决方案。

import urllib2

output_file = open('output.txt', 'w') 
url = urllib2.urlopen('http://www.python.org')
url_html = url.read()

output_file.write(url_html)
output_file.close()
于 2013-04-17T05:42:48.833 回答