我有一个网页,我需要先截屏,然后使用 OCR 解析出里面的文本。如果我放大(Mac:command + '='),OCR 的性能可能会得到显着改善。所以我想知道如何在 Python 中使用 selenium 放大/缩小。
有一个类似的帖子,但他们只有 Java 和 C# 的实现,但目标和我的一样。
放大/缩小硒只是我的想法之一。为了提高性能。我知道可能有几种实现方法。以下只是我的想法,我从未成功实施它们。如果您能证明它们有效并更改字体大小,我也会接受作为答案。
也许更改浏览器的设置,然后保存为 Chrome 配置文件,所以下一次,我可以调用配置文件,并且在整个过程中应该保留“ZOOM”设置,而不需要触摸任何东西。但是,似乎 python selenium 包不支持加载 chrome 配置文件,但是,它可以加载 firefox 配置文件。关联
可能将屏幕截图作为矢量图像,因此使用 PIL 等单独放大字体大小。
...
非常感谢您的帖子和帮助您入门的示例代码!
#!/usr/bin/python
from selenium import webdriver
def main():
browser = webdriver.Chrome() # Sorry, I have to use Chrome, [chromedriver][3] is required
browser.set_window_size(1000, 1000)
browser.get("https://stackoverflow.com/users/1953475/b-mr-w")
# Fill in Your Magic Here to Make the Font Size Big!
browser.get_screenshot_as_file('/tmp/screenshot.png')
if __name__ == '__main__':
main()