我正在从 IEEEXplore 中获取一些数据 PDF、图块和链接。
所以最近当我抓取这个网站(使用 Python 和斜纹模块)时,我得到了类似的内容:
��7���j��/�5�,X��]����O�s˟�����U|]�l
��c��qLE�[����:yg�u%��_�9e�;�4��^�kt)j�Te���:OX���[��u����B���-]?t�C���m/��ά��Ҋ��n�'��}'�Ù�ف{�S;�ƣ������3�dS��M[m
那么为什么会这样!我怀疑页面的编码。!
代码很大,但我在这里插入了其中的一部分:
你可以在这里看到代码:
https://github.com/power-electro/test-ieeexplore-scraper/blob/master/ieeexplore_ieee_org.py
因此,可以通过以下链接访问本网站的 ELsevier 版本的免费 PDF 文件: