我正在尝试使用以下标准代码从 pubmed 检索特定关键字集的 ID,
import os
from Bio import Entrez
from Bio import Medline
#Defining keyword file
keywords_file = "D:\keywords.txt"
# Splitting keyword file into a list
keyword_list = []
keyword_list = open(keywords_file).read().split(',')
#print keyword_list
# Creating folders by keywords and creating a text file of the same keyword in each folder
for item in keyword_list:
create_file = item +'.txt.'
path = r"D:\Thesis"+'\\'+item
#print path
if not os.path.exists(path):
os.makedirs(path)
#print os.getcwd()
os.chdir(path)
f = open(item+'.txt','a')
f.close()
# Using biopython to fetch ids of the keyword searches
limit = 10
def fetch_ids(keyword,limit):
for item in keyword:
print item
print "Fetching search for "+item+"\n"
#os.environ['http_proxy'] = '127.0.0.1:13828'
Entrez.email = 'A.N.Other@example.com'
search = Entrez.esearch(db='pubmed',retmax=limit,term = '"'+item+'"')
print term
result = Entrez.read(search)
ids = result['IdList']
#print len(ids)
return ids
print fetch_ids(keyword_list,limit)
id_res = fetch_ids(keyword_list,limit)
print id_res
def write_ids_in_file(id_res):
with open(item+'.txt','w') as temp_file:
temp_file.write('\n'.join(ids))
temp_file.close()
write_ids_in_file(id_res)
简而言之,我要做的是创建与每个关键字同名的文件夹,在文件夹中创建一个文本文件,通过代码从 pubmed 获取 id 并将 id 保存在文本文件中。当我最初测试它时,我的程序运行良好,但是,经过几次尝试后,它开始向我抛出目标机器主动拒绝连接错误。更多可能有用的细节,
头信息
- 主机 = 'eutils.ncbi.nlm.nih.gov'
- 连接 = '关闭'
- 用户代理 = 'Python-urllib/2.7'
网址
主机= '127.0.0.1:13828'
我知道这个问题已经被问过很多次,响应是端口没有在监听,但我想知道这是否也是我的问题,那么如何让应用程序在这个特定端口上工作。我已经进入我的防火墙设置并打开了一个端口 13828,但我不确定除此之外还能做什么。如果不是这种情况,有什么可能的解决方案?
谢谢!