0

我正在尝试使用以下标准代码从 pubmed 检索特定关键字集的 ID,

import os
from Bio import Entrez
from Bio import Medline

#Defining keyword file
keywords_file = "D:\keywords.txt"

# Splitting keyword file into a list
keyword_list = []
keyword_list = open(keywords_file).read().split(',')
#print keyword_list

# Creating folders by keywords and creating a text file of the same keyword in each   folder
for item in keyword_list:
    create_file = item +'.txt.'
    path = r"D:\Thesis"+'\\'+item
    #print path
    if not os.path.exists(path): 
        os.makedirs(path)
    #print os.getcwd()
    os.chdir(path)
    f = open(item+'.txt','a')
    f.close()

# Using biopython to fetch ids of the keyword searches
limit = 10

def fetch_ids(keyword,limit):
    for item in keyword:
        print item
        print "Fetching search for "+item+"\n"
        #os.environ['http_proxy'] = '127.0.0.1:13828'
        Entrez.email = 'A.N.Other@example.com'
        search = Entrez.esearch(db='pubmed',retmax=limit,term = '"'+item+'"')
        print term
        result = Entrez.read(search)
        ids = result['IdList']
        #print len(ids)
        return ids

print fetch_ids(keyword_list,limit)

id_res = fetch_ids(keyword_list,limit)
print id_res

def write_ids_in_file(id_res):
    with open(item+'.txt','w') as temp_file:
        temp_file.write('\n'.join(ids))
        temp_file.close()
write_ids_in_file(id_res)

简而言之,我要做的是创建与每个关键字同名的文件夹,在文件夹中创建一个文本文件,通过代码从 pubmed 获取 id 并将 id 保存在文本文件中。当我最初测试它时,我的程序运行良好,但是,经过几次尝试后,它开始向我抛出目标机器主动拒绝连接错误。更多可能有用的细节,

头信息

  • 主机 = 'eutils.ncbi.nlm.nih.gov'
  • 连接 = '关闭'
  • 用户代理 = 'Python-urllib/2.7'

网址

http://eutils.ncbi.nlm.nih.gov/entrez/eutils/esearch.fcgi?term=%22inflammasome%22&retmax=10&db=pubmed&tool=biopython&email=ANOther%40example.com

主机= '127.0.0.1:13828'

我知道这个问题已经被问过很多次,响应是端口没有在监听,但我想知道这是否也是我的问题,那么如何让应用程序在这个特定端口上工作。我已经进入我的防火墙设置并打开了一个端口 13828,但我不确定除此之外还能做什么。如果不是这种情况,有什么可能的解决方案?

谢谢!

4

1 回答 1

0

你需要search.close()之后result = Entrez.read(search)。在此处查看官方说明。http://biopython.org/DIST/docs/api/Bio.Entrez-module.html


由于打开的连接过多而关闭端口或 TCP 是公共网站的正常行为。

于 2014-07-07T14:02:52.620 回答