我正在为来自 CDC 的 NHANES 数据集编写数据抓取工具。我在使用文件 IO 时遇到问题。
给定年份、组和标题(例如 2000、“exam”、“Audiometry”),我创建文件名字符串:
filename = "nhanes."+str(year)+"-"+str(year+1)+"."+group+"."+titles[i]+".xpt"
这成功打印为
"nhanes.2000-2001.exam.Audiometry.xpt"
然后,我使用以下代码通过 ftp 服务器下载 .xpt 文件:
req = urllib2.Request(ftp_loc)
response = urllib2.urlopen(req)
xpt_data = response.read()
f = open(filename, 'w')
f.write(xpt_data)
f.close()
ftp_loc类似于“ftp://ftp.cdc.gov/pub/Health_Statistics/NCHS/nhanes/2001-2002/OHXPRL_B.xpt”
然后,问题:我收到错误消息
Traceback (most recent call last):
(... method stack here ...)
IOError:[Errno 22] invalid mode ('w') or filename: 'nhanes.2000-2001.exam.Audiometry\r.xpt'
正如你所看到的,文件名现在有一个“\r”:(关于它是如何到达那里的任何想法?谢谢!!~Emily