我对自动生成的 CSV 报告进行了一些调整。我目前被困在需要获取患者的出生日期并将其转换为以月和年为单位的年龄的部分。原始 CSV 中已经有一个年龄列,我已经弄清楚如何转换 DOB 列中的数据以找到以天为单位的年龄,但是,我需要能够将其转换为月/年,然后还取该计算值并替换当前字段中的值。当前字段是手动输入的字符串,没有真正一致的格式。实际的 CSV 大约有 1700 行和 18 列,并使用标准逗号分隔它们,所以我只是制作一个较短的形式作为示例,并使用缩进使其更容易查看:
Last_Name First_Name MI age DOB SSN visit_date
Stalone Frank P 62yrs 10 months 07-30-1950 123456789 05-02-2013
Astley Richard P 47years3mo 02-06-1966 987654321 05-03-2013
我想要的应该是这样的:
Last_Name First_Name MI Age DOB SSN
Stalone Frank P 62y10mo 07-30-1950 123456789
Astley Richard P 47y3mo 02-06-1966 987654321
编辑:我意识到我可以直接使用 date.year 和 date.month 来减去年份和月份,从而更容易找到这些值。我现在正在编辑我的代码,当我让它工作时会更新它,但是我仍然对我的问题的第二部分有问题。
到目前为止我的代码:
import re
import csv
import datetime
with open(inputfile.csv','r') as fin, open(outputfile.csv','w') as fout:
reader = csv.DictReader(fin)
fieldnames = reader.fieldnames
writer_clinics = csv.DictWriter(fout, fieldnames, dialect="excel")
writer_clinics.writeheader()
for row in reader:
data = next(reader)
today = datetime.date.today()
DOB = datetime.datetime.strptime(data["DOB"], "%m/%d/%Y").date()
age_y = (today.year - DOB.year)
age_m = (today.month - DOB.month)
if age_m < 0:
age_y = age_y - 1
age_m = age_m + 12
age = str(age_y) + " y " + str(age_m) + " mo "
print (age)
所以,我想弄清楚如何将年龄写入 outputfile.csv 中的正确字段?
更新 2:设法将大部分内容写入,但是,在输入文件中某些字段留空时出现错误。我的老板还希望我根据约会的实际日期确定年龄。我当前的代码块:
import re
import csv
import datetime
def getage(visit, dob):
years = visit.year - dob.year
months = visit.month - dob.month
if visit.day < dob.day:
months -= 1
if months < 0:
months += 12
years -= 1
return '%sy%smo'% (years, months)
with open('inputfile.csv','r') as fin, open('outputfile.csv','w') as fout:
reader = csv.DictReader(fin)
writer_clinics = csv.DictWriter(fout, reader.fieldnames, dialect="excel")
writer_clinics.writeheader()
for data in reader:
visit_date = datetime.strptime(data["visit_date"], "%m-%d-%Y").date()
DOB = datetime.datetime.strptime(data["DOB"], "%m-%d-%Y").date()
data["Age"] = getage(visit_date, DOB)
writer_clinics.writerow(data)