1

我对自动生成的 CSV 报告进行了一些调整。我目前被困在需要获取患者的出生日期并将其转换为以月和年为单位的年龄的部分。原始 CSV 中已经有一个年龄列,我已经弄清楚如何转换 DOB 列中的数据以找到以天为单位的年龄,但是,我需要能够将其转换为月/年,然后还取该计算值并替换当前字段中的值。当前字段是手动输入的字符串,没有真正一致的格式。实际的 CSV 大约有 1700 行和 18 列,并使用标准逗号分隔它们,所以我只是制作一个较短的形式作为示例,并使用缩进使其更容易查看:

Last_Name   First_Name   MI   age                 DOB          SSN         visit_date
Stalone     Frank        P    62yrs 10 months     07-30-1950   123456789   05-02-2013
Astley      Richard      P    47years3mo          02-06-1966   987654321   05-03-2013

我想要的应该是这样的:

Last_Name   First_Name   MI   Age       DOB          SSN
Stalone     Frank        P    62y10mo   07-30-1950   123456789
Astley      Richard      P    47y3mo    02-06-1966   987654321

编辑:我意识到我可以直接使用 date.year 和 date.month 来减去年份和月份,从而更容易找到这些值。我现在正在编辑我的代码,当我让它工作时会更新它,但是我仍然对我的问题的第二部分有问题。

到目前为止我的代码:

import re
import csv
import datetime

with open(inputfile.csv','r') as fin, open(outputfile.csv','w') as fout:
   reader = csv.DictReader(fin)
   fieldnames = reader.fieldnames
   writer_clinics = csv.DictWriter(fout, fieldnames, dialect="excel")
   writer_clinics.writeheader()

   for row in reader:
    data = next(reader)
    today = datetime.date.today()
    DOB = datetime.datetime.strptime(data["DOB"], "%m/%d/%Y").date()
age_y = (today.year - DOB.year)
age_m = (today.month - DOB.month)

if age_m < 0:
    age_y = age_y - 1
    age_m = age_m + 12

age = str(age_y) + " y " + str(age_m) + " mo "
print (age)

所以,我想弄清楚如何将年龄写入 outputfile.csv 中的正确字段?

更新 2:设法将大部分内容写入,但是,在输入文件中某些字段留空时出现错误。我的老板还希望我根据约会的实际日期确定年龄。我当前的代码块:

import re
import csv
import datetime

def getage(visit, dob):
    years = visit.year - dob.year
    months = visit.month - dob.month
    if visit.day < dob.day:
        months -= 1
    if months < 0:
        months += 12
        years -= 1
    return '%sy%smo'% (years, months)

with open('inputfile.csv','r') as fin, open('outputfile.csv','w') as fout:
    reader = csv.DictReader(fin)
    writer_clinics = csv.DictWriter(fout, reader.fieldnames, dialect="excel")
    writer_clinics.writeheader()

    for data in reader:
        visit_date = datetime.strptime(data["visit_date"], "%m-%d-%Y").date()
        DOB = datetime.datetime.strptime(data["DOB"], "%m-%d-%Y").date()
        data["Age"] = getage(visit_date, DOB)
        writer_clinics.writerow(data)
4

3 回答 3

4

您不能将天转换为年和月,因为年和月的天数不同。您需要自己考虑年份和月份的差异。

dob = datetime.datetime.strptime('07-30-1950', '%m-%d-%Y')
now = datetime.datetime.now()
years = now.year - dob.year
months = now.month - dob.month
if now.day < dob.day:
    months -= 1
while months < 0:
    months += 12
    years -= 1
age = '{}y{}mo'.format(years, months)

>>> print age
62y9mo
于 2013-05-17T17:15:15.160 回答
1

此代码使用Mark Ransom 的算法来获取正确的年龄。这会按照您在问题中的要求填充输出 CSV 文件。

import re
import csv
import datetime

def getage(now, dob):
    years = now.year - dob.year
    months = now.month - dob.month
    if now.day < dob.day:
        months -= 1
        while months < 0:
            months += 12
            years -= 1
    return '%sy%smo'% (years, months)

with open('inputfile.csv','r') as fin, open('outputfile.csv','w') as fout:
    reader = csv.DictReader(fin)
    writer_clinics = csv.DictWriter(fout, reader.fieldnames, dialect="excel")
    writer_clinics.writeheader()

    for data in reader:
        today = datetime.date.today()
        DOB = datetime.datetime.strptime(data["DOB"], "%m-%d-%Y").date()
        data["Age"] = getage(today, DOB)
        writer_clinics.writerow(data)

注意:我仅使用您在上面提供的 CSV 文件来测试此代码。

于 2013-05-17T18:14:32.490 回答
0

您是否尝试过eGenix DateTime包?:

>>> import mx.DateTime as dt
>>> a = dt.DateTime(2000, 1, 1)
>>> b = dt.DateTime(2013, 6, 17)
>>> x = dt.Age(b, a)
>>> x.years
13
>>> x.months
5  
于 2013-05-17T17:01:24.430 回答