我需要下载并处理澳大利亚气象局的天气文件。到目前为止,以下 Python 运行良好,它完全按照我的意愿提取和清理数据
import pandas as pd
df = pd.read_csv("ftp://ftp.bom.gov.au/anon/gen/fwo/IDY02122.dat", comment='#', skiprows=3, na_values=-9999.0, quotechar='"', skipfooter=1, names=['stn', 'per', 'evap', 'amax', 'amin', 'gmin', 'suns', 'rain', 'prob'], header=0, converters={'stn': str})
问题是文件每天都会被覆盖,指示预测生成日期和时间的元数据位于前两行的注释字段中,即文件包含以下数据
# date=20131111
# time=06
[fcst_DB]
stn[7] , per, evap, amax, amin, gmin, suns, rain, prob
"001006", 0,-9999.0, 39.9,-9999.0,-9999.0,-9999.0, 4.0, 100.0
"001006", 1,-9999.0, 39.4, 26.5,-9999.0,-9999.0, 6.0, 100.0
"001006", 2,-9999.0, 35.5, 26.2,-9999.0,-9999.0, 7.0, 100.0
是否可以使用 pandas 在结果中包含前两行。理想情况下,通过在结果中添加日期和时间列并为输出中的每一行使用值 20131111 和 06。
问候戴夫