1

我正在创建一个 python 脚本来分析日志文件(例如:http ://www.monitorware.com/en/logsamples/apache.php ),并且需要我可以用来实现此目的的方法建议。

  1. 用方法读取日志文件open。好的。
  2. 计算日志的经过时间?我使用哪种方法从日志行中的特定位置读取?示例:64.242.88.10 - - [07/Mar/2004:16:05:49 -0800] "GET /twiki/bin/edit/Main/Double_bounce_sender?topicparent=Main.ConfigurationVariables HTTP/1.1" 401 12846 在这种情况下,如何计算某个位置(如年份)之后的经过时间?

    我还需要显示每分钟服务的请求数、发送的数据总量、发送的平均数据量、单个请求中发送的最大数据量。
4

1 回答 1

3

我会使用re模块从文本中提取信息(搜索、substr 等)。

然后strptime可能是您的朋友将这些日期时间值转换为日期时间并对其进行计算。

之后,我将numpy.ndarray用于存储数据并生成进一步的报告。

我也喜欢matplotlib和功能喜欢hist制作一些漂亮的情节。

于 2014-04-08T09:11:35.950 回答