如果您碰巧使用 Windows,请查看Log Parser。它可以作为独立下载找到,也可以作为IIS Reource Kit的一部分。
Log Parser 可以读取您的日志并将它们上传到数据库。
数据库注意事项:
对于您的数据库服务器,您将需要一些快速的东西(Microsoft SQL Server、IBM 的 DB2、PostgreSQL 或 Oracle)。mySQL 可能也很有用,但我没有使用大型数据库的经验。
你会想要你能负担得起的所有内存。如果您将定期使用数据库,我会说至少 4 GB。它可以用更少的东西完成,但你会注意到性能上有很大的不同。
此外,如果您负担得起,请选择多核/多 cpu 服务器,并且再次,如果您将定期使用此数据库。
另一个建议是分析您将要执行的查询之王并相应地规划索引。请记住:您创建的每个索引都需要额外的存储空间。
当然,在大量数据加载操作之前,关闭索引甚至销毁 de 索引。这将使负载更快。数据加载操作后重新索引或重新创建索引。
现在,如果这个数据库将是一个持续的操作(即不仅仅是调查/分析某些东西然后丢弃它),您可能需要设计一个包含目录和详细信息表的数据库模式。这称为数据库规范化,您需要的规范化的确切数量取决于使用模式(数据加载操作与查询操作)。如果要持续使用此数据库并且有性能要求,则必须有经验丰富的 DBA。
附言
我会冒险在这里包含一些明显的东西,但是......
我想您可能对Log Analyzer感兴趣。这些是从 Web 服务器日志文件生成统计信息的计算机程序(有些还可以分析 ftp、sftp 和邮件服务器日志文件)。
Web 日志分析器生成带有统计信息的报告。通常,报告生成为 HTML 文件并包含图形。深度分析和选项有很多种。有些是非常可定制的,有些则不是。您将找到商业产品和开源产品。
对于您将要管理的数据量,请仔细检查每个候选产品,并仔细查看处理速度和能力。