问题标签 [access-log]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
apache - 如何处理旧的访问日志?
五年前,我的网站有 51 GB 的 HTTP (Apache) 访问日志。就我的个性而言,我是一个囤积者,这就是为什么我不愿意删除它们,即使它占用的磁盘空间比我想要的要多。我应该硬着头皮删除吗?还是匿名?
人们如何处理他们的旧日志文件?
logging - 访问日志解析
我想解析我的访问日志。目标是获取与其位置无关的任何查询字符串参数的值。还有任何免费的 URL 解析软件或网站。
apache - access_log 很大,没有被归档。如何重置它?
我发现我的 access_log 占用了我的大部分硬盘。它的大小超过 200 GB。我怎样才能重置它?
我在带有 Plesk 的 CentOS 服务器上使用 Apache 2.2.3。
感谢你们 !
apache - 是否可以在 apache 中记录响应的第一行?
我们有一个 Tomcat 服务器,我们正在尝试记录发送响应的 HTTP 版本。我们已经多次看到它似乎是 HTTP/0.9,它杀死了内容(我猜不支持?)。我们想通过使用 apache 中的访问日志来获得一些统计信息。但是,由于此标题行没有任何前缀,我们不能使用 %{xxx}o 日志记录。
有没有办法得到这个?
一个例子:
回应是:
并且我们想要捕获HTTP/1.1(或者,HTTP/1.1 503 This application is not current available。
这可能吗?我们无权访问正在服务的应用程序,因此我们需要作为 Java 过滤器或在 tomcat 访问日志中执行此操作 - 最好在访问日志中。
apache - Apache 访问日志中的 %D 字段 - 第一个字节还是最后一个字节?
Apache Httpd 手册有一节关于自定义访问日志格式。这些选项之一是%D
字段,记录为
服务请求所花费的时间,以微秒为单位。
谁能告诉我这到底是在测量什么?例如,它是第一个字节的时间,还是最后一个字节的时间,还是比这更复杂的东西?
我需要这是证明对性能要求的遵守,我想确切地知道这里测量的是什么。
sql - IIS 访问日志到 SQL 规范化
我正在寻找将 IIS 6.0 访问日志(5 台服务器,每天超过 400MB)插入 SQL 数据库。让我害怕的是尺寸。您正在复制很多信息(即站点名称、url、引用者、浏览器),并且可以通过索引和查找表进行规范化。
我寻找自己的数据库而不是使用其他工具的原因是 5 台服务器,我需要非常自定义的统计数据和每个、很少或全部的报告。安装任何(特别是开源)软件也是大屠杀(需要有 125% 的功能并且需要几个月的时间)。
我想知道最有效的方法是什么?有人看过关于它的例子或文章吗?
access-log - 在典型的访问日志中存储什么?
我想到了以下几点:
- 用户 ID(如果可用)
- 用户ip地址
- 时间戳
- 执行的动作
我错过了什么吗?有什么指导方针吗?
tomcat - Tomcat中特定于应用程序的访问日志?
我正在尝试在 tomcat 中为我的 .war 应用程序配置独立的访问日志,但我不知道是什么失败了。
目的是为进入我的应用程序的请求提供单独的访问日志,而不必依赖 tomcat 的全局访问日志。
我知道为此我应该创建自己的上下文配置文件,并使用 AccessLogValve 指定我将写入的位置。
我在应用程序的 WAR 文件中创建了 META-INF/context.xml,其内容为:
启动tomcat时,我看到这个文件被复制到了conf/Catalina/localhost/Stubby.xml,但是在应用程序加载过程中出现了解析错误:
这里有什么问题?我是否遗漏了声明中的任何强制性属性?
logging - 批量保存到数据库的大容量日志记录?
我想以一种不会对我的数据库造成额外压力的快速方式存储有关对我的站点的请求的信息。目标是使用这些信息来防止滥用并收集有关用户如何与站点交互的信息(ip、GET/POST、url/action、时间戳)。
我目前正在将每个页面请求上的新行保存到数据库。但是,当服务器也已经将相同的信息记录到 nginx 日志文件时,这会通过额外的数据库调用浪费资源。
我想知道我能做些什么来更好地处理这个问题,我有两个想法我想知道是否有更好的方法。
- CRON 作业每天解析访问日志并作为批处理事务保存到数据库。
- RAM 缓存(redis/memcached)存储有关请求的数据,然后 CRON 保存到数据库。
但是,如果我以可以检索所有记录并将它们插入数据库的方式使用键值缓存,我不确定如何存储数据。
我也不知道如何以不会重新阅读条目的方式解析访问日志。
如何以有效的方式记录访问尝试?