欢迎各位兄弟 发布技术文章

这里的技术是共享的

You are here

apache日志定义和把日志文件导入到数据库中分析

shiping1 的头像

%...a: 远程IP地址 
%...A: 本地IP地址 
%...B: 已发送的字节数,不包含HTTP头 
%...b: CLF格式的已发送字节数量,不包含HTTP头。例如当没有发送数据时,写入‘-’而不是0。 
%...{Foobar}C   发送给服务器的Cookie Foobar的内容 
%...D:   服务器请求时间,微秒 
%...{FOOBAR}e: 环境变量FOOBAR的内容 
%...f: 文件名字 
%...h: 远程主机 
%...H 请求的协议 
%...{Foobar}i: Foobar的内容,发送给服务器的请求的标头行。 
%...l: 远程登录名字(来自identd,如提供的话) 
%...m 请求的方法 
%...{Foobar}n: 来自另外一个模块的注解“Foobar”的内容 
%...{Foobar}o: Foobar的内容,应答的标头行 
%...p: 服务器响应请求时使用的端口 
%...P: 响应请求的子进程ID。 
%...{format}P   服务器的子进程ID,或者线程id,可利用的格式是pid或者tid. (Apache 2.0.46 and later) 
%...q 查询字符串(如果存在查询字符串,则包含“?”后面的部分;否则,它是一个空字符串。) 
%...r: 请求的第一行 
%...s: 状态。对于进行内部重定向的请求,这是指*原来*请求 的状态。如果用%...>s,则是指后来的请求。 
%...t: 以公共日志时间格式表示的时间(或称为标准英文格式) 
%...{format}t: 以指定格式format表示的时间 
%...T: 为响应请求而耗费的时间,以秒计 
%...u: 远程用户(来自auth;如果返回状态(%s)是401则可能是伪造的) 
%...U: 用户所请求的URL路径 
%...v: 响应请求的服务器的ServerName 
%...V: 依照UseCanonicalName设置得到的服务器名字 
%...X   响应完成后的连接状态。 
X =   在请求完成之前,连接忽略。 
+ =   在请求发送后,连接保持。 
- =   请求发送后连接关闭。(This directive was %...c in late versions of Apache 1.3, but this conflicted with the historical ssl %...{var}c syntax.) 
%...I   接收字节,包括请求和头。不能为0。你需要启用mod_logio. 
%...O   发送字节,包括头。不能为0。你需要启用mod_logio.Referer log format   Referer日值格式 
     "%{Referer}i -> %U" 
Agent (Browser) log format 代理(浏览器)日值格式 
     "%{User-agent}i"在所有上面列出的变量中,“...”表示一个可选的条件。如果没有指定条件,则变量的值将以“-”取代。分析前面来自默认httpd.conf文件的 LogFormat指令示例,可以看出它创建了一种名为“common”的日志格式,其中包括:远程主机,远程登录名字,远程用户,请求时间,请求的第一行代码,请求状态,以及发送的字节数。  有时候我们只想在日志中记录某些特定的、已定义的信息,这时就要用到“...”。如果在“%”和变量之间放入了一个或者多个HTTP状态代码,则只有当请求返回的状态代码属于指定的状态代码之一时,变量所代表的内容才会被记录。例如,如果我们想要记录的是网站的所有无效链接,那么可以使用:LogFormat %404{Referer}i BrokenLinks   反之,如果我们想要记录那些状态代码不等于指定值的请求,只需加入一个“!”符号即可:LogFormat %!200U SomethingWrong

 

 

 

把日志文件导入到数据库中分析

LogFormat "\"%{Host}i\",\"%h\",%{%Y%m%d%H%M%S}t,%>s,%B,\"%U\",\"%{Referer}i\",\"%{User-Agent}i\"" mysql

这样生成的日志可以直接用

LOAD DATA INFILE '/local/access_log' INTO TABLE tbl_name FIELDS TERMINATED BY ',' OPTIONALLY ENCLOSED BY '"' ESCAPED BY 

'\\' 导入数据库来进行分析,注意要用环境变量把非页面部分去掉,还要注意用管道轮训日志将日志按天数分开,以便处理

来自 http://wenku.baidu.com/view/723dda0d76c66137ee0619d5.html

 

 

只要三步 下面的方法是完全对的

1)把日志文件中 C:/access_20130719.log不相关的空格去掉

2) CREATE TABLE IF NOT EXISTS `log` (
  `ip` varchar(20) NOT NULL,
  `email` varchar(50) NOT NULL,
  `username` varchar(50) NOT NULL,
  `time` varchar(100) NOT NULL,
  `method` varchar(200) NOT NULL,
  `status` varchar(10) NOT NULL,
  `charnum` int(11) NOT NULL,
  `refer` varchar(100) NOT NULL,
  `browser` varchar(200) NOT NULL
) ENGINE=MyISAM DEFAULT CHARSET=latin1;

 

3)

LOAD DATA INFILE 'C:/access_20130719.log' INTO TABLE log
FIELDS TERMINATED BY ' ' OPTIONALLY ENCLOSED BY '"' ESCAPED BY '\\';
 

 

 

 

如何将 Apache 日志的每日更新导入 MySQL 表?

我想把apache日志access.log每天更新的部分导入到mysql数据库 thinker中的表ts_combined,其中ts_combined表的字段格式已设置好与access.log一致,整体导入可以用语 句:LOAD DATA INFILE 'D:/wamp/logs/access.log' INTO TABLE ts_combined
FIELDS TERMINATED BY ' ' OPTIONALLY ENCLOSED BY '"' ESCAPED BY '\\';那仅导入日志每天更新的部分应该怎么办??
 

 


 

 

你将日志导入 MySQL 干啥?要做日志分析么?用脚本分析是不是更快?怎么专做这种吃力不太好的事情呢?

 

 
用 rotatelogs 滚动日志
 
 
 
apache有个模块mod_log_sql能实现自动导入不需要这么麻烦

http://www.xfdown.com/soft/13272.html

 

普通分类: