欢迎各位兄弟 发布技术文章

这里的技术是共享的

You are here

LINUX入门篇之使用LYNX查看网页代码

shiping1 的头像

看过谷歌网站站长技术指南的朋友一定会看到这句话:使用诸如 Lynx 的文本浏览器来检查您的网站,因为大多数搜索引擎“蜘蛛”程序查看您网站的方式与 Lynx 几乎一样。如果诸如 Javascript、Cookie、会话 ID、框架、DHTML 或 Flash 等复杂功能造成您无法在文本浏览器中看到整个网站,则搜索引擎信息采集软件在抓取您的网站时可能会遇到问题。所以说,使用LYNX对站长了解网站代码在搜索引擎中的展现是非常有帮助的,反正都是免费的,不用白不用。

安装LYNX

安装的话很简单了,直接使用yum工具就可以了:

[root@lynx ~]# yum install lynx

然后就是一直选择yes完成安装。

查看站点代码

以本站为例,查看首页的代码,首先以putty登陆到系统(centos5.6),然后直接在命令之后加域名即可:

[root@lynx ~]# lynx http://www.today-wx.com

接下来就会显示页面的代码,不过因为本站使用GB2312的编码,所以会显示乱码:

显示乱码

因为系统默认的语言编码是UTF-8,如果选择其他编码,使用putty查看帮助文件或者其他含有中文的文件时会显示乱码,而且putty的编码预设中好像也没有GB2312的编码,不过也不需要担心,我们可以登录到图形界面来查看:

[root@lynx ~]# init 5

进入图形界面,在顶部工具栏找到“应用程序-附件-终端”进入命令行界面,然后在终端中调整字符编码为GB2312:

调整字符编码

调整完成使用lynx查看网页代码:

代码显示正常

可以看到,没有乱码了,不过大家应该也注意到了,字体的颜色是有区别的,关于颜色我个人总结如下:

  • 蓝色就是普通的锚文本。
  • 白色的就是普通文本文字。
  • 深黄色的是图片。

关于操作,有一下几点需要说明一下:

  • 使用上下键进行移动,只能在带链接的内容上移动,鼠标当前焦点为浅黄(就是那个“今日无线”的颜色了)。
  • 图片如果加alt信息,则显示alt内容,没有加alt则显示图片文件名,从这里我们也可以看出非常重要的一点:那就是图片的alt信息非常的重要,不但有利于用户体验,而且带链接的图片在搜索引擎眼里的表现形式其实是和锚文本一样的。
  • 标签的title信息在lynx中没有任何展现,所以个人认为是可有可无的,唯一存在的理由就是用户体验。
  • 如果移动到的内容带链接,可以按enter键进入所在页面。
  • 要退出,可以按q然后选择yes即可。

结束语

LYNX的安装和使用都非常的简单,大家如果E文不错的话可以详细查看一下帮助文档,或者使用lynx –help来产看所有的参数,这里就不再献丑了。

来自 http://www.today-wx.com/linux/274.html

普通分类: