【 tulaoshi.com - PHP 】
许多网站设计者最常犯的错误便是当其网页能够在IE下正常显示便认为其代码正确无误,甚至常看到有人在抱怨其网站排名不理想,到其网站简单看一下便可发现 HTML代码中充斥各种各样的错误,在那样的代码基础上无论付出多少努力去优化网站结果都可能是付诸流水的啊!事实上,IE是一款对HTML代码容错能力甚高的的浏览器,——说句题外话,尽管我们可以有各式各样的理由可以攻击微软,但微软对其产品操作的易手性及可用性方面所做的努力是不容抹杀的。——Web页面能够在IE下正常显示绝不意味着页面的HTML代码没有问题,甚至可以推而广之,Web页面在多种浏览器下均可正常显示也不意味着HTML代码完全合法有效,毕竟哪个浏览器都要保证基本的容错的功能,不然,就会发生即使仅仅因为网络传输中的一点导致导致 HTML页面显示不正常了,而这在网络带宽仍然紧张的今天仍是频繁发生的。
什么是合法有效的HTML代码 简单说来,我们的Web页面是由HTML(Hypertext Markup Language :超文本链接标示语言)元素构成的,即使对于ASP、PHP之类的动态页面,其也是由SERVER将ASP或PHP语句渲染成相应的HTML元素并下传到客户机上;对于JavaScript之类则由客户端将其转换为HTML。
同其他语言一样,HTML也有自己的语法规则,无论是浏览器还是搜索引擎的Spider都在根据这些规则来分析网页代码中的内容。但很多时候,即使对熟练人员来说,在HTML页面构建时仍然难免出些HTML代码上的错误,更别提大部分所见即所得编辑器造成的HTML冗余臃肿问题了。
如果页面中不存在违背HTML标准语法规范的成分,即可被称为合法有效的HTML代码
合法有效的HTML代码对SEO的重要性 要使搜索引擎收录我们的网页,——在此基础上才能谈网站优化网站推广——其前提是要让搜索引擎的Spider能读懂我们的Web文件。搜索引擎 Spider阅读网页的根据便是HTML规范,通过对HTML代码的分析,Spider才能判断网页内容,在此基础上才能判断针对相应关键词的相关性。
需要明确的是,搜索引擎Spider不同于浏览器的一点便是其容错能力相对于浏览器要差不少,如果页面代码中存在其无法解释的HTML代码时,其便可能停止阅读该页面甚至可能停止在我们的网站内爬行,更严重的错误甚至会导致其同时也丢弃已经收集到的网站内其他页面的内容信息。
尽管如今如大主要搜索引擎也都在尽力提高Spider的容错能力,让其可以在HTML代码出现一般性错误时不至影响对内容的收集。但很多时候,仍然会发生如漏了一个关闭标签导致整个页面的内容被忽略的情况。
另一方面,合法有效的HTML也可以保证Web页面可以在多种浏览器下被正确解释,避免同一个页面在IE下显示正常在Mozilla下却严重变形的情况(当然,不能完全避免),这对于提高网站的可用性方面也是有着极大好处的。
如何验证HTML代码的合法有效? Internet有很多类似的免费服务可以帮我们验证网页代码是否合法有效,其中最著名的即是 W3C HTMLValidator,这是由W3C( World Wide WebConsortium:万维网联盟)官方推出的免费服务项目,在其页面上只需输入待验证的HTML地址或者上传一个在本地机上的HTML文件即可,其会很快返回校验结果,是否无误,如有错误分别为哪些及如何改进等。
同时,W3C HTML Validator也提供对CSS文件的验证服务。
一定要通过W3C的验证么? 对这个问题的答案则不那么绝对。
理论上说,合法的HTML代码能够使搜索引擎的Spider在更容易地收集网站页面的内容信息。但另一方面,并不是所有的HTML代码错误都会影响到 Spider的爬行,也即是说,HTML存在少量的错误对Spider来说也是可接受的,那么,一定要通过W3C认证么?
另一方面,如在Mark Daoust的测试中,甚至暗喻(未肯定地下结论)存在少量HTML代码错误在页面在Google排名中能更占优势,当然这存在很大争议,但至少证明了存在少量HTML代码错误并不影响网页在SERP中的排名。
个人观点,如果您对HTML相对不那么熟悉的话,倒也不必强求非得100%通过W3C的验证,毕竟把更多的时间与精力放到真正应该努力的方向如创建内容与链接才是根本,但要保证HTML代码中不存在大的严重性错误。当然,如果您对HTML语言较为精通,那么,何妨稍花点功夫以确保其完全无误呢?正如在上篇文章中所说的:[next]
因此,我们要做的倒不一定非得通过W3C认证,但至少要保证其在各种浏览器下显示正常,保证搜索引擎的Spider能够正常分析。
提高HTML代码的效率 前文我们提说过