seo简谈-HTML语言用法

来源:百度文库 编辑:神马文学网 时间:2024/04/28 19:44:56
 

一,HTML介绍:
html英文意思是:hypertext Marked Language,就是超文体标记语言,是一种用制作超文本文档资料的简单标记语言.用HTML编写的超文本文档叫HTML文档,它能独立于种操作系统平台(如UNIX,WINDOWS等)。自1990年以来HTML就一直被用作Word Wide Web 的信息表示语言,用于描述Homepage的格式设计与www其它的Homdepage的连结信息。使用HTML语言描述的文件,需要通过WWW浏览器显示出效果。
所谓超文体,因为它可以加入图片,声音,动画,影视等内容,因为它可以从一个文件跳到另一个文件,与世界各地主机的文件连接。
HTML文档的扩展名通常是“html“,“htm”,可用相关的软件编辑,用ie浏览。
二,HTML的基本结构:


< http-equiv="Content-Type" content="text/html; charset=gb2312" />
标题


网页主体部分


我们以简单的例子http://www.dawncheer.com  来说明:
1,头部


< http-equiv="Content-Type" content="text/html; charset=gb2312" />
五行蔬菜汤,糙米茶,牛蒡茶,银杏茶,玄米茶-XXXX
< name="deion" content="五行蔬菜汤,糙米茶,牛蒡茶,银杏茶,玄米茶生产厂家-XXXX有牛蒡之乡丰县金陵,研发生产的"XXXX"五行蔬菜汤,糙米茶,牛蒡茶,银杏茶,玄米茶是您健康的好选择!0516-89273999">
< name="keywords" content="五行蔬菜汤,糙米茶,牛蒡茶,银杏茶,玄米茶">
< content=all name=robots />
< name="author" content="公司名称,www.dawncheer.com" />
< name="copyright" content="版权所有2009-2012,XXXXX,XXX"/>
< name="verify-v1" content="g1roLfr4jNKBe4nj5js2a33icgMtts6lyyQGMi8UVZc=" />
< name="y_key" content="6989936a7fa02614" />


说明内容开始:
与之间的内容是头部信息,在 IE中除了标题五行蔬菜汤,糙米茶,牛蒡茶,银杏茶,玄米茶-XXXXX之外,浏览者是看不到的,要想看到这方面的信息,可以通过IE中的文件查看》源文件才能看到。我们叫这个部分为头部,可想就知道这部分的内容是比较重要的。这个部分是搜索引擎读取网页内容的信息第一判断,权重比较高,这部分内容我们在网页制作中一定得考虑的内容。下面我们来再分析:
1)charset=gb2312这个代码就是简体中文,如果将其中的“charset=GB2312”替换成
“BIG5”,就是繁体中文, “iso-2022-jp”为日文,“ks_c_5601”是韩文, “ISO-8859-1”为英文,看到这里,有点朋友会问,如果我的网站要全世界打开正常显示,就用“UTF-8”
2) 是标题,这个部分一般比较重要,是一个网页的内容提纲挈领,一般不要太多,过而不及,数字定在25个汉字左右,如果标题内容太长,一般要“减肥”,不过,排后面的汉字权重很小很小,几乎没有作用,很长的标题给人反感呢,建议要“减肥”.标题中要加个相关的关键字。

< name="deion" content="在这里面是网页描述部分",大白话,这个部分是就这个网页主要的内容是什么一般为100个汉字左右,多一点行不行呢,当然可以,只不过多了就没有什么作用了。Deion在英文中就是描述意思,有点朋友一提到英文就头大,这个字太难拼了,再加上这种格式比较难记写,在网页制作中,常常不记得,没有关系嘛,你可以在IE中打上www.dawncheer.com到主站主页面来嘛,文件》查看》源文件,你复制改改就可以用了。这个方法是有点笨,但没有办法呀。
3)< name="keywords" content="在这里面是关键字",keywords英文本意思是就关键字的意思,这里的关键的数量也不能太多,多了也没有什么大的作用,现在相百度,google,yahoo现在对这个部分内容不怎么看中,很淡化了,不过,为了表示专业,还得写上几个吧。
4)< content=all name=robots />,很多朋友问这个是什么意思,英文好一点就知道了robots是就蜘蛛,这句话的意思是让所有的搜索引擎来收录,来爬。

5)< name="author" content="作者" />
< name="copyright" content="版权内容"/>这两个部分有点用途,说明这个网站不是抄袭别人的,是自己原创,有版权的。这个部分内容不是一定要加上的,但对搜索引擎友好嘛,可以加上。
6) < name="verify-v1" content="g1roLfr4jNKBe4nj5js2a33icgMtts6lyyQGMi8UVZc=" />
< name="y_key" content="6989936a7fa02614" />这两个部分分别是google的网站管理员的验证码与yahoo网站管理员的验证码,对页面的优化有一点好处,具体内容大家可以分别上GG与YAHOO的网站找,在这不多说,这个部分不是一定要的,可以删除。
2,主体部分:
主体就是你在网页的内容
网页的内容太多,不能是一体化,网页设计师在做网页制作中自由发挥,可以用表格来做,可以用div加css来做,可以放文字,图片,动画等,在dr中就可以做了。
附:

Google 可以识别以下元标记(和相关项):

< name="deion" content="网页说明" />

此标记会提供网页的简短说明。 在某些情况下,此说明充当搜索结果中显示的一部分代码段。

网页标题

虽然从技术上讲,这不是一个元标记,但是此标记经常与"deion"(说明)一起使用。 此标记的内容通常显示为搜索结果(在用户的浏览器中)中的标题。

< name="robots" content="..., ..." />
< name="googlebot" content="..., ..." />

这些元标记可以控制搜索引擎抓取和编制索引的行为。 robots 元标记适用于所有搜索引擎,而"googlebot"元标记专用于 Google。 默认值是"index, follow"(相当于"all"),不需要进行指定。 我们可以识别以下值(指定多个值时,请使用逗号进行分隔):

  • noindex:防止网页被编入索引
  • nofollow:防止 Googlebot 从此页面中跟踪链接
  • nosnippet:防止代码段显示在搜索结果中
  • noodp:防止 ODP/DMOZ 中的替代说明被使用
  • noarchive:防止 Google 显示网页的快照链接。
  • unavailable_after:[date]:可让您指定要停止此网页被抓取和索引编制的确切时间和日期
  • noimageindex:可让您指定,您不希望您的网页显示为 Google 搜索结果中出现的图片的引用页。

另外,现在您还可以使用"X-Robots-Tag"HTTP 标头指令在网页的标头中指定此信息。 如果要调整非 HTML 文件(如图形或其他类型的文档)的抓取和索引编制,那么此指令就特别有用。

< name="google" content="notranslate" />

如果我们发现网页内容所用的语言不是用户想要阅读的语言,则通常会在搜索结果中提供翻译链接。 这样通常会让您有机会将独特而富有吸引力的内容提供给更多用户。 不过,也可能会出现一些并不期望发生的情况。 此元标记会告诉 Google 您不需要我们提供此页的翻译。

< name="verify-v1" content="..." />

您可以在网站的顶级页面上使用此标记,以对网站管理员工具验证您的所有权。 请注意,虽然"name"和"content"属性的值必须与提供给您的值完全匹配(包括大小写),但是是否将标记从 XHTML 更改为 HTML,或者标记的格式是否与网页的格式相符,这些都不是什么问题。

< http-equiv="Content-Type" content="...; charset=..." />

此元标记定义网页的内容类型和字符集。 确保您已在内容属性值的两端添加了引号,否则系统可能会错误地解译字符集属性。

< http-equiv="refresh" content="...;url=..." />

此元标记会在一段时间后将用户指向新网址,有时也会被用作重定向的简单形式。 不过,并不是所用浏览器都支持此功能,因此可能会造成用户困惑。 W3C 建议不要使用此标记。 我们建议改用服务器端 301 重定向。

需要注意的其他事项:

  • 无论网页采用哪种代码,Google 都可以读取 HTML 和 XHTML 形式的元标记。
  • 除"verify"(验证)外,在元标记中,大小写通常无关紧要。

此列表中并未列出所有可用的元标记,如果未在此处列出的元标记对您的网站很重要,请放心大胆地使用。 唯一需要记住的是,Google 会忽略不认识的元标记