十二月 19th, 2008

[博客SEO]从搜索引擎的工作原理谈博客SEO[上]!

Category: 博客SEO, Author: 天天小雨 , ( 1131 个脚印 )

原创文章,引用转载请注明:引用转载自(www.tianliang.org)田亮博客。 

        前面我向大家介绍了各大网站包括搜索引擎的博客收录链接地址,《中文博客必须要提交的博客搜索引擎的7个网址!》,提交自己的博客是为了搜索引擎能更好的收录,同时也是在为自己的网站或者博客宣传,试想一个没有提交的网址要想产生很多的浏览访问几乎是不可能的,除了要向各大搜索引擎提交网址之外,还要尽可能将自己的博客提交到公共目录,例如DOMZ,《DOMZ的重要性以及如何向DMOZ提交你的网站(含提交页面的地址)》,这篇文章是好久之前写的,我也提交了,不过好像到现在也没有被收录,估计是由于人工审核的缘故,没有别的办法,只能是不断的提交了。

        提交到搜索引擎之后,我们的博客或者网站就很容易被收录了,那么就有问题了,为什么有的博客被百度或者GG收录(在搜索框内输入 Site:www.tianliang.org)的页面非常多,而有的博客就被收录的非常少呢!到底搜索引擎的工作原理是怎样的呢?秉承着边写边学的精神,粗略介绍下搜索引擎的工作原理

        搜索引擎的基本结构及工作原理
        [搜索引擎的一般结构]

        搜索引擎系统结构的主要构成之一是搜索器(Spider),俗称蜘蛛,是一个自动收集网页的系统程序。她的功能是日夜不停地在互联网中漫游,搜集信息。她要尽可能多、尽可能快地搜集各种类型的新信息,还要定期更新已经搜集过的旧信息,以避免出现死链。粗略的说,她日夜不停的工作,通过一个网站的里的对外链接,再延伸到另一个网站,再通过另一个网站里的外部链接找到另外外一个网站,层层铺开,层层检索,就像一个蜘蛛在编织自己的蜘蛛网。如果这个蜘蛛检索到很多网站或者博客,都能找到你自己的博客的链接,并能通过链接再次检索你的博客,会给这个吃链接的蜘蛛什么印象。当然它就会认为这个博客受到了大多数网站的赞同,大多数的网站都给她投了表扬的一票。如果这个博客每天还有资料更新的话,搜索引擎当然更会经常来更新你的博客,并收录相关的符合她口味的页面了,那么就不难理解为什么有些人的博客被搜索引擎收录的页面很多的缘故了!

        一般来说,搜索器有两种搜集信息的策略:
        (1)从一个起始URL集合开始,顺着这些URL中的超链接(Hyperlink),以宽度优先。深度优先或启发式方式循环地在互联网中发现信息。它沿着任何网页中的所有URL“爬”到其他网页,重复这个过程,并把搜集到的所有网页存储起来。
        (2)将Web空间按照域名、IP地址或国家域名划分,每个搜索器负责一个子空间的穷尽搜索。

        这也就涉及到一个链接的问题,通俗的说,链接对于搜索引擎来说就是投票,比如你的博客我们称之为P,有A、B、C、D、E、F、G、H、I、J代表不同的网站,如果你在A-J中都有连接指向你的博客,那么搜索引擎就认为A-J这10个网站给你投了10票,那么如果这A-J这10个网站都是合法且不违规的网站,那么这10票就全是信任票,如果这A-J10个网站和你的博客内容相关,那么信任票的信任程度会更大,你的收录或者排名自然会更靠前,所以要不断的寻找链接,或者让其他人链接你!当然,付费链接也就此产生!

        未完,待续……

        欢迎和我(www.tianliang.org友情链接,申请友情链接请到[友链申请]! ;) 

        附件:从搜索引擎的工作原理谈博客SEO [上].pdf

原创文章[除网络转载]转载请注明: 转载自天天小雨博客
本文链接地址:从搜索引擎的工作原理谈博客SEO[上]!

Add Comments

本文网址:http://www.tianliang.org/635668/

4 Comments so far

» You can leave a response or Feed for this Entry or Trackback .

  1. Gravatar Icon 古侯子 Says:

    期待继续,呵呵,学了不少东西啊

    [回复]

  2. Gravatar Icon 囧绵羊大帝囧 Says:

    原来是这样啊
    受教了

    [回复]

           天天小雨回复:    

    @囧绵羊大帝囧 在学习中提高,共同进步! :)

    [回复]

  3. Gravatar Icon angrryouth Says:

    实际上要复杂的多 :o

    [回复]

leave a reply