首页 > 编程笔记

搜索引擎工作流程分析

一个合格的 SEOer 必须了解搜索引擎的工作原理(如图1所示),毕竟多数看上去让人迷惑的 SEO 问题及解决方法都是从搜索引擎的工作原理出发的。

搜索引擎工作原理示意图
图1:搜索引擎工作原理示意图

说到底,SEO 是一项穿梭在用户与搜索引擎之间的工作,既要保证用户体验又需要尽量迎合搜索引擎。

从某个角度来讲,SEO 优化人员对于网站的优化工作就是尽量减少搜索引擎的工作量、降低搜索引擎的工作(识别)难度,致使搜索引擎能够更加轻松、快速地抓取网站页面,并准确地提取页面内容。

只有深入了解搜索引擎的工作原理,从用户的角度出发考虑如何获取搜索引擎排名,才能够清晰地知道怎样优化网站,使其符合搜索引擎的友好度原则。

搜索引擎的主要工作包括页面抓取、页面分析、页面排序及关键字查询(索引)四个步骤:

1) 页面抓取

是指搜索引擎通过蜘蛛程序在互联网上抓取页面并进行存储的过程,为搜索引擎开展后续的各项工作提供数据支持。

2) 页面分析

主要是指对蜘蛛程序所抓取回来的网页进行信息提取处理,包括页面的正文信息,并对正文信息进行分词处理等,为后续建立关键字索引提供基础数据。

3) 页面排序

搜索引擎结合页面的内外部因素计算出该页面与某个关键字的相关程度,从而得到与该关键字相关的页面排序列表。

4) 关键字查询(索引)

搜索引擎接收到来自于用户的检索请求,并对检索信息进行切词及匹配,再向用户返回响应的页面排序列表。

接下来,我将用四篇文章向读者介绍搜索引擎的主要工作流程、原理及作用,以及在对网站进行优化时应该如何应对:

所有教程

优秀文章