正信 > 网站优化

网站重复页面如何处理

发布时间:2018/5/12 发布人:管理员

将重复的代码,例如左侧的导航和右上角的导航,设法移到网页代码的下部,或者独立出来用js或直接用iframe插入等调用。尽量让引擎吃到的每个网页,第一口咬下去都觉得新鲜有料。搜索引擎在收录网页的时候,就会分析页面内容因应产生数据指纹,这样可以大幅降低系统资源消耗。同时我相信高密度关键词,是数据指纹的主要特征。

引擎不太可能去比较每个网页的相似度,而是每个网页列出一个高频词表,通过这个表换算成一个数字,这叫向量换算,这个数字就代表了这个网页的特征,叫信息指纹。引擎通过比较这个指纹来识别网页是否相同。因此网页有多少相似是无所谓的,高频词的接近程度才是致命的。

网页结构本身不会造成使关键词密度超过了搜索引擎容许的程度的。如果超过了也可以通过增加网页其它文本内容的做法来“稀释”关键词的密度的。网页模板的特点就是相似,搜索引擎惩罚的不应该是模板的相似,归根结底是惩罚关键词的相似!所以,网站优化同样也可以通过增加各网页其它文本内容的做法来“稀释”这种相似度。那如何合理的布局网站关键字呢?

在页面各处分摊您的关键字:关键字与关键字之间的位置(距离),尽量使用不同的网页标题,争取让自己网站的内容更多的 进入搜索引擎索引范围。关键字出现位置分布:在页面导航出现核心关键字;正文开头出现关键字;在命名文件路径中出现关键字:使用短的文件名和文件夹名,长的文件路径让搜索引擎编程程序可能看起来觉得是垃圾信息。

发现网站网页

搜索引擎通常通过其他一些链接来寻找到新的网站、网页,所以在搜索引擎发现网站的过程中,就需要增加适当的外链,而且,内链也应当丰富,能让搜索引擎派出的spider从内链中顺利爬行,以便抓取新的页面 。

搜索网站页面

一旦某个网页被搜索引擎对有所了解,比如百度,就会让某个“站点”去搜索这些网页。你很可能希望整个网站都被搜索。但是,这很可能会由于搜索效率低或者基础结构(阻止站点登陆网站)等因素而受到阻碍。

提取内容

一旦搜索引擎派出的spider登陆某个页面,它就会进行选择性存储,搜索引擎就会考虑到底需不需要储存这些内容。如果它们认为这些内容大多都比较空洞或者说价值不大,那么通常不会储存网页(比如,这些网页或许是网站上其他网页内容的总和)。重复内容的其中一个普遍原因就是合并,这就是索引。

微信咨询