在此前的一篇文章(百度的那些破事——百度封杀Wordpress的内幕曝光)中提到了一些原因,导致百度对Wordpress的blog整体将权的事情,实际通过我的进一步分析和观察,不完全是将权的原因,而是百度太弱智!
具体症状就是,用Wordpress的构建的blog系统,在百度中要不是无法索引,要不是索引了大量tag、sort分类,而真正的正文基本不索引,导致整个blog网站在百度基本搜索不到结果,或者结果很少!
经过分析,发现百度对Wordpress的内容页面分析,出现重大偏差,基本上认不清Wordpress的正文内容;而这样一点,Google做的很好!
具体案例1:
1:在百度搜索我blog中的:从XHTML-Strict取消target属性说开去 ,居然没有结果,出来的2个,是tag页面;
2:在Google搜索我blog中的:从XHTML-Strict取消target属性说开去 ,一切正常,结果在第一;
具体案例2:
1:在百度中查询本blog的索引情况:site:paopaoniu.com,出来970个结果,但大部分都是tag、sort分类页面,正文内容很少很少;
2:在Google中查询本blog的索引情况:site:paopaoniu.com,出来415个结果,但除了少部分tag、sort分类页面外,大部分都是正文内容,属于正常情况!
结论:
从这个可以看出,百度对网站页面的分析能力,绝对比较弱智,当然,这是和google相对比的结果!
所以此前得出的“百度对wordpress”将权的结论,实际应该是Baidu根本对wordpress的页面结构分析能力很差,导致无法正常分析网站页面、链接!
解决办法:
面对这样弱智的搜索引擎,你无法改变他!
但很无奈,大量用户在使用它,无法改变,只能适应,所以就要重新调整wordpress的页面、主题结构!
这个具体我还在研究,下来有研究结果了,再公布出来!
也欢迎有经验的wordpress,积极贡献自己的经验和知识!
















嗯 是啊http://www.ezz.cc
你博客在 feed 中没有格式。
我的博客收录还行,我把 tag 页面写在 robots.txt 里了。百度弱智我不怀疑。但,使用 wordpress 的博客的模板是否符合标准,或者说,符合百度的标准,就不一定了。
确实,特别是大部分主题都来自外国,没有结果“中国化”处理,所以问题就比较突出
各搜索引擎的算法不一样而已。我的站GOOGLE还狂收flash呢,而且都是重复的。
也注意到这种情况了!
算法不同
搜索引擎应该是“博爱”,而不是个性十足!
百度对很多WP都是如此,而且极少收录 长地址网址
还有百度对WP的UTF8中文乱码
恩恩.非常赞同.
百度的确是很弱智的