几个主要搜索引擎的user_agent及抓取频率
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
32032
Sogou web spider/4.0(+http://www.sogou.com/docs/help/webmasters[……]
这是fengyqf的博客
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
32032
Sogou web spider/4.0(+http://www.sogou.com/docs/help/webmasters[……]
google的更新速度太快了,昨天傍晚新购买了一个域名path8.net——个人不喜欢.com域名——晚上改换网站域名,计划原域名page99.net在一段过度期后作废。
具体什么时间作废,没法确定,因为这点是按google收录页面全部转到新域名的时间决定。也就是说,原域名没有存在价值后,就会[……]
对一段时间内本站访客使用浏览器比较看浏览器份额,本站主要是web网络相关技术为主的站点,对于这部分关注用户而言,使用linux操作系统的用户占10%,这已经是一个非常大的比例。使用非IE(包括非IE内核)的人数相当高,近25%。
1.
baidu突然良心发现了吗?
昨天被百度K了,今天又突然恢复了。不知是什么原因。
好像最近一段时间(google退出了),baidu时常抽风,搜索结果比较异常,不知这两件事之间是否有什么 关系。(是否真的如有人大胆猜测的baidu调用了google的搜索结果,这就太恶劣了)
site:pa[……]
发了几篇对百度不利(可以促使它改进服务,也不是完全的“不利”)的文章,果然就被K了,非常快,才3天。
昨天还有3百多条收录,今天只剩4条
看来百度的人工干预实在是太厉害了!
今天从量子统计里看到一个印度的访问者,访问了两个页面,
来源都是google搜索,第一次访问
http://www.google.co.in/search?hl=en&source=hp&q=path8.net&btnG=Google%20Search&m[……]
下班了,突然想来看博客今天有哪些人访问,连上数据库,直接查看之前wordpress访客追踪插件的访问追踪记录表,今天的访问照样大多是来自google,然也有一些其它搜索引擎的,加起来也没有google的多。里面有几个“人”访问的,习惯性的查一下ip地址是哪里的。前两天查时,有几个使用win2003的[……]
提醒:有了个新版本,照样很简陋,默认将追踪记录表放到单独的数据库里;如果表访问失败会给出简单的消息提示。 传送门: 极简单/简陋的wordpress插件:网站访客追踪记录 v0.0.2
wordpress本身没有用户访问记录的功能,甚至连文章点击次数都没有记录,当然可以借助google analy[……]
百度空间数据导入wordpress 2.9.1, 初步完成。 使用php数据采集器,hmjcj_1.3 采集数据,主要包括文章标题,分类,时间等。很简单的采集工具,称不上多好,但在这里够用了。 采集得到的数据整理,distinct得到所有文章分类,导入一个新表里,原始文章表里,加分类id号字段,up[……]