流氓的百度:我是流氓我怕谁?(百度的前世今生)

注:本文章转自网上他家之言,本人无意损坏百度名誉!但里里面的部分文章也是值得百度的员工一看的!

一、得意洋洋的李彦宏

先看报道:
“北京时间2005年8月5日晚,百度无人入睡。从夜里23时40分开始,3个小时里,百度人经历了人生里最激动人心的时刻,在纳斯达克指数的显示屏 上,他们持有百度原始股,涨幅达到了疯狂的353.85%,魔术般地成为每股122.54美元,一夜之间产生了9位亿万富翁、30位千万富翁和400位百 万富翁,创造了21世纪的财富神话,全世界为之震惊。

看看百度的历史:

“百度,2000年1月创立于北京中关村,是全球最大的中文搜索引擎。  2000年1月1日,公司创始人李彦宏、徐勇携120万美元风险投资,从美 国硅谷回国,创建了百度公司。创立之初,百度就将自己的目标定位于打造中国人自己的中文搜索引擎,并愿为此目标不懈的努力奋斗。
2000年5月,百度首次为门户网站——硅谷动力提供搜索技术服务,之后迅速占领中国搜索引擎市场,成为最主要的搜索技术提供商。2001年8月,发 布Baidu。com搜索引擎Beta版,从后台服务转向独立提供搜索服务,并且在中国首创了竞价排名商业模式,2001年10月22日正式发布 Baidu搜索引擎。
2005年8月5日,百度在美国纳斯达克上市,成为2005年全球资本市场上最为引人注目的上市公司,百度由此进入一个崭新的发展阶段。“

“为“中国Google”的百度,在成功迈向纳市红地毯的一瞬间,光环毕升、集万千宠爱于一身,屡刷新概念股之新高,150美金/股、狂涨了 354%、200位百万富豪,随后几个月百度股价回落。但在同时,百度也遭遇了一系列的麻烦:百度下吧因为内容涉及违法、色情而被关闭,MP3搜索下载遭 受到上海步升以及环球、华纳等五大唱片的诉讼,最后以修改链接方式做出版权声明而告一段落。”

“10月27日,百度公司发布了2005年第三季度财报。尽管从财报来看,百度这一季度的业绩并不难看:较去年同期有成倍增长,营收达1100万美元,利润为110万美元,但这依然没有达到华尔街的预期。当日,百度的股价应声而落,跌幅高达15%以上。

恰好在一周前,Google也公布了2005年第三季度财报。上面所显示的数字几乎令投资者们欣喜若狂:净利润为3。81亿美元,同比增长6倍,这对于一个巨无霸的企业而言,取得这样的成绩当然无异于一个神话。
尴尬的产生,也许就在于这种明显的对比。曾一度被“中国的Google”概念笼罩的百度,曾因为与Google相似而一跃成为纳斯达克的网络新贵,如 今,它又是因为与Google的表现相差甚远,而逐渐遭到投资人的冷眼。成也Google,败也Google,在两者天壤之别的业绩面前,百度的尴尬姿态 显得尤为突兀。”

看了这一系列的报道,您会做何感想?

至少在我的印象里面,还没有见过争议这么大的IT企业。

二、名声越来越臭

最近一年以来到了各大网站,只要有IT讨论版面的,基本上都可以发现骂百度的贴子,而且有越来越多的趋势。甚至出现了反百度联盟网站。好像中国没有第二家互联网公司能够担当如此“殊荣”。为什么?

1、使用中国特色的方式压制google

著名的搜索引擎研究机构Searchenginewatch.com就曾经报道过:“百度在2002年末,组织大批人员向有关部门写信举报 Google中含有的“有害信息”,迫使Google中文服务中断长达一个月之久,而百度乘机抢夺了Google在中国的客户如网易、新浪等,从中获利近 120万美元。”

同样在国内也有消息报道:“新浪网搜索引擎在2003年9月放弃了原来由百度提供的技术,大胆采用Google的技术后,Google为新浪提供的服 务也变得不稳定。据新浪网传出的内部消息,新浪使用Google的技术后,被禁止的“敏感词汇”的检索量出现异常上升,从而造成Google数据的不稳 定,对访问日志的分析表明,异常检索量是有组织的团体行为,也同样怀疑与百度有关。”

这种情况的出现,导致Google创始人在圣荷塞的一次私人聚会上对参加聚会的华裔人士斥责中国搜索公司百度总裁李彦宏(Robin li)是“yellow dog”(卑鄙小人)。

2、商业化过头的百度

李彦宏带着他的百度很快就发现,百度的营收并不足以支撑其奇高的股价。于是,百度开始采取“不择手段”“有奶便是娘的政策“只要你给钱,百度就把你的 网站排在搜索结果的前面,钱越多位置越靠前。这种完全商业化的行为导致搜索结果存在严重的隐患,比如说我们搜索“北京律师“,在google的结果里面出 现的左侧第一个是北京律师协会,紧跟着的几个也是比较出名的北京地方法律服务网站,再看百度,第一页的结果居然全是律师个人的网站。而且根据本人对百度的 了解,百度在客户购买关键词的时候,完全不需要出示任何相关证明,只要你给钱,就可以排到前面去,所以这里面有没有假律师也很难说。

Google就采取了把广告放在右侧专门的固定位置, 雅虎给搜索结果中的广告打上明显的特殊标识,但是这种做法,显然不如竞价排名广告能获得更漂亮的业绩。

根据艾瑞市场咨询提供的数据,在中国搜索引擎用户不满意的因素中,对搜索结果排序不满的比例达到43%,已经显示出信任危机。

一位网民举出例子,比如在百度上搜索“癌症”这个关键词时,搜索结果的前10条都是竞价排名广告,一直到下一页才出来真正和病情相关的搜索结果。

自然搜索结果和广告混在一起,这是所谓“点击欺诈”最常见的现象,它的产生和搜索公司提供的竞价排名广告有着直接关系。这种广告允许广告商凭付费的多 少获取不同的网页位置,也就是说付出的广告费更多,就可以在搜索结果中拿到更靠前的位置,而参与的广告商越多,自然就可以占据更多的搜索版面。

但网民们却因此为信息的真假大伤脑筋。比如本来想通过搜索了解某件产品的质量优劣,结果排在前面的信息可能大多是销售该产品渠道商的名字。一位搜索业 内的人士更指出其中的欺诈嫌疑,“通过购买竞价排名广告,广告主还可能把和产品相关的“好话”都排在前面,这可能对消费者形成误导。”

三、百度的搜索技术真的先进吗

1、李彦宏总是吹嘘他的技术在美国获得专利,他发明了搜索技术,我们不防来看看,百度总裁李彦宏在接受Forbes采访时扬言Google始创于1998年的Pagerank技术专利为其持有,Google抄袭了百度的Pagerank技术等。
这里是笔者在网上找到的关于google和百度专利对比介绍文字说明:

Li Yanhong的美国专利号:5,920,859。专利提交日期为1997年2月5日,批准日期为1999年7月6日。
Lawrence Page(即Larry Page)于1998年1月9日提交,于2001年9月4日被批准,美国专利号6,285,999。

“两个专利申请的区别在于,他们谈的根本就是两回事。要解决的问题和实施方法都不一样,虽然研究对象是一样的,都是链接。

李彦宏的超链分析技术要解决的是文件与搜索关键词的相关性。李彦宏提出的方法是,除了文件本身对关键词的引用外,还需要考虑反向链接中的关键词。具体 来说,一个文件被索引进数据库的时候,会连同指向这个文件的超链接,以及每个超链接当中使用的锚文字(链接文字),一同记录在案。而搜索词也会建立一个数 据库,每个词连同含有这个词的超链接,以及这些超链接所指向的文件一同被记录在案。当一个关键词被搜索的时候,含有以关键词为链接文字的反向链接数目最多 的那个文件或网页,将被作为最相关的结果排在前面。这是基本思路,当然还有其他变量考虑进去。比如说搜索字符串含有几个词的时候,每一个词都是搜索矢量的 一个维度。

而Google的PR专利显然是专注在已经应用了超链分析之后还不能解决的问题。在Google的专利申请中,明确提到即使在考虑了指向文件的链接及 链接锚文字之后,搜索引擎还有重要问题需要解决,那就是来自不同文件的链接有不同的权重值。你不能指望来自白宫网站的链接和非洲某小镇上一个学生的个人网 站上的一个链接,投票值相同。而Google PageRank就是衡量网页重要性的一个方法。指向一个网页的链接越多,而这些链接本身的权重越高,那么这个被指向的网页的重要性及PageRank就 越高。Google的专利申请当中给出了具体怎样计算这一重要性指标,他们取名为网页级别。网页级别的计算需要进行多个循环的替代计算,才能得到近似于最 终结果的PR值。”
笔者还在网上找到一个笑话:“李彦宏说上世纪90年代中期,他在澳大利亚讲超链分析,有两个斯坦福的学 生坐在台下,后来这两个学生做出了Google。不过我一直没太搞清楚这事儿的先后次序,到底是李彦宏的启蒙在前,还是Page和Brin的实践在前。终 于梁冬的书中找到了答案,这个会议的时间是1998年4月,地点是澳大利亚的布里斯班。如果没有搞错,这应该就是第七届国际WWW大会。不过这时 候,Google的前身BackRub已经在斯坦福大学的网络上运行了两年多。
Larry Page和Sergey Brin著名的论文,《一种大规模超文本Web搜索引擎的分析》就是在这次大会上提交的,作为对PageRank技术最早的公开阐述,这个论文后来被大量引用。

我有点喷饭了。

2、百度的搜索技术到底如何先进?

其实从上面的介绍我们就可以看到:Google是按照网页级别(PageRank)来收录的,网站有一定的网页级别,Google会快速收录的,而没 有网页级别的网站,Google则坚决不去收录。Baidu则采用的是来者不拒的原则,百度则不管三七二十一上来就抓整个站,对于网站内容不做分析就快速 收录,公认的其爬虫数量非常庞大,如果你的ISP服务商对你有流量限制。那么,你就倒大霉了,你的流量全部被占掉了。

说白了,百度的搜索方法就是大量派出爬虫,大量收集尽可能快和尽可能多的搜集页面,这样一来大家就会发现,百度好像更新特别快,可是这样是以牺牲有效 性为代价。大家可以做一个测试,随机抽取若干词语分别在google和百度里面搜索看看,还是那句老话:不怕不识货,就怕货比货。特别是在搜索专业性的资 料的时候,百度的搜索基本上是胡扯。

百度甚至不遵守robots规则,笔者曾经有一个网站,这个网站内容有些敏感,主要是跟朋友们一起交流的,所以就不想被搜索引擎收录,按照惯例在根目 录下放了robots文件,明确规定拒绝收录全站,可是过了一过多月居然还在百度搜索里面发现了这个网站的全部内容,更搞笑的是这个网站只有100多页, 百度居然显示收录2万多页。

网上有评论指出:“中国的网民也出现了很奇怪的现象:大量的新网民和菜鸟新手喜欢用百度搜索,因为百度往往搜索到很多别处搜索不到的页面,但内容的匹 配度则令人质疑,而专业人士和老鸟则更喜欢用Google,但在普通的低层次的网民心中却不错,这些大量的普通网民给百度带来了大量流量。”

我们来看看百度是如何吹嘘的:

“自从2000年公司成立以来的六年中,百度一直专注于互联网搜索引擎技术的研发,在高性能搜索引擎网络系统架构、搜索引擎相关算法(网页抓取、内容 索引、查询检索、超链分析、相关性评估以及作弊网页识别)、中文信息处理(分词、命名实体识别、拼音转换和查询纠错等)、网页文本挖掘、基于社区的搜索引 擎、以及搜索引擎商业应用等方面,勇于创新实践,积累形成了一系列具有自主知识产权的核心技术,确保了百度在中文搜索领域的激烈竞争中一直处于领先地 位。”

不明白一点,“处于领先地位”的百度准确率怎么会那么低呢,这里随便举两个词:“猫”“鸟”,大家搜索一下,看看百度与google有什么不同。

四、强盗的市场营销

1、不掏钱就封你没商量

网上有这么一条消息:“2005年年中,百度官方宣布对许多作弊站点进行集中整顿,清除了一批通过技术手段或软件恶意欺骗搜索引擎、欺骗用户,把本身 无内容或内容含量不高的垃圾网站排除在自身搜索结果之外,给予封杀,随后网友“踏雪无痕”成立“反百度联盟”,通过签名、揭发的方式,收集百度对待站长和 网友不公正的证据,促进监督百度公司走向公正,如今该站点签名总数已有6675条,基本上都是遭遇封杀的个人站长在控诉。反百度联盟的观点是:百度借清理 作弊之名封杀个人站点是虚,借机威胁个人站点买单竞关键字广告才是真。”

这一点笔者以及周围的朋友都有亲身体验,好好的从百度搜索过来的访问全都没有了,过不了几天,百度的代理商电话就打过来了。如果不做“搜索关键字服务 “,这些搜索过来的访问全都没有了,更为恶劣的是居然在搜索拒绝购买“搜索关键字服务“的网站时,把竞争对手的网站结果列出来。

有网友这样反映:“由于我的小站在GOOGLE、BAIDU、等几个搜索引擎上同时推广,看不到每个搜索引擎的效果到底怎么样,所以想到先把 BAIDU停掉几天试试,礼拜5联系BAIDU客服,让她从后台把我的全部关键字停掉,当时BAIDU客服设定是下午 4点开始停止推广,但到晚上我下班回家搜索几个常见的关键字时,发现找遍了前10页都没看到我的站,以前这几个关键字我的站自然排名都在第一页。更为糟糕 的是搜索我自己网站的名字都搜不到了,只能通过搜索我的玉米 才能搜出我的站。”

2、收多少钱宰你没商量

百度自2006年6月1日起,大幅提高竞价排名的底价,升幅由几倍到十几倍,完全不是根据客户竞价了,百度美其名说根据商业价值来定,而没有任何标 准、根据,就将竞价底价随意提高十几倍,这就是明火执仗对已预付了钱的客户无异于抢钱的行为,也是没有信用的表现。以前一个关键词的起价统一是0.3元, 但调整后,关键词分了档次,有的起价达到了几元钱,有的价格保持在0.3元左右,还有部分关键词的价格有所下降,但总体来看,涨的多降的少,所谓商业价 值,是指市场的需求大小,有的关键字只有一家使用,也被涨价6、7倍以上,而且是强加的。有的关键字的起价远远超过了第三名第二名的现有价格,请问这样的 价格是如何制定的?既然是竞价,应该是使用者之间的竞价,百度这样做说的好听点叫店大欺客,骗子说的难听点实在是太毒辣,太无耻。

五、百度的危机

1、百度冒充民族企业

在对外宣传上,百度张口闭口都说自己是所谓的“民族企业”,比Google等国外公司“更懂中文”,并打着所谓“爱国”的旗号,说反百度就是反对中国的民族产业,支持Google就是卖国云云。然而事实是:

百度公司注册于英属开曼群岛,
百度的创始人李彦宏持有美国绿卡,
百度启动的资金是美国的风险投资,
现在美资在百度中占有51%以上的份额,
百度在中国注册全资子公司的目的是为了规避中国关于外资不能进入新闻广告等领域法规。
因此,百度准确的说应该是一家由华人创办的、专注于在华业务的美资搜索引擎技术公司。

明白吧,这是一家美国的公司,跟google没有什么区别。

百度这一回没有理由为自己辩护了吧。

2)在搜索违法内容上面,百度远远超过google

据我所知,百度目前对色情违法信息进行了过滤技术当服务器接收到用户提交的搜索词后,先将搜索词和“过滤词汇表”进行匹配对比;一旦匹配成功,服务器 即返回“您输入的关键词可能涉及不符合相关法律法规的内容”,然后结束搜索。从技术上讲,这种“过滤词汇表”实际上有很大缺陷和漏洞,例如在百度搜索 “**”确不让搜索,但是搜索“‘**’”(带引号)即可返回搜索记录,通常会远远多于Google搜索出的记录。推而广之,所有百度通过“过滤词汇表” 屏蔽的词汇,大部分只要加上个引号就全都可以搜索,另外,将多个屏蔽关键字组合在一起也可以搜索出结果,更可笑的是,在百度不可以搜索“色情”,但却可以 搜索出“色情图片”70万条记录,“色情电影”51万条记录,“色情小说”23万条记录,“色情网站”79万条记录,可见这种屏蔽的方法实在是用来忽悠媒 体的,实际作用非常有限。
现在最大的提供“有害信息”的就是百度了。

3、百度以违法为赢利点

众所周知,在国外法律健全的国家,一个网站如果搞免费音乐下载,肯定会因为版权纠纷而面临法律的制裁,最终不得不关闭。

根据ALEXA的统计显示,百度的MP3搜索流量巨大,成为仅次于常规网页搜索的第二大搜索,占其中流量的16%。因此也不难理解,百度宁可打官司也不能不做这种侵犯版权的搜索。

然而,百度还是害怕被国外的唱片公司指控。因为百度是在美国上市的的企业,百度知道如果陷入这种法律纠纷会给自己带来什么后果,因此,百度就自作聪明 地在MP3搜索上做了一个小伎俩,使得只有中国地用户才能正常使用百度的音乐搜索。你的IP地址变成国外的IP地址,这时候再上百度搜索一下,你会发现搜 索不到任何歌曲。百度就是这样干的。

国内国外两种面孔。这就是百度。

一个提供违法内容的网站,您觉得它有前途吗?

我是不相信的。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据