wordpress 3.0.1开启多用户功能的具体操作方法步骤 (Warning: An existing WordPress network was detected./wp-config.php配置“above the line reading /* That’s all, stop editing! Happy blogging. */:”)

wordpress 3.0版本整合了多用户功能,但没有默认启用,需要手工配置。3.0刚出来时看控制板里没有启用多用户的选项,就没有查询启用方式。今天——其实是昨天了——比较无聊,想起这茬儿,于是查一个具体怎么启用。

在一个专用于测试的wordpress上操作,该wordpress已经升级到3.0.1,并安装有2.9.x的汉化包(3.0以来没有中文汉化出来,因此有一部分文字显示为英文)。没有启用“固定链接”(伪静态)。

google一下,很多篇相关文章,多数都是从这里转载的
http://www.bokezhuanqian.com/how-to-open-multi-user-in-wordpress-3-0/
讲很很清楚,照着操作。很显然,最主要的操作是第一步
wp-config.php文件,在末尾添加define(‘WP_ALLOW_MULTISITE’, ‘true’);
下面两步顺利进行,接下来的第4步
Network Title站点名称,点击过install后,出现一大篇英文大致如下

-------------------------------------------------------------start-------

Create a Network of WordPress Sites

1. Create a blogs.dir directory in /home/xxx/html/xxx/wp-content. This directory is used to stored uploaded media for your additional sites and must be writeable by the web server.
2. Add the following to your wp-config.php file in /home/xxx/html/xxx/ above the line reading /* That’s all, stop editing! Happy blogging. */:

define( 'MULTISITE', true );
define( 'SUBDOMAIN_INSTALL', false );
$base = '/';
define( 'DOMAIN_CURRENT_SITE', 'www.path8.net' );
define( 'PATH_CURRENT_SITE', '/' );
define( 'SITE_ID_CURRENT_SITE', 1 );
define( 'BLOG_ID_CURRENT_SITE', 1 );

3. Add the following to your .htaccess file in /home/xxx/html/xxx/, replacing other WordPress rules:

RewriteEngine On
RewriteBase /
RewriteRule ^index.php$ - [L]

# uploaded files
RewriteRule ^([_0-9a-zA-Z-]+/)?files/(.+) wp-includes/ms-files.php?file=$2 [L]

# add a trailing slash to /wp-admin
RewriteRule ^([_0-9a-zA-Z-]+/)?wp-admin$ $1wp-admin/ [R=301,L]

RewriteCond %{REQUEST_FILENAME} -f [OR]
RewriteCond %{REQUEST_FILENAME} -d
RewriteRule ^ - [L]
RewriteRule  ^([_0-9a-zA-Z-]+/)?(wp-(content|admin|includes).*) $2 [L]
RewriteRule  ^([_0-9a-zA-Z-]+/)?(.*.php)$ $2 [L]
RewriteRule . index.php [L]

--------------------------------------------------------------end------

没有仔细看,新建文件夹,添加配置信息到wp-config.php文件末尾,修改.htaccess文件,重新登录进入后台页面,没有看到“奇迹就要发生”,跟之前完全一样,所不同的就是"工具- network" (Tools - network) 里面有警告信息,信息如下

----------------------------------------------------------------start----

Warning: An existing WordPress network was detected.

Please complete the configuration steps. To create a new network, you will need to empty or remove the network database tables.

Enabling the Network

Complete the following steps to enable the features for creating a network of sites.

..........(还是上面的那一大段英文)

--------------------------------------------------------------end------

把改个发动过的文件恢复为最初的备份,重试,还是一样的“Warning”;甚至删掉整个数据库,重装wordpress,也照样有错。感觉倍受打击,照着攻略操作都不对。

于是回来检查操作过程,再跟网上“前辈”们讲的不一样仔仔细细对照一下,看到有点不太一样的提示,这样的句:

Add the following to your wp-config.php file in /home/xxx/html/xxx/ above the line reading /* That’s all, stop editing! Happy blogging. */:

意思就是要放到wp-config.php文件里“/* That’s all, stop editing! Happy blogging. */”这样一行上面,但找了N遍都没有找到这一句,翻译着看,也没有这样的一句,看来3.0.1在这方面改变了。只能抛开前辈们写的“攻略”,自己找解决方案。

提示消息是最有用的,在wp-config.php增加的配置语句,要放到某一行前面,above,放前面是不行的,但具体位置,找不到。看来如果在英文版里操作的话,应该很容易找到。或者死马当活马医了,wp-config.php文件并不长,靠前随便找个位置放进去试试看。

原本最前面是数据库配置,极端一点,放到数据库配置前面,如果不对再往后移。

修改上传,重新加载后台页面,哈,居然对了,在左侧栏里出现了“super admin”一栏!抓图留念。

------------------------------------------

下面是bokezhuanqian.com上的wordpress3.0开启多用户方法,备参考之用。

wordpress 3.0 怎么开启多用户?

刚刚兴冲冲的在后台寻找多用户的菜单,一直没找到,于是立马Google下,发现了方法,和大家分享一下!
PS:下列操作过程中请注意备份修改的文件。
1. 打开wp-config.php文件,在末尾添加define(‘WP_ALLOW_MULTISITE’, ‘true’);,然后上传至服务器,刷新后台界面,你会发现Tools菜单下多了个Networks选项。

2. 点击会出现如图右侧显示,在进行操作之前,你必须停用所有的插件。

3. 停用以后在点击NetWork菜单,就出现了如下的安装界面。点击可以查看大图

4. Network Title站点名称,Admin E-mail Address管理员邮箱,然后点击install。点击查看大图

这里需要在wp-content目录下创建一个名为blogs.dir的文件夹,用来存储其他子站上传的多媒体文件,同时必须将读写权限更改成0666 (-rw-rw-rw-)以确保该目录可写。

PS:再提醒一次,注意备份wp-config.php和.htaccess文件。
拷贝define( ‘MULTISITE’, true );这部分到你的wp-config.php文件中
define( ‘AUTH_SALT’, ‘+X-||odG>*b`%=D4>|)uuDvz4A^V+bsj$8B2~FV|(i%U Ei`Yn8k4&&v0p{)4.w.’ );
这部分是你的站点密钥,最好也拷贝到wp-config.php文件中,位置放在末尾就ok了。

5. 最后拷贝RewriteRule部分到你的.htaccess文件中。

OVER,现在退出帐户,重新登录一下吧~哈哈哈~奇迹就要发生!!!

发现Google已经收录。2分钟之前。

--------------------------------------------------------------
可以任意转载, 转载时请务必以超链接形式标明文章原始出处及此声明
本文地址:http://www.bokezhuanqian.com/how-to-open-multi-user-in-wordpress-3-0/

使用User-Agent伪造浏览器,谎称身份欺骗服务器/IE,FireFox,Opera,Maxthon,Chrome,Safari,iPhone

关于User-Agent,在此不多说,假定您已经熟悉http协议尤其是User-Agent,如果需要了解更多,请查看以下

User-agent 字串(客户端操作系统浏览器识别)

更多User-Agent资料

常见的浏览器伪造User-agent方法

IE浏览器修改User-agent,修改注册表

User-Agent在注册表的位置
[HKEY_LOCAL_MACHINESOFTWAREMicrosoftWindowsCurrentVersionInternet SettingsUser-AgentPost Platform] 下,新建字符串值,内容留空,名字为你想在 User-Agent 中加入的字符,这里以 “motorolarokre2″为例。修改注册表对应的 REG 文件如下:
Windows Registry Editor Version 5.00

[HKEY_LOCAL_MACHINESOFTWAREMicrosoftWindowsCurrentVersionInternet SettingsUser-AgentPost Platform]
“motorolarokre2″=”"

修改后重启IE浏览器即可。

IE的user-agent取值,下面是下列地址的组合+一些默认值
HKCUSoftwareMicrosoftWindowsCurrentVersionInternet SettingsUser-AgentPost Platform
HKLMSoftwareMicrosoftWindowsCurrentVersionInternet SettingsUser-AgentPost Platform
HKLMSoftwareMicrosoftWindowsCurrentVersionInternet Settings5.0User-AgentPost Platform

IE8的User-Agents:

IE8 on Windows Vista (兼容浏览)
Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; Trident/4.0)

IE8 on Windows Vista
Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.0; Trident/4.0)

IE8 on Windows 7
Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0)

64-bit IE on 64-bit Windows 7:
Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Win64; x64; Trident/4.0)

32-bit IE on 64-bit Windows 7:
Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; WOW64; Trident/4.0)

FireFox修改User-agent

方法1:

  1. 在地址栏输入“about:config”,按下回车进入设置菜单。
  2. 找到“general.useragent.override”,如果没有这一项,则点右键“新建”->“字符串”,输入这个字符串。
  3. 将其值设为自己想要的UserAgent。

方法2:

安装插件:User Agent Switcher

Opera修改User-agent

方法1:
1.工具栏“Tools”->“Preferences”->“Content”->“Advenced”,点击“Manage Site Preferences”按钮。
2.点击“Add”按钮,在弹出的窗口中“Site”填入“*”,“Network”选项卡中选择浏览器ID。各选项如下:

0 Default
1 Opera
2 Mozilla, Opera detectable
3 Internet Explorer, Opera detectable
4 Mozilla, Opera hidden
5 Internet Explorer, Opera hidden

方法2:
1.在地址栏输入“opera:config”,回车打开。
2.找到“User Agent”点开,里面的“Spoof UserAgent ID”设置想要的值,范围1-5,具体对应的ID同上。

Maxthon(遨游)修改User-agent

工具栏“工具”->“遨游设置中心”->“高级选项”,勾选“自定义 UserAgent 字符串”,下面写上自己的UserAgent记可。保存设置后重启Maxthon生效。

Chrome修改User-agent

  1. 方法一:启动时加上参数:--user-agent="你自己的UserAgent"
  2. 方法二:修改chrome.dll。把里面疑似UserAgent的字符串改为自己的。

Safari修改User-agent

  1. 1.菜单栏“Edit”->“Preferences”->“Advanced”,勾选“Show Develop menu in menu bar”。
  2. 2.菜单栏会多出一项“Develop”,通过里面的“User Agent”子菜单即可设置自己的UserAgent。

iPhone修改User-agent

把/System/Library/Frameworks/WebKit.framework/WebKit 文件中的Mozilla/5.0替换成其他UA,字符数不要超过“Mozilla/5.0”的长度。

有用的参考资料

需要伪造User-Agent,必需首选要知道各种浏览器的User-anent是什么,才能伪造,有个网站专门收集无数种浏览器的User-anget,其中绝大多数浏览器可能都没听说过,笔者也是一样,实在太令人震精了。

就是这个网站 User Agent String.Com 首页地址http://www.useragentstring.com/

可以直接访问这里,http://www.useragentstring.com/pages/useragentstring.php

[源于多处,综合编辑而来]

11日,教育部阳光高考网站公布了2010年中国大学“红黄绿牌”专业名单,希望能对高考考生的志愿填报有所帮助。

11日,教育部阳光高考网站公布了2010年中国大学“红黄绿牌”专业名单,希望能对高考考生的志愿填报有所帮助。

  教育部门表
示,该专业名单是根据麦可思对全国毕业生就业情况的调查得出的。由于失业量较大,就业率持续走低,本科和高职各有10个专业被亮“红牌”,被亮“黄牌”的
专业分别为8个和5个。“红牌”专业主要是指失业量较大,就业率持续走低,且薪资较低的专业中综合考虑的前几个专业,属于高失业风险型专业。“黄牌”专业
是指除红牌专业外,失业量也较大,就业率也持续走低,且薪资较低的专业。“绿牌”专业是指薪资、就业率持续走高,且失业量较低的专业,为需求增长型专业。

被亮“红牌”的本科专业(10个):动画法学生物技术生物科学与工程数学与应用数学体育教育生物工程计算机科学与技术英语国际经济与贸易

被亮“黄牌”的本科专业(8个):美术学艺术设计统计学电子信息科学与技术公共事业管理信息管理与信息系统工商管理汉语言文学

被亮“绿牌”的本科专业(9个):地质工程港口航道与海岸工程船舶与海洋工程石油工程采矿工程油气储运工程矿物加工工程过程装备与控制工程水文与水资源工程

 

被亮“红牌”的高职专业(10个):临床医学法律文秘计算机科学与技术国际金融工商管理经济管理法律事务汉语言文学教育计算机应用技术电子商务

被亮“黄牌”的高职专业(5个):计算机网络技术计算机信息管理物流管理商务英语会计电算化

被亮“绿牌”的高职专业(5个):道路桥梁工程技术生产过程自动化技术应用化工技术焊接技术及自动化楼宇智能化工程技术

来自:http://blog.renren.com/GetEntry.do?id=466493388&owner=248576784

[转]维基百科wikipedia网站为何众多志愿者

http://www.wikipedia.org/

http://zh.wikipedia.org/zh-cn/

http://en.wikipedia.org/wiki/Main_Page

外国维基百科网站为何众多志愿者?

时间:2008-12-30 17:34:17来源:周新宁博客 作者:周新宁
世界上最受欢迎的五大网站之一维基百科,其创始人威尔斯写信寻捐助引发了大众对网站破产忧虑。面临经济危机的情况,维基百科寻求捐款由威尔斯亲自执笔请求 用户捐款还属首次。登录中文界面的维基百科,你可以看到赫然写着:維基百科,令生活更便利,下面显示着目前捐款的数额,和目標捐款金 额:6,000,000美元,到笔者登录该站的时候该站已经募集到资金:4,558,322美元。面对维基百科网站的举动,周新宁感到好奇和震撼的不是他们通过募捐来养活网站的方式感到惊讶,而是这样的网站得到了全世界众多的人认可和志愿者的参与,可 谓少之又少。本人并不认为维基百科会在寒冬中破产,既然维基百科在全球拥有逾15万名志愿者,那么其中让人震惊的不是会不会破产问题,而是这样不参与任何 商业形式广告的网站,能够很发展壮大并且活了下来,简直是一种运作奇迹。维基百科网站服务的核心是为全球用户提供免费信息,内容包括人物,人文,历史,社 科,社会,地理,自然,科学,技術等等。在过去8年的时间里,志愿者使用265种语言,编写了1100万篇文章。每月有超过2.75亿人登录网站以获取信 息,网站的信息全部免费,网民可以在这个站上获取免费的午餐不用支付任何费用,而且维基百科没有任何广告。让人们不敢相信的是只有员工23人的网站,不设 置任何盈利模式,没有任何广告,以致搜索巨头Google在和威尔斯接触,希望能够提供上下文广告,但是威尔斯在信中明确对广告模式表示拒绝。

维基百科是一个自由、免费、内容开放的百科全书协作计划,参与者来自世界各地。其开源让访客活跃了网站,这意味着任何人都可以编辑维基百科中的任何文章及 条目。中文维基百科于2002年10月24日正式成立,截至2008年4月4日,中文维基百科已拥有171,446个条目,此外还设有其他独立运作的中文 方言版本,包括闽南语维基百科、粤语维基百科、文言文维基百科、吴语维基百科、闽东语维基百科及客家语维基百科等。这个网站拥有全世界多个国家语言的网 站,遍布全球,参与志愿者,规模之大,令人刮目相看。

在英文维基百科页面加入创始人吉米•威尔斯募集捐款的信之后,维基媒体基金会在短短一天之内收到的捐款暴涨892%,达到28.3万美元,不得不承认其影 响力已经超越了国界,无论哪个国家都有其粉丝支持,这样的网站若在中国,未必就能活下去。维基百科得到了众多人的肯定,认为其代表着互联网一种无私精神, 维基一直是中立,导致众多人都支持它! 用网友的话结束本文或许带着一定的真理:维基百科帮我了解更真实的历史,真正的知识是用钱买不来的。(作者:周新宁)

UNIX发展史(BSD,GNU,linux)

先前的一個理想

UNIX 系统自 1969 年 Ken ThompsonKen Thompson 与 Dennis RitchieDennis Ritchie 在美国贝尔电话实验室(Bell Telephone Laboratories)发展出雏形至今,已历经近 30 来年。而 "UNIX" 这个字典上查不到其原意的怪字,其实是戏谑 MULTICS(MULTiplexed Information and Computing System)操作系统的大而无当所产生的 谐音字。

在 1957 年 10 月,前苏联发射了第一枚人造卫星,此举让当时的美国总统艾森 豪威尔决定投下巨额的经费用以支持及发展科学,美国高等研究计划署(ARPA, Advanced Research Projects Agency)便是在这个时空下设立了,该单位负 责推动系统发展等相关计划,成为当时美国电子计算器发展的重要推手。

1960 年代是大型计算机的发展年代,当时的麻省理工学院因最先实现了兼容分 时系统(CTSS, Compatible Time-Sharing System),在电子计算器领域享有 相当崇高的地位。1963 年,麻省理工的里克莱德(J. C. R. Licklider, 1915~1990)推动了 MAC 计划,MAC 以 IBM 的大型计算机做为主体,连接了 将近 160 台终端机,这些终端机就四散在学区以及教职员的家中,可以让 30 位 使用者同时共享计算机资源。这项计划到了 1965 年便不堪负荷,于是麻省理工 便决定开发更大型的分时计算机系统。新的计划便是 -- MULTICS。一个计算机 史上最为庞大的分时计算机系统,企图连接 1000 部终端机,支持 300 位使用 者同时上线的分时计算机系统。她面临的是,操作系统的分时观念还在各学术与 研究机构探索成形中,计算机硬件亦需重新设计的双重挑战。

当时,麻省理工原本找 IBM 来配合这项计划,但 IBM 正忙着应付自己的问题而 无意配合 MULTICS 计划。此时,通用电子公司(General Electric Company)也就是奇异公司正好在发展自己的大型主机,见机不可失,便极力邀 请麻省理工参予她们的 GE 645 大型主机的规格制定。有了奇异热心主动的计算 机硬件配合,麻省理工找上的不能贩售计算机却人才济济的贝尔电话实验室来负 责承包软件工程。于是乎,MULTICS 的计划便在 1965 年由麻省理工学院、奇 异公司及贝尔电话实验室这三个成员开始共同发展。

1969 年,MULTICS 计划在历经四年的奋战后,仍旧未达到原先规划设计的理 想,贝尔电话实验室决定退出计划。功能未达原始设计理想的 MULTICS 还是安 装在奇异公司的 GE 645 大型计算机上供麻省理工使用。奇异公司在该计划草草 结束后不到一年便完全淡出大型计算机市场。日后,MULTICS 计划被嘲解为 Many Unnecessarily Large Table In Core Simultaneously。

农 夫我个人认为, MULTICS 计划诞生在大型计算机将开始鼎沸的 1965 年,夭 折于大型计算机最为辉煌的 1969 年。她如果适时在 1960 年代末期成功的话, 绝对可以助长当时已经普遍被计算机权威人士视为理想的『计算机公用事业』, 至少可以让大型计算机的发展与资源集中的应用模式就不至于会在 1970 年代初 期就迅速萎缩。因为 MULTICS 计划如果成功,至少能让当时的大型计算机的应 用规模大上 10 倍左右。然而,MULTICS 计划失败了。她严重地打击了当时依赖 大型计算机主机的计算机公用事业业者在发展上的信心。更由于没有相似的计划 后继进行,使得集中式的大型计算机主机没有明显的 使用效能提升,而加速催化 计算器工业的转变,以寻找新的道路。另一方面,MULTICS 计划失败的经验亦让 当时参与该计划的软件工程师们得到相当宝贵的经验与正面的影响。

几年后,就在 AT&T,MULTICS 计划这个不同凡响的失败换来的一个不同凡响的 成功。一个戏谑她的名字诞生了 .... UNIX。

一个游戏的开始

1969 年贝尔实验室的计算器科学研究中心(Computing Science Research Center)成员退出 MULTICS 计划的同时,贝尔实验室本身其实也没有一套完善 便利的交谈式计算器服务环境。在其中不少工程师们也正为了改善程序设计环境 努力着, Ken Thompson、Dennis Ritchie 和其同事们在当时草拟一个新的档 案系统架构,这个档案系统也就是早期的 UNIX 操作系统的档案系统的前身。当 时的 Ken Thompson 忙着使用 Fortran 语言将原本在 Multics 系统中开发的 game 叫 "Space Travel"(太空旅游)转移到 GECOS System 上开发。当 时 GECOS System 大型计算机的 CPU Time 相当昂贵(一秒要 75 块美 金),同时控制 "spaceship"(宇宙飞船)的效果不甚理想,于是 Ken Thompson 不得不寻找替代的开发环境。Thompson 看上了一台很少被人使用 的 Digital Equipment Corporation PDP-7 迷你计算机,当时 PDP-7 使用的 是 Graphic-II 显示器,具有不错的图形处理能力。Brian kernighan于是 Ken Thompson 便与 Dennis Ritchie 连手将程序设计转移到 PDP-7 型计算机上。 Ken Thompson 在移转工作环境的同时为了得到较好的发展环境,便与 Dennis Ritchie 共同动手设计一套包含 File System、Process Subsystem 及一小组 Utility 的操作系统,当时这套系统仅能支持 2 个使用者使用。由于贝尔 实验室对于 MULTICS 计划失败的阴霾还未消散, Brian Kernighan 这位仁兄 开玩笑地戏称这套新的操作系统为 UNiplexed Information and Computing System,缩写为 UNICS,之后大家取谐音便叫她为 "UNIX",没想到这个开玩 笑的名字会被人叫到今天。

初期的自由发展

事实上该套 "UNIX" 系统在当时仅是私下的被使用,也并没有得到多大的重视, 一直到 1971 年的一个正式的计划,UNIX 才正式被搬上台面。

PDP-11/201970 年,当时贝尔实验室的专利部门(Patent department)缺 乏一套文书处理系统,为了设计开发的需要,于是买了一台 PDP-11 计算机。当 时 PDP-11 计算机的交机过程并不顺利,处理器先到,硬盘则多等了好几个月。 当 PDP-11 一切准备妥当后,他们便将 UNIX 移植到拥有 512K bytes 硬盘的 PDP-11/20 型计算机上,并在此系统之下开发了一套文书处理工具。而这套工具 便是后来 nroff / troff 的前身。那时的 UNIX 提供 16K bytes 给系统、8K bytes 给使用程序,档案最大的极限是 64K bytes。而此套含有文书处理工具的 系统,也正式获得贝尔实验室的专利部门采用,系统名称并被编为 "First Edition"。在 UNIX 移植成功后 Thompson 用 B 语言为它添加了 Fortran Compiler,但因为 B 语言属于一种解译语言(interpretive language),执 行成效并不是很好,于是 Ritchie 又将它 -- Compiler 发展成可产生机器码、允 许定义数据形态及结构, Ritchie 称它为 C 语言。1973 年并以 C 语言改写全部 UNIX 原始程序,UNIX 于是首度出现正式版本--V5 (第五版)。

此时的 UNIX 慢慢地在贝尔实验室内部蔓延开来,装机数也变成了 25 部之多。 由于当时的贝尔实验室实际上是掌控在美国电信电话公司(AT&T)及其子公司西 方电器公司的手上,实验室主要是负责研究改进西方电器公司制造的和美国电信 电话公司在贝尔系统中使用的电信设备。同时根据军方合同,从事与国防有关的 研究与改进的工作。而 AT&T 本身由于有反托拉斯法的限制并不能从事于任何有 关计算机方面的销售,所以 AT&T 的主管阶层们对于当时 UNIX 的发展并没有太 多的支持,因而当时贝尔实验室内部对于 UNIX 的发展并不是相当在意也无意于 将之推广。不过为了应付实验室内各部门日益增加的 UNIX 使用者与相关技术支 持需求,还是成立了 UNIX System Group(简称 USG)。但该组织也仅只是 提供技术上的支持,并未赋予继续发展的任务。所以当时的 UNIX 发展,全靠 AT&T 的工程师们的努力。这段期间 UNIX 的发展完全没有组织及系统性可言, 而玩家尽是一些工程师们,于是乎种下了 UNIX 日后较难以被一般人所接受的命 运。

走出贝尔实验室

1974 年 Thompson 与 Ritchie 共同在 Communications of the ACM 发表 了一篇 UNIX 论文 "UNIX Time-Sharing System" 得到相当大的回响。 1975 年 UNIX 发表第六版(V6)﹐其提供的强大功能更胜过当时昂贵大计算机的操作 系统,其最大特点是以高级语言写成,仅需要做少部份程序的修改便可移植到不 同的计算机平台上。 UNIX V6 版本并附有完整的程序原始码在 1976 年正式从 贝尔实验室内部传播到各大学及研究机构,UC Berkeley 也就是依据这个版本开 始研究并加以发展,并在 1977 年发表 1 BSD(1st Berkeley Software Distribution)版本的 UNIX OS,其后续的发展更为 UNIX OS 贡献良多且影响 深远,此点稍后再为你说明。同年 UNIX 因它提供良好程序发展环境、网络传输 服务与及时服务 (Real-Time Services),而广得各电话公司采用。Interactive System Corporation 更因 Value Added Reseller (VAR) 运用 UNIX 来强化 办公室自动化环境,成为第一家应用 UNIX 操作系统的公司。此年 UNIX 亦被修 改并第一次装到 Interdata 8/32 型计算机上。这也是 UNIX 操作系统首次安装 在非 PDP 型的计算机上。自此 UNIX 系统开始被移植改装到各型微处理机及新 计算机上

一个稳定的基石

1978 年 UNIX 发表对今日影响最重大的 UNIX 第七版(UNIX Time-Sharing System,Seventh Edition)也就是 V7。此版本包含 Fortran 77 compiler、Shell(只有Bourne Shell)、文件处理工具(nroff/troff、roff、 MS mocro等)、UNIX-to-UNIX-file-Copy(用来支持两台 UNIX 机器间的档 案传输)、数据处理工具(AWK、SED 等强悍的工具)、除错工具(ADB)、程 序发展工具(MAKE)、Lexical analyzer generator(LEX、YACC 等)、简 单的绘图工具、并支持 C 语言及 LINT verifier,主要执行于 PDP-11 及 Interdata 8/32 型计算机上。在当时那个年代来说其系统的架构与功能已经是 相当的完备的了。Bourne Shell 的原作者称她为 "improvement over all preceding and following Unices",在今日也有人称这个版本是 "last true Unix"。由此可见 V7 在 UNIX 发展里程上的扮演了相当重要的盘石角色。

在当时 DEC 公司推出了一款 32-bit supermini 主机 -- VAX,搭配的 VAX 的 操作系统叫做 VMS。这款迷你级计算机的硬件无可挑剔〈直到今日她的稳定度仍 是被诸多老一辈的系统管理者所赞许的〉,但 DEC 对 VMS 操作系统的支持性却 让贝尔实验室的工程师们宁愿使用 UNIX OS 。而这项工作则是由 John Reiser 和 Tom London 所共同完成。他们以 V7 为基础转移 UNIX OS 到 VAX 计算 机上使用。这个版本被称为 UNIX V32。同时为了转移的方便性,他们把 32-bit 的 VAX 当成是大一点的 PDP-11(因为 DEC 的 PDF-11 型计算机是 16-bit), 同时为了执行的效率,V32 放弃使用 VAX 硬件提供的一项 paging 功能(DEC 的 VMS OS 有支持 paging 功能,也由于 V32 舍弃这项功能,所以 V32 没有 虚拟内存的功能)。即使是如此,V32 支持的地址已高达 4Gb。就这样没有支持 paging 功能的 V32 开始被广泛的安装在 VAX 的机器上运作。

DEC 则是在 1984 年左右推出来自己的 UNIX OS,叫做 ULTRIX。

一个重要的延续及发展 -- BSD UNIX

时间回到 1973 年 11 月, Ken Thompson 和 Dennis Ritchie 在印第安纳 Purdue 大学的一场操作系统原理的座谈会。会场上、坐着一位柏克莱大学 (U.C. Berkeley)教授,名字叫 Bob Fabry。当天的 K&R 所发表的 UNIX 立 刻引发 Bob Fabry 的极度兴趣。当时的柏克莱还是处在使用大型计算机主机、批 次执行程序的阶段,并没有像 UNIX 这样的交谈式作业环境。会后,他便决定将 UNIX 带回柏克莱。

于是柏克莱的计算器科学、数学与统计三个系所合买的一台 PDP-11/45,准备用 来迎接 UNIX。1974 年 1 月,Bell Labs 寄来了一卷 V4 的磁带,学生 Keith Standiford 便开始进行安装 V4 的工作。安装时 Standiford 碰到了问题,便转 向 Bell Labs 求援。人在新泽西州的 Thompson 便透过柏克莱这端速度只有 300-baud 的调制解调器在在线进行侦错。

在 UNIX 的发展史上,这是 Bell Labs 与 柏克莱的第一次接触。

完成除错后,V4 便顺利地在柏克莱这台新买的 PDP-11/45 计算机上工作了。当 时这台是三个系所合买的,计算器科学好不容易装上了 UNIX,却碰到数学与统计 系所要使用 DEC's RSTS system,所以在一阵协调后,UNIX 与 DEC's RSTS system 以 8:16 小时的比例分配,供三个系所轮流使用。一段时日后,具交谈 式功能的 UNIX 在效能上的表现得到绝多数学生们喜爱,纷纷将自己的计划转向 UNIX 的时段。而一天占了 16 个小时的批处理时段却乏人问津。

当时 Eugene Wong 与 Michael Stonebraker 教授,看上了 UNIX 提供的便 利性,便打算将他们的 INGRES 数据库计划重原先批处理的计算机环境转移到 UNIX 系统上面。在 1974 年,他们为这执行计划添购了一台新的 PDP-11/40 计算机,上面安装了 V5。这个计划也就是柏克莱的第一个将作业环境转移到 UNIX 的案子。UNIX 作业环境的需求,在柏克莱迅速地成长。为了应付需求, Michael Stonebraker 与 Bob Fabry 教授决定再申请购买两台 PDP-11/45。 1975 年初,DEC 推出 PDP-11/70,价格差不多等于两台 PDP-11/45,但功 能强过 PDP-11/45,所以他们便决定改购买一台 PDP-11/70。

这台机器引来了 Ken Thompson、碰上 Bill Joy 以及日后产生了 1BSD。她 就宛如是一块 UNIX 史上的地标,沿袭自 Bell Labs,竖立在柏克莱,承先启后 并开创新局。农夫个人认为,她应该被供在博物馆。

当这台机器在 1975 年终运达柏克莱时;同一时间,Thompson 受邀回母校(柏 克莱)当客座教授,科目就是 UNIX。Thompson 在校期间与 Jeff Schriebman 和 Bob Kridle 一起动手将新版的 V6 安装在 PDP-11/70。

Bill Joy1975 年,一位密执安州大学的毕业生来到了柏克莱,他的名字就是 Bill Joy。当时 Joy 和同学 Chuck Haley (tar 就是他写的)喜欢一起泡在计算机房里 面,Thompson 也时常插上一脚。他们成功地改善了 Pascal 的解译与侦错的能 力,同时还提升了解译与执行的速度。另外换装上 ADM-3 的屏幕后,他们觉得 ed 文字编辑指令并不合用;于是根据另外一个相似的 em 指令,发展了自己的 觉得满意的文字编辑工具,也就是指令 ex。

1976 年夏天,Thompson 结束了他的休假回到 Bell Labs。此时的 Joy 和 Haley 已经开始着手探索 UNIX kernal,甚至还做了一些修改。1977 年初, Joy 制作了一卷磁带,上头写着 "Berkeley Software Distribution.",这就是 1BSD。其中包含新的 Pascal compiler 与 ex 编辑器。

次年,来了几台新屏幕 -- ADM-3a,这种屏幕支持光标地址显示,Joy 在这种屏 幕上完成了有人爱不释手;有人恨之入骨的文字编辑器 -- vi。接着不久,Joy 便 发现一个问题,老旧的屏幕装备,还是会被用在其它的计算机上。为了支持上的 方便,Joy 针对此现象设计了一个接口,用来管理、支持不同的屏幕装备。这个 接口就是现在的 termcap。1978 年中,包含了功能加强的 Pascal 与 vi 及 termcap 的 "Second Berkeley Software Distribution," 也就是 2BSD, 迅速的取代了原先版本。1979 年,至少有 75 部 PDP-11 的机器上安装 2BSD 在运作着。自此在 DEC PDP-11 系列上执行的 BSD 版本便一直以 2.xBSD 作 为识别。由于 PDP-11 计算机实在相当长寿,持续到今日农夫我仍然在网络上发 现过关于 PDP 计算机的网站。似乎到今日它们仍旧在某些地方默默地工作着。 2.xBSD 最近的一次改版是在 1987 年,使用 4.3 BSD 为主架构改写,版本定 为 2.10 BSD。

在 BSD UNIX 中登场的重要功能当中,有一个直到今日仍然叫人又爱又恨的 指令 – vi。我接触过不少学习 UNIX OS 的人,大部分的人对 vi 的使用与掌握都 不算顺手,其中恨死这个指令的也大有人在,前些日子农夫我还看到某个网站公 开讨论起 vi 是否阻碍了 UNIX 的发展?实在夸张了一点!

Bill Joy 多次公开地说,他要是知道 vi 会如此受"欢迎"的话,他宁愿当初没有 写 vi 这只程序。不过 Bill Joy 也说过,当时他原本还想加入一项 Multiple Windows in vi 的功能,不过当他在写这部分程序的时候,磁带机坏了,所以 Bill 只好在没有备份的情况下继续工作,想不到"屋漏偏逢连夜雨",程序写到一 半,他使用的硬盘也跟着挂了。在无可挽救又没有备份磁带的情况下,Bill 宣告放 弃为 vi 增加 Multiple Windows 这项功能。事后 Bill 为前一版的 vi 写好使用说 明后就继续作其它的事。所以 vi 就长成今天那付德性。农夫我认为这或许是福不 是祸!搞不好当初要是连 Multiple Windows 这项功能一起发表的话,上头的图 可能就是遗照了。

当时有位 Richard Fateman 教授,原先使用一台 PDP-10 上进行着他的 Macsyma 研究计划。但他需要更大的内存地址来执行程序,所以在 1978 年 初,他看上了当时迪吉多新发表的 VAX-11/780。好不容易,他联合了其它的部 门才凑足购买 VAX 的经费。刚开始时,机器原本安装的是 VMS 操作系统。不过 别的成员要执行 UNIX 操作系统,于是 Fateman 安装上了 V32。但问题来了, V32 并不支持虚拟内存,Fateman 便找上了 Domenico Ferrari 教授,希望他 与他的研究小组能为 UNIX 加上这项功能。当时一位学生叫 Ozalp Babaoglu ,他想到了一些解决的方法似乎可行,但因为牵涉到 VAX 硬件与 UNIX kernal 的问题,于是他找上了 Joy 帮忙。就在只有一台 VAX 的状况下,他们努力奋战 着。1979 年 1 月,在 VAX 上支持虚拟内存的 UNIX 版本终于诞生,V32 从此 走入历史。紧接着 Peter Kessler 与 Marshall Kirk McKusick 为他加上了 Pascal;Joy 则动手将 2BSD 上的 ex、vi、C shell 等工具转移了过来。这个 版本就是 3BSD。一个首次支持虚拟内存、demand paging 和 page replacement 的 UNIX OS。

UNIX 与 DARPA 交会

1970 年代末,美国国防部先进研究计划机构(Defense Advanced Research Projects Agency -- 简称 DARPA)正在为 AI(Artificial Intelligence), VLSI 及计算器视觉等研究(vision research)找寻一个可共通作业的计算机环境。硬件 方面的首选是迪吉多的 VAX 主机。配合的操作系统是 VMS。这样的组合因拥有 相当接近 DARPA 需求的功能被列入优先的考量,但在 DARPA 与 DEC 商谈对 于 VMS 的支持事宜之后,DARPA 并没有得到满意的答案。这迫使他们考虑朝向 UNIX 发展。但当时 UNIX OS(指的就是32V) 搭配 VAX,最大的缺憾就是没有 支持虚拟内存;但此时已经有人克服了。

当时,Bob Fabry 教授写了一份建议书给 DARPA,建议他们以柏克莱支持虚拟 内存的 3BSD 为基础,发展成为计划所需。这份企划书引起了 DARPA 的高度兴 趣。随后 3BSD 也实际获得了 DARPA 相关计划成员们的良好风评,也因此最后 柏克莱大学打败了卡奈基梅隆大学与 BBN(Bolt Baranek & Newman, Inc.), 让 Bob Fabry 成功地获得了 DARPA 的资助合约。这份合约开始于 1980 年 4 月,为期 18 月。此后的 DARPA 便以 UNIX OS 为标准操作系统。Bob Fabry 教授在取得 DARPA 合约后,依约成立了一个支持机构,也就是 Computer Systems Research Group 简称 CSRG。Bob Fabry 找上了 Bill Joy 来负责 软件开发。Joy 迅速地以先前的 3BSD 为基础,整合新的功能。如 Job Contro l(作者是 Jim Kulp)、auto reboot、1K block file system。同时也整合入 Pascal compiler、Franz Lisp system、enhanced mail handling system。这就是在 1980 年所发表的 4BSD。没多久她便被安装在将近 500 台 VAX 上。

DARPA 采用了这个版本作为当时 DARPA 的标准 UNIX 操作系统。

树大招风,当时,有位在 Stanford Research Institute 的仁兄叫 David Kashtan,写了一份关于 VMS 与 BSD UNIX 在 VAX 上的执行效率评估。该份 报告指出 BSD UNIX 在效率上不如 VMS 来的好。Joy 知道这件事之后,花了不 到一个星期的时间,重新调整 UNIX kernal。然后也写了一份报告,证明他们的 BSD 在 VAX 上要比 VMS 优越多多。1981 年 6 月,这个 Joy 调整过的系统, 加上了 Robert Elz 写的 auto configuration,以 4.1BSD 的版本发表了。

当时的 DARPA 对柏克莱 4.1BSD 的表现相当满意,于是续签了两年的新约,金 额更是先前合约的 5 倍。其中有一半的金额用在资助柏克莱继续发展 BSD UNIX 。钱多的相对代价就是要求高。当时,DARPA 对 UNIX 的期望开出了明确的目 标;更迅速、更有效率的档案系统、支持程序可执行地址达 multi-gigabyte、提 供弹性的解译沟通能力、具整合支持网络能力。在此同时,为了达到计划的目 标,DARPA 成立的一个指导委员会;主要的成员有柏克莱的 Bob Fabry, Bill Joy, Sam Leffler、BBN 公司的 Alan Nemeth and Rob Gurwitz、贝尔实验 室的 Dennis Ritchie、史丹佛大学的 Keith Lantz、卡内基.梅伦大学 Rick Rashid、麻省理工学院 Bert Halstead、信息科学协会 Dan Lynch、DARPA 的 Duane Adams and Bob Baker 以及加州.洛杉矶大学的 Jerry Popek。

不久,Joy 便开始整合早先 BBN 的 Rob Gurwitz 所发表的 TCP/IP protocols,不过他对 BBN 这些程序的执行效率并不满意,于是 Joy 与 Sam Leffler 重新写的一版自己的程序。另外,并加入了一些支持网络的工具 rcp, rsh, rlogin, rwho。他们称她为 4.1aBSD,这个版本并没有正式发表,在 1982年 4 月开始供内部使用。虽是如此,在 4.2BSD 未正式发表之前,她还是 繁殖的到处都是。6 月,4.1aBSD kernal 加上了新完成的档案系统,版本更新 为 4.1bBSD。

rcp, rsh, rlogin, rwho 这群指令。因安全机制上的理由,逐渐被另一群新的 指令群所取代,新的指令群叫 SSH (Secure Shell)。SHH 相关网址(http: //www.ssh.org)。

1982 年的春季末,已厌倦了在柏克莱环境的 Bill Joy ,答应受邀加入当年刚创 办的 Sun Microsystems, Inc.,成为 SUN 的第四号创办人。那年的整个夏季 他就在两地奔走。之后他对修改中的弹性解译沟通机制及改写 UNIX kernal 到一 个段落之后,由 Leffler 接手了他的工作。由于合约期限的因素,Leffler 在 1983 年 4 月发表了 4.1cBSD ,提供给参予 DARPA 各项相关计划的成员试 用。6月,DARPA 的指导委员会第二次会议招开,验收与检讨最新版的 BSD 成 果。继续整合 UNIX 系统的 Leffler,在 1983 年 8 月,发表了 4.2BSD。她达 到了 DARPA 的预定的需求;足以应付 CAD/CAM 影像处理与 AI 研究的高速的 档案系统及扩展强化的虚拟内存功能;提供能分散处理的解译沟通机制;支持 56-Kbit 的 ARPA Internet 网络连结,以及 10-Mbit/s Ethernet 的局域网 络;还有经过重组架构已模块化的 kernal code ,提供更有效率的计算机平台移 植。

SUN 以生产 RISC 架构的工作站计算机为主,使用的正是以 BSD 为基础所的 UNIX OS。在当时以不逊色于大型计算机的多人多任务、具网络沟通功能的 UNIX OS、加上价格低廉的硬件(相对于 mini 级计算机而言),广获得工程界 的青睐,而 mini 级大计算机的命运自此注定开始逐渐式微。计算机软件的应用因 为有了网络于是也开始朝向 Client-Server 的架构发展。

1982 年,SUN 有了自己的操作系统 -- SunOS 1.0 -- 承袭自 4.1BSD。一 直到 1990 年 11 月,发表 SunOS 4.1.1 版同时冠上 Solaris 1.0 时,SUN 才算开始向 System V 版本靠拢。SunOS 4.1.1 可算是以 BSD 为主体再附加 上 System V 工具的 UNIX 混血儿。但这其实是个商业考量的过渡性做法(后文 会加以说明)。而 SunOS 4.1.x 版的字眼也仅延续到 1994 年的 SunOS 4.1.4 为止,她后继的版本是 Solaris 1.3。真正延续到今日的 Solaris 版本,则是始 于 1992 年 7 月的 Solaris 2.0(SUN OS 5.0)。

在商业有所成就的 SUN Microsystems 对 UNIX OS 的发展倒也做了些重大 贡献;如 1984 年发表的 NFS(Network File System)与其后在 1986 年发表的 PC-NFS。

商业化的不平坦历程 -- UNIX 版本的战争

UNIX 商业化实质上即意味着将产生各种独立化的 UNIX 版本,这点大概是最显 而易见的事实。如果以商品要具备独特性与独占性的利益来做考量的话,其实一 点也不意外。因此 UNIX 开始衍生的相当多的版本。这种现象,对使用者以开发 应用程序的厂商而言,已经造成了某成程度上困惑。然而,一种无所适从的无力 感其实才刚开始。

1984 年 1 月 1 日, AT&T 这个拥有 1495 亿美元资产、1,009,000 位员工的 庞大巨兽,终于被格林法官 (Harold H. Greene) 以反扥拉斯法 (antitrust) 强 制拆解成七家 RBOCs (Regional Bell Operating Companies) 。 AT&T 也 因而在一夕间解体成为区域性网络公司,从此失去了长途电话的垄断性地位。这 种时空的转变让 AT&T 对 UNIX 的态度有了 180 度的转变(其实,农夫我指的是 收费的态度)。

先前已经提过 70 年代初期的 AT&T,已经在长途电话市场上占有绝对垄断的优 势,因而被美国政府的限制不得涉足与从事计算机与其它行业,也正因而造就了 UNIX 发展初期的自由开放。直到 1979 年,AT&T 才宣布要将 UNIX 商业化的 计划。1981 年 11 月,AT&T 属下的 USG 发表了 System III。次年又更新为 System IV。稍后于 1983 年,AT&T 将 CRG, USG 合并成立了 UNIX System Development Lab. 一般简称为 USL,从其名称就不难清楚她将要扮 演的角色。该年 System V 上市了。此时 AT&T 发觉每次版本更新都得花不少宣 传费,实在不划算,所以决定在 System V 以后,名字就不再做变动了。1984 年,System V Release 2 发表,简称为 SVR2。在这个版本中,才终于看到 来自 BSD 版本的 Virtual memory 功能,农夫我不得不惊叹 AT&T 的稳健作 风。SVR3 则是到了 1986 年才发表,随后 1987 年又发表了 SVR3.2。

1987 年,在工作站市场上已占有一席之地的 SUN,找上了 AT&T,打算将 System V 与 BSD 这两大版本归为一统。1988 年初,双方更签订了合作合约, AT&T 取得 SUN 的一席董事,同时亦有权买下 SUN 百分之二十的股份。这项合 作计划,原本有机会整合当时版本纷乱的 UNIX OS。但那是理想。实际上这个计 划反而让 UNIX 族群里的其它成员恐慌万分,特别是 IBM、DEC、HP 这几个产 业龙头。为了抵制这项行动,他们组织了一个反对联盟。因此「开放软件基金 会」也就是 Open Software Foundation 简称 OSF 在 1988 年正式诞生;成 员除了前面的三巨头外,尚有多达三十几家计算机硬件制造厂商与系统咨询顾问 公司,也相继以行动投入到此反对的行列中。然而 AT&T 与 SUN 也不示弱地组 织了 UNIX International,也就是 UNIX 国际公司,成员数量虽然不比 OSF 阵营来的多,但如果她是 Intel、Toshiba、Unisys、Motorola、Fujitsu,这 几个大块头,那也是很够看头的。

企业自身的利益在现实世界里始终是以个体的考量为优先,所以这两大阵营始终 没能再达成任何共识,就连当时所制定的 UNIX 统一标准规格,严格来说也从不 曾被实现过。这种企业利益上的冲突与矛盾其实也存在于同一个阵营中不同的成 员之间。两大阵营对峙,可以说是 UNIX 有史以来最重大的产业冲突事件。由于 商业利益的政治考量大过技术问题的考量,也因此奠定了 UNIX 将继续分裂下去 的命运。 AT&T 在 1989 年发表了 SVR4,SUN 在日后也将她的 SunOS 4.1. 1 开始冠上 Solaris 的字眼,以行动靠拢 SVR4。OSF 则是在 1990 年发表了 OSF/1。UNIX 版本的问题因而更加混乱了。但有趣且可笑的是,开放系统 -- Open System,这个双方都标榜的理念与观念却因此在计算机产业界引起了回 响,这点倒是原先所始料未及的。

不久 AT&T 撤销了对 SUN 的投资,同一个阵营的成员彼此也因而劳燕分飞。 USL 在 1991 年正式转变了一家独立的商业公司。但 UNIX 在商业市场上的价值 却出现了变化...

让 UNIX 自由 -- Networking Release 2

自从 UNIX 走出贝尔实验室后,研究机构与学术界就扮演了继承与发展的双重角 色。在 1979 到 1984 年这段期间,UNIX 的拥有者 AT&T,对于学术界的授权 政策尚可用『大方』来形容;同时也对学术界做某种程度的资助与合作。当时的 学术界,得助于 AT&T 的大方授权与分享程序原始码,研习 UNIX 这个分时操作 系统开始在学术界蔚为一股风气,甚至可以说是一种潮流或一种流行。其中,像 柏克莱 BSD 对 UNIX 的贡献,就是一个公开的事实。但早期的 BSD 使用者,是 必需向 AT&T 支付授权金的。这点,从产业界资助学术界的角度来看是一点也不 值得惊讶的。因为资金的援助为了就是取得其成果。所以当时基于 AT&T 原始码 所发展的成果,均归属 AT&T 所有。也因而 AT&T 掌控了 UNIX 的所有权。到了 1984 年以后,AT&T 开始更积极地保护 UNIX 的原始码;AT&T 甚至还要求各 大学的使用人员签订保密条约,想藉此防堵 UNIX 的原始码从学术单位流出,以 影响到商业利益。

在 DARPA 资助柏克莱从事 BSD OS 发展的过程中,诞生了 TCP/IP 这项广泛影 响现今计算机与因特网的通讯协议。由于 DARPA 对于资助开发的软件项目有明 文规定接受资助者必须无条件地释出程序的原始码,所以 TCP/IP 的原始码与程 序的版权并不属于 AT&T 所有。这点在现今看来其意义是不凡的。也正因为有此 一条件,柏克莱的 CSRG(Computer System Research Group)因应 BSD Vendors 需求,在 1989 年 6 月发表了 Networking Release 1,她包含了 TCP/IP source code 以及一些工具,提供给当时正开始起步发展的个人计算机 制造业者使用。Networking Release 1 授权收费仅 1000 美元,而且不需要 T&T 的商业授权,取而代之的是柏克莱大学的开放式授权。

农夫我看柏克莱授权方式,几乎可以说是一种良心式授权方式,在实质的运用上 她完全没有限制。她允许原始码或执行档在任何情况下修改并且允许将修改后的 程序从事商业行为而无须任何回馈,当然也没有绝对要求开发者必须要释出原始 码。如果你改都不改地加以贩售,她也没有意见。但有一点不可违反的限制,就 是必须在衍生物的版权声明上提到柏克莱的贡献。这种做法在日后,也没有多少 改变,而这样的授权方式也成为了柏克莱的授权精神。

Keith Bostic由于 Networking Release 1 所得到的响应实在远超过 CSRG 成 员的预估。这个不算差的成果,让柏克莱的 CSRG 觉得有必要释出更多属于 BSD 的程序原始码。于是激发 CSRG 的成员 Keith Bostic 开始组织志愿工作者从事 一项就算不能够惊天也足以动地的程序写作计划。计划的主要目的在当时还真让 人感到有点"乌扥邦"。农夫我个人喜欢戏称她为『解放 UNIX 计划』。

Marshall Kirk McKusick这项计划大体上分成两个部分,操作系统工具(Utility) 与核心(kernal)。而且参与人员必须在完全没有参考 AT&T UNIX source code 的情况下进行撰写程序的工作。因为只有在这种条件下,写出来的程序代码,才 能摆脱 AT&T 的著作权束缚。当然这也绝对不是一件容易的事。Keith Bostic 四 处奔走,组织了超过四百名热心的软件工程师,经过了长达十八个月的奋战之 后,操作系统主要的工具与链接库才算改写完成。Marshall Kirk McKusick 负责 改写当时的核心程序。但系统核心的部分,由于长期以来柏克莱与 AT&T 一直就 彼此分享 UNIX 原始码,所以各自所加上去的程序代码早已混杂难分了。为了彻 底的厘清双方各自撰写的部分,他们下决心进行逐行比对。首先花了好几个月的 时间,将核心程序每一行每一个档案都建立转换比对的数据库。然后接着进行移 除来自 AT&T 32V 的程序代码并改写她们。即使是如此,仍旧有 6 只程序让他们 束手无策,因而无法将核心程序彻底完整地改写。最后,他们还是决定将他们所 做的所有成果发表。授权的方式沿用 Networking Release 1 的授权方式,授 权的磁带依旧是 1000 美金。这个版本就是 Networking Release 2,也有人 称她为 4.3BSD NET/2。发表的时间在 1991 年 6 月。虽然这是个不完整的操 作系统。但,在今日看来,却有着划时代的意义 -- UNIX OS 自由了。

谁是"老大哥" -- 侵权诉讼

AT&T 的 USL 在 1991 年正式转变了一家公司。当然,这意味着她将更重视 UNIX 在商业上的利益。当时的 UNIX OS 早以称霸高阶的计算机市场;从 Cray 超级计算机、IBM 的大型计算机主机、迷你级计算机到工作站,均是 UNIX 的天 下(这一点,直到现在21世纪,仍旧没有多大的改变)。即使在 80 年代中期后开 始迅速发展的个人计算机,虽然当时被戏称为是玩具计算机,但也仍旧有像 XENIX[注1], Interactive UNIX[注2] 等几种向 AT&T 缴过税的商业化版本。 UNIX 简直就是 AT&T 的一棵摇钱树。

但这一切在 Networking Release 2(以后简写为 Net/2)出现之后,起了变化!

首先,一位 i386 处理器的玩家名叫 Bill Jolitz,在拿到 Net/2 之后,很快地就 将 Net/2 kernal 缺少的程序补齐了。BSD kernal 这时可算是大功告成了。当 时 Bill Jolitz 将他们放在因特网与其它人共享他的原始码,并且得到了不少正面 的响应。由于这个版本是使用在 i386 微处理器的个人计算机上,所以就命名为 386BSD,在 1992 年 2 月正式发表。这该算是 BSD 首度功能完整且版权独立 的版本。Bill Jolitz 是当时唯一的 kernal 维护者。在他离开这个计划之后,继起 的 BSD 玩家们延续了这个版本,日后衍生了 FreeBSD,然后又从其中分支出裂 NetBSD 版本。

另一个将 Net/2 完整化的是一家叫 Berkeley Software Design, Incorporated 的公司,简称 BSDI[注3]。由于 Net/2 的版权声明中,宣称其 源文件的合法性,并且允许使用者,从事衍生物的商业行为,所以 BSDI 将他们 修改后的系统命名为 BSD/386。他们并将成果打包,刊登广告以 995 美金的售 价贩售 BSD/386,而且含原始码,而且还提供免费服务电话的咨询,电号号码是 "1-800-ITS-Unix"。时间大约是在 1992 年 1 月。当时,USL 的 System V 含 source code 的价格大约是 BSD/386 价格的一百倍左右。这可惊动了老大 哥 AT&T。并且正式地书面严重警告 BSDI 违反的注册商标法(电话号码里有 Unix 的字眼),并公开宣称 AT&T 拥有 UNIX 的注册商标。BSDI 再次刊登广告 公开反击 AT&T,声明她的商业行为完全合法。果不期然, BSDI 的博命演出让 双方手牵手走上法庭。

AT&T 的 USL 控告 BSDI 剽窃他的 UNIX 原始码,要求法官还他公道。在听证 会上,BSDI 祭出早已准备好的法宝;自己在无任何 AT&T source code 的条件 下写出的合法档案,以及来自于 BSD 授权的 Net/2 source code。前面的证据 足以让 BSDI 立于不败之地,后者让 BSDI 置身在暴风圈外。BSDI 的辨证获得 了法官的采信。但 At&T 岂会就此罢手,他们将焦点转移到 Net/2 的 BSD 授权 上面,并且重新提出控诉,被告的对象变成了 BSDI 与柏克莱大学;同时 AT&T 还申请法庭禁止 BSDI 一切的 BSD/386 销售行为。就这样,柏克莱大学也对号 入座了。

农夫我认为,毕竟 AT&T 是营利企业,她得维护她的商业利益,这点是天经地 义的事。虽然柏克莱大学与 AT&T 在 UNIX 发展上有着非比寻常的关系,但商业 利益是现实的。企业资助学术界的研究计划,多半是基于商业上的考量;我相 信,学术界的少数高层在寻求奥援时不会不明白这一点,即使这有可能让大部分 的学术人士无法接受或不愿接受。不管如何,这一记醒棍倒再次挑起了这一点事 实。

成为被告的柏克莱大学,只好无奈地面对这场无情的商业诉讼。但他们也同样不 甘示弱地对 AT&T 的 Systerm V 著作权提出质疑,因为在 AT&T 的 UNIX 授权 声明中完全没有提及柏克莱的贡献。所以柏克莱反控 AT&T 违反 BSD 的授权条 款。柏克莱的反击让战况越演越烈,诉讼案一路从 AT&T 的老家新泽西州的联邦 法庭打到柏克莱大学的所在地加州法院,但依旧没有结果。

到了 1993 年,官司还在进行中,但 AT&T 却已经打包 USL 准备以一亿美元的 价格找寻买主了。最后 AT&T 将 USL 以八千万美元代价的卖给了 Novell。而新 买主也当仁不让地加入了这场混战。但却也因此,战况露出了一线平息的曙光。 诉讼案在 1994 年 1 月宣告终结,以庭外和解收场。实际的协议内容仅有当事人 知情。

如果从胜负的角度来看这场诉讼,或许柏克莱与 BSDI 是胜利的一方。但如果从 UNIX 发展的脚步来看这场诉讼,就可能根本没有任何一方是胜利者了。

事件平息后的 1994 年 6 月,柏克莱的 CSRG 风光地发表了 BSD 4.4 Lite。在 这个版本中,有 70 个档案引用的一份新修改的版权声明,阐述的 AT&T 与 BSD 双方的贡献,并明确地给予档案自由散播的权利。但不知为何,应该有能力完整 发表的 BSD 4.4 Lite 还是缺少了三的档案。当时,农夫我也很高兴地买了一本 BSD4.4-Lite CD-ROM Companion,含一张光盘,现在拿在手上,看来总觉得 有点呆。

掌握 UNIX source code 以及 UNIX 商标的 Novell,将 UNIX 商标交给 X/open 管理,自己则发展了一套命名为 UNIXWave 的操作系统。推出后市场 的反应并不热络。不久,Novell 与 SCO 接头,在 SCO 保证继续支持 UNIXWare 的条件下,UNIX 在 1995 年二次易主,新主人是 SCO[注4]。

备注: *1 Intel 在 1978 年发表 4.77 MHz 的 8086 微处理器。1980 年, Microsfot 便以 V7 为基础,发表了在微处理器(microprocessor-based computers)上执行的版本也就是 XENIX。到了 1982年,一家成立于 1979 年 的软件公司 Santa Cruz Operation,成为微软的合作开发厂商。之后她这家公 司便一直致力于这个领域里延续到今日,缩写就是今日的 SCO。

*2 Interactive IS/1 (以 V6 为主体)。这个版本后来演化为比较让人熟知的名 字 -- Interactive UNIX。后来因为 Sun Microsystems 致力发展 Solaris for X86,被财力雄厚的 Sun Microsystems 合并了,如今已经不见踪迹了。

*3 就在我反复修改这段文稿的时候,BSDI 这家公司已经被 Wind River 合并 了,改名为 iXsystems。2001/05/03

*4 2001 年 5 月 4 日,Caldera International, Inc. 正式并购了 SCO 的服 务器软件部及SCO专业服务部这两个部门,新的控股公司名为 Caldera, Inc

GNU 计划 -- 开启了新大道

在 1983 年 9 月 27 日,麻省理工学院人工智能实验室(MIT Artificial Intelligence Lab)的 Richard M. Stallman (以下简称为 RMS),在 net.unix-wizards 以及 net.usoft 的 newsgroups 贴上了一份标题为 "new UNIX implementation" 的讯息。这就是如今广为人知的 GNU 计划的开始 。在那则被视为「GNU 宣言」草稿的讯息中,RMS 阐述个人的理念与计划的目 的 -- 完成一个命名为 GNU 的 "Free UNIX" 操作系统,希望藉此寻唤理念想同 者共襄盛举。

『如果我喜欢一个程序的话,那我就应该分享给其它喜欢这个程序的人』,这是 RMS 的座右铭。此点也似乎正是促使其决心运作 GNU 计划的原动力。当时的 RMS 是想写出一套免费的操作系统。能够让每个人如空气般地自由的取得与使 用。选择“UNIX 兼容”为设计的主要原因是;RMS 表明,UNIX 并非他个人理想 中的操作系统;他仅阅读一些相关数据,但未曾使用过 (MIT 使用操作系统是 "ITS--Incompatible Timesharing System");但他认为 UNIX 操作系统具有 优良的本质特性。他相信如果 GUN 与 UNIX 兼容将更容易令人接受。所以 RMS 承袭 MIT 用递归缩写字命名的传统为 GNU 释译界定 Gnu is Not Unix。

1984 年 1 月,RMS 为了展开他的理想而决心离开已经待了十几年的 MIT AI Lab.。当他向他老板 Patrick Winston 辞职时,Winston 试图挽留地说:「你 还是要辞职?」。RMS 不为所动的回答:「是」。Winston 显然得到预料中的 答案,于是接着说出了思绪里关怀:「你想要保留你的钥匙吗?」。于是 RMS 就 从此开始专心地"失业"在他的老东家。一个人窝在他原来的旧办公室中,规划着 如何开始他的 GNU 计划。但想开发一套新的 UNIX 兼容的操作系统,即使是财 力、人力资源雄厚的顶级计算机公司,也绝对不是一件说想做就能够做到的事。 当拟妥他的「GNU 宣言」之后,他正式向全世界呼唤、表明其将所为。种子落地 了。

GNU 计划的第一只程序要算是孤军奋战的 RMS 在 1984 年 9 月开始撰写的 Emacs 编辑器。1985 年初,Emacs 已进入可用的阶段。于是 RMS 将她放在 pre.ai.mit.edu 这台机器的 FTP server 上,免费地让 amonymous 的到访者 自由下载使用。不久后,Emacs 强捍的功能引发了一些玩家们的注意,由于附上 了 source code,玩家们能自己动手为它添加新的功能或除错,很快地, Emacs 获得了相当热烈的回响。随着名声渐播,开始有人相继地加入 GNU 计划 的程序写作阵营。"此道不孤"让 RMS 倍感振奋与喜悦。

当时的因特网并未十分普及。所以有不少人虽然对 Emacs 程序有兴趣,却没办 法经由 FTP 的管道取得,因而有人透过其它管道向 RMS 询问能如何取得时,这 可让当时处在失业状态的 RMS 看到能够支持他继续奋战下去的资金来源--贩售" 自由软件"。

一个人、一个独立的个人,要想在现实中实行自己的理念,最先得接受"现实 "。唯有接收它是事实,实行理念的道路,才获得比较稳固的起点与开始。  -- 网络农夫如是说。

想着、写着,脑中突然掠过一丝感受(所以顺便记录在这个地方)。不管如何, RMS 真的开始以一卷磁带 150 块美金的代价,服务有需要的人。也因为基于这 个开始与基础,RMS 当年便创立了自由软件基金会 -- Free Software Foundation (以后简称为FSF)。这对 GNU 计划而言,意味着它已跨越个人化理 念的构思阶段,并进入了有群体组织化的运作阶段。同时,RMS 也制定出了属于 GNU 计划的软件版权。RMS 使用 "copyleft" 用来形容她,其实就是与著作版权 (copyright) "对立"之意。这也就是 GPL -- General Purpose License (通用 公共授权)。GNU 计划的种子,就这样生根发芽了。

从贩卖 GNU 自由软件扩展到其它的相关软件与参考手册,提供软件技术支持,并 接受计算机器材与资金的捐助(捐助者依法享有一定额度的减税),为企业代训软件 人才。FSF 努力地开辟财源却仍旧是运作资金捉襟见肘。RMS 本人并不支薪。而 FSF 聘请软件工程师的待遇,也仅是软件业界薪资水平的一半。但这绝不表示 GNU 计划的软件水准是半桶水。GCC 编译器是 GNU 计划在 1987 年 3 月开始 发表的免费编译器,当时的版本是 0.9 测试版。如今最新的版本则是 3.0。这个 编译器可以说是今日自由软件写作的基石。GCC 所解译的机器码,其可靠度绝对 不逊于商业化的编译器产品,甚至可以说是优越过商业编译器。

90 年代初,GNU 计划暨已完成了质量与数量均十分可观的系统工具。这些工具 被广泛的使用在当时各种工作站的 UNIX 系统上。虽然已有如此的成果,但仍称 不上是完整的操作系统。他们缺少一支属于自己的"核心程序(kernal)"。

UNIX 在 4.2BSD 之后,越写越大 kernal 开始带来一些不便与问题。因而当 时便开始有另一个写作理念逐渐在发展--微核心(microkernal)理念。

1985 年,卡内基大学(Carnegie Mellon University 简称 CMU)暨以 4.3BSD 为发展基础,将之一拆为二,分成 micro kernal 与 single server 两个部分。 该计划的名称为"Mach"。这个计划成了微核心发展的技术先河。GNU 原本有意 直接采用 "Mach" 计划的成果。但无奈,这一等,从80年代中等到了90年代 初,在几经商量之后,他们打算采用微核心的写法,成立自己的计划,名称叫 "Hurd"。这项计划,如今仍在奋战中,虽然 microkernal 的做法让他们吃了不 少苦头;但可喜的是,0.2, 0.3 测试版本已经发表。

直到 21 世纪的今日,RMS 依旧努力不懈地耕耘着他的梦土。尽管他本人认为还 尚未完全地实现他的「GNU 宣言」;但他执着于理念的行动,已凝聚了相当数量 的自由软件写作族群们,在这些人与群体的努力下,一条新的大道其实已经被开 拓出来了,她通往一个新的世界。大道旁,枝叶已然繁茂的树荫下,可口果实一 如礼物般地为所有的人成熟。人们称她 -- Linux。

新世代的焦点 -- Linux

1990 年代中期,因特网因出现 World Wide Web, HTML 这种新型态的应用, 而开始迅速的延烧全世界。一夕间,架设因特网主机的需求激增。这时有一套可 以免费取得,并且能让 x86 计算机升格成 UNIX 级主机的免费操作系统,开始了 吸引全世界目光。在传媒与计算机工程师们的竞相走告下成为了这个新世代的焦 点,这个新的名字就是 Linux。

Linus Benedict Torvalds当然,这套媒体吹捧的当红炸子鸡,可非一人之功, 一夕即成的。Linux 是一套版权彻彻底底与 AT&T 无关的 UNIX-like OS。原始 核心程序的创作者是芬兰籍的 Linus Benedict Torvalds(现今他仍旧是核心程 序的维护者)。操作系统里大部分的系统工具,来自于 RMS 行之多年的 GNU 计 划成果,以及其它的自由软件写作计划产生的软件,如 X Windows、KDE、 Gnome 等窗口接口。由于构成操作系统的主要部分均奉行 GPL 版权,所以市面 上有相当多样的安装套件,目前较广为人知的有 RedHat、Slackware、 SuSE、Debian GNU/Linux...。也因此,这套操作系统,可说是包含了无数字 自由软件写作者的共同心血。如此的一套操作系统其实也就是 RMS 多年来想要达 成的宿愿 -- "Free UNIX"。所以,RMS 本人总认为该将名称改做 "GNU/Linux"。因此,也有人用 GNU/Linux 来称呼这个操作系统。

Torvalds 打从十岁出头当他外公的"键盘手"开始,到了中学就已成了不折不扣的 计算机迷。1990 年,当他就读赫尔辛基大学(University of Helsinki)信息系二 年级,选修一门「C 语言与 UNIX 操作系统」的课程,因而疯狂地迷恋上了 UNIX 操作系统。那年正好赫尔辛基大学正好添购的一台 VAX,安装 Ultrix 操作 系统。连接了 16 台终端机供授课师生使用。有所限制的计算机资源,对一位计 算机迷来说是极痛苦忍受的。Torvalds 开始作梦想"搞"一套可以在自己计算机上 跑的 UNIX。

1991 年 1 月,Torvalds 利用 "学生贷款" 加上去年的 "耶诞红包",以分期付 款方式买了一台 386 DX33 个人计算机(他的第三台计算机)。他选择安装的操作 系统则是在学术界颇负盛名的 Minix[注5]。在几番奋战下,就绪运作的 Minix OS 功能性却多方面无法满足 Torvalds 的需求,因而激发了他重头来的欲念。于 是 Torvalds 在他的 386 DX33 上逐步探索并撰写出他自己的核心程序。他网络 上释放的第一个版本是 1991 年 9 月 17 日的 0.01 版。虽然她是个简陋的开 始,但由于 Torvalds 本人持续维护与网友回馈贡献,原本一个人所撰写的核心 程序竟在不知不觉中逐渐转化成 "虚拟团队" 的运作模式。

然而,一般计算机使用者,需要的是可安装运作的操作系统(农夫我习惯以"安装套 件"称之),而非单一的操作系统核心。当时英国的曼彻斯特电算中心 (Manchester Computer Center, 简称 MCC)便根据 0.12 版核心程序制作了 一套名为 MCC Imterin 的安装套件。随后各地的安装套件有如雨后春笋般地出 现;如美国德州 Dave Safford 的 TAMU(Texas A&M University)版、Martin Junius 的 MJ 版、Peter McDonald 的 SLS(Softlanding Linux Sustem)版 等非商业安装套件的出现。在安装需求日增的情况下,Linux 安装套件创造出了

一块新的需求市场。这一线商机,让非商业安装套件的也开始出现在商业市场 上。Slackware 大概可算是最早出现的商业安装套件了。到如今,商业与非商业 的安装套件则已多得数不清了。

随着使用人数激增,核心程序的版本与功能也开始加速演化,但仍不失于稳健。 1994 年 3 月 13 日,核心程序 1.0 正式发表。其安装套件在功能上的整合已急 起直追当时商业版的 UNIX OS。此时的 Linux OS 已拥有数十万名使用者。当 时赫尔辛基大学还以此为由举办了一场名为"Linux 首度正式发表会"。就在芬兰 电视台与众多传媒的郑重其事的报导下,Torvalds 成了芬兰人的自豪,Linux OS 宛如刚诞生的"超新星",闪闪发亮地展现在众人眼前。

早期的 Linux 核心程序曾被 Andrew Tanenbaum 指出,过度紧密地与 x86 处理器结合,所以他认为 Linux 核心程序将无法移植到别的处理器上。这点显然 与 UNIX OS 的可移植性大不相同。当时的情况的确是如此,这或多或少与 Torvalds 本人受限于拥有的硬件资源有关。但当 Linux 的使用族群拓展开来之 后,便开始有人主动地将她移植到不同的平台上。像 Dave Miller 即以不下于 Torvalds 狂热与学习精神将 Linux 成功地移植到 SUN 的 SPARC 工作站上。 此外如 Amiga、Atari、PowerPc、MIPS R4000 也陆续见到 Linux 的身影。 这些移植严格地从技术的角度来看,仅能说是"个案"。但这已激发 Torvalds 的 兴趣。真正撼动 Linux 核心的移植是对 Alpha 处理器。

1994 年 5 月,在 DEC 使用者协会上,Digital 的工程师 John Hall(外号 Maddog)碰上了 Torvalds,双方一见如故。Maddog 力劝 Torvalds 将 Linux 移植到 Alpha 芯片上,并主动提供了一台 Alpha 计算机供 Torvalds 研 究使用。当年可说是全世界最快的 64-bits Alpha 芯片是 DEC 引以为豪的一项 成就,其架构与功能均优越过同一时期的 Intel 32-bits 处理器。这种技术性的 挑战吸引了 Torvalds 的投入。这项移植,但这对原先以 x86 微处理器为写作基 础的 Linux 核心程序而言,实在不是一件小工程。在 Torvalds 与 DEC 相关人 员的将近一年奋战后,Linux 核心程序脱胎换骨,成功地移植到 Alpha 处理器上 (与 x86 处理器使用同一套程序代码)。1995 年 3 月,被戏谑是 Linux'95 的 1.2 版核心程序正式发表,支持 Intel x86、DEC Alpha、SUN SPARC、MIPS 等处理器。

1996 年 6 月,核心程序版本由 1.3 直接跃升为 2.0 版。Torvalds 本人正式钦 定了一只"企鹅"作为 Linux 的标志。同时也开始支持对称式多重处理器 (Symmetric Multi-Processing,简称 SMP)架构的计算机;而支持的处理器则 又多了 Motorola 68k 和 PowerPc。在自由软件团体们的努力与计算机产业业 界的支持投入之下,Linux 具备的功能逼近商业版 UNIX OS。当然,Linux 要达 到"成熟"与"稳定",实际上还有好长的一段路要走。

时至今日,散播在全球各地的 Linux 虚拟发展团体,仍旧持续地发展中。能维持 到什么时候?这在将来的历史自有答案。但至少在现今,一个 RMS 奋斗的目标 -- 可自由分享程序代码的操作系统,已可贵地呈现在我们的眼前。

备注: *5 Minix 是 Andrew Tanenbaum 教授为教学目的而撰写的操作系统。在教 育界可算是一套学习 UNIX 基础的好范本。

新文明世紀 自由共享

到此,这一段关于 UNIX 发展的文字,已从过去的历史当中走回到了今日 ... 21 世纪的今日。本文也接近尾声了。请诸位原谅农夫将以极为自身的历史感受,来 作为本文的结语。

阅读与探究历史,是农夫个人在年轻时即有的一点小癖好。通常我无法忍受对自 己喜好事物的缘由一无所知。所以我会想办法去探究她由谁所创、因何而生与发 展的沿革。也正因为如此,我才会为 UNIX 这个当初我没能在英文字典上找的怪 字,写了这么一篇文字。

然而在 UNIX 的发展过程当中,我惊讶地发现了一项有别于我探索 20 世纪历史 的东西。我相信诸君应该清楚,20 世纪是人类文明史上最为血腥残暴的一段岁 月。在其间,多数民族的上个世代所遭逢的苦难,都是空前的。哲学家柏林 (Isaiah Berlin)回顾 20 世纪的感受,说了以下这样的一段话。

「我的一生--我一定得这么说一句--经历了二十世纪,却不曾遭逢个人苦难。 然而在我的记忆之中,它却是西方史上最可怕的一个世纪。」

的确,每当我阅读 20 世纪的相关史料,我就更能加倍地感受到这份莫名的幸 运。我生长在台湾,这块回顾其历史仅能以"悲土"称之的岛上,她的苦难直至今 日亦尚未完全结束。尽管多数年轻的一代已然淡忘,来自何方,归往何处。身为 一个中国人,站立在这块似乎仍将被同胞武力相向的孤岛上....我已不清楚历史伤 口会因得到同胞的爱而痊愈,还是再次因人类残暴掠夺的天性而迸裂.........抱 歉,离题了.

我想说的是,在 20 世纪未的因特网时代中,我感受到了令人喜悦地,根源于 心、跨越既有疆界藩篱的自由共享文明。这相较于 20 世纪初将"战争"视作为文 明象征的人类而言,实属无价可贵的进展。即使这文明仍仅是刚播下的种子。但 我相信,她将如贝聿铭所言:

「你永无法明确知道你已播种的东西何时可以收割;或许只有一次收成,或许 可重复收成。你也许遗忘曾播种了些什么,一种经验,一种感受,与某人的关 系,抑或一种哲学及一项传统。然后,忽然间就开花了,被全然不同的环境所唤 醒。这种盛开可以冲破藩篱及整个时代。」

多希望亲眼看到,几个世代后的某日,人类彼此掠夺的行为如天花一般地在人类 社会中绝迹;而,共享已成为人类整体奉行的道德公理。如果这样的一个社会是 我们今日所企求的;那么,这个方向与希望,就值得你我花一生的精力去努力。 当然,这仅只是一个个人的希望,我也清楚这世间并非如此美好。但,如果因假 设一件事物不可能做到,而决定不去做;那是假设得到胜利,而非真实的事实。 或许过去的历史,曾经证实正义、公理、平等与理想的胜利,不过是短暂的昙花 一现;那又如何。只要我们不放弃希望,希望就有机会成为真实。今日,所有的 美好均因此得来,明日也是。

这几年来,我已看到不少因特网上诸君们的努力。我也相信这崭新文明的种子, 有朝一日将展现出令人赞叹、愉悦的美景。未来存在我们尚未发现的国度。我相 信,我们能发现未曾走过的通道,打开不曾打开的门,进入玫瑰园中.....那会是一 个崭新的文明。

網路農夫 2001/12/12 文定

linux简史(很老的一篇文章,可做参考)

1 混沌初开

那是在一九九一年,令人痛苦难耐的冷战渐渐走到了尽头。和平安详的空气开始升起在地平线。在计算科学领域,随着强大硬件的推出,计算机的极限能力已超出了我们的想象,一个辉煌的未来似乎已渐露端倪。

但还是缺了点儿什么。在操作系统领域,存在着一片巨大的空白。

一方面, DOS还统治着庞大的个人电脑王国。比尔-盖茨花$50,000从一个西雅图黑客手中买来DOS。之后,靠着聪明的市场策略,这个简陋的操作系统悄悄渗透到了世界的每一个角落。PC用户没有其它的选择。苹果机虽好,但它的天价没人能承受得起。它和大众需求保持着遥不可及的距离。

计算领域的另一个阵营是UNIX世界。但 UNIX更是贵不可攀。为了追求高额利润,UNIX销售商把价码抬得足以吓跑随便哪个PC用户。贝尔实验室曾慷慨地提供UNIX的源代码给大学。但现在, 这些源代码被小心地看管起来,不再对外公开。更令全球PC用户心烦的是,软件市场的大玩家们没能为这一问题提供个有效的解决方案。

MINIX似乎是个选择。它是在荷兰当教授的美国人Andrew S.Tanenbaum从 零开始编写出来的。MINIX的初衷是为了向学生讲授操作系统的内部工作原理。MINIX的设计是面向当时最为流行的Intel8086微处理器。作为一 个操作系统,MINIX算不上一流。但它的好处是你能得到它的源代码。只要你有Tanenbaum写的《操作系统:设计与实现》这本书,你就能得到那 12,000行用C和汇编写的源码。头一次,程序员或黑客可以有机会读一读操作系统的源码–这种被软件商严加看管的东西。Tanenbaum用详尽简洁的 笔触探讨了编写操作系统的艺术。他是个一流的作者,迷住了一批当时计算机领域最聪明的大脑。全世界学计算机的学生都在钻研这本书,通过读它的源码来了解他 们电脑里运行的MINIX操作系统。

Linus Torvalds就是这些学生中的一个。

2 呱呱坠地

在1991年, Linus Benedict Torvalds还是个芬兰学生,在赫尔辛基大学念 计算机专业二年级。同时他也是个自学成才的黑客。这个长着沙滩黄头发,说话软绵绵的二十一岁芬兰帅哥喜欢折腾他的电脑,把它不断推向能力的极限。但他缺少 一个合适的操作系统来满足他如此专业的需求。MINIX不错,可它只适合学生,是个教学工具,而不是一个强大的实战系统。

当时,全世界的程序虫们都很看好Richard StallmanGNU项目—一个致力于推出自由、高质量软件的运动。在计算科学的王国里,Stallman是个倍受尊崇的神话式英雄。他令人景仰的职业生涯是从大名鼎鼎的MIT人工智能实验室开始的。

七十年代中后期,他在那里开发出了著名的Emacs编 辑器。八十年代早期,商业软件公司从人工智能实验室吸引走了绝大多数优秀的程序员,并和他们签署了严格的保密合同。Stallman为此大大不爽。他认为 软件和其它产品不同,在复制和修改方面它不该受到任何限制。只有这样,才能开发出更好更强的软件。1983年,他在著名的《GNU宣言》中,向世人宣告了 GNU项目的启动,开始了贯彻其哲学的自由软件运动(顺带一句,GNU一词是‘GNU's Not Unix’的递归缩写)。 为了最终实现开发出一个自由操作系统的梦想,他得先制造些工具。于是,在1984年初,Stallman开始创作一个令商业企业程序员叹服的作品-GNU C编译器(gcc)。他出神入化的技术天才,令所有商业软件程序员自愧不如。gcc被公认为世界上最高效最强健的编译器之一。

./figs/stallman.png

Richard Stallman,GNU项目的创始人

到1991年,GNU项目已经开发出了众多的工具软件。大家期待已久的GNU C编译器也问世了。但自由操作系统还没有出现。MINIX也是受版权约束的(后来,在2000年4月,Tanenbaum在BSD许可证下发布了自由的 MINIX)。GNU操作系统内核-HURD-还在开发之中,几年之内还不可能面世。

拖了这么久,终于该说说Linus了。

1991年8月25号,Linus在MINIX新闻组发出了历史性的一贴…

From: torvalds@klaava.Helsinki.FI (Linus Benedict Torvalds)
Newsgroups: comp.os.minix
Subject: What would you like to see most in minix?
Summary: small poll for my new operating system
Message-ID: <1991Aug25.205708.9541@klaava.Helsinki.FI>
Date: 25 Aug 91 20:57:08 GMT
Organization: University of Helsinki

Hello,各位使用minix的朋友,

我正在写一个基于386(486)AT机器的(自由)操作系统(只是出于爱好,不会做得象gnu那么大、那么专业)。 我从四月份开始酝酿,现在已经做得差不多了。我现在想知道一些你们对minix的看法,它哪点好?哪点不好? 因为我这个操作系统和minix多少有点儿类似(文件系统采用同样的物理布局(因现实原因), 其它方面也有类似的地方)。我已经把bash(1.08)和gcc(1.40)移植过来了,而且它们运转正常。 这意味着在下面几个月里,我将给它加上更多实际的功能。所以我想知道大家都希望它有哪些功能。 欢迎多提建议,但我不敢保证能实现你的建议 :-)

Linus (torvalds@kruuna.helsinki.fi)

附:没错,它不包含任何minix的代码,而且它有一个多线程文件系统。 它现在不能在其它硬件上转(因为用了386任务切换机制,等等),而且除了AT硬盘, 它基本上不支持任何其它硬件。这就是全部了 :-(。

从这个帖子不难看出,Linus自己并没预料到他的小创造将会改变整个计算科学领域。1991年9月中旬,Linux 0.01版问世了,并且被放到了网上。它立即引起了人们的注意。源代码被下载、测试、修改,最终被反馈给Linus。10月5号,0.02版出来了,同时 伴随着Linus著名的声明:

From: torvalds@klaava.Helsinki.FI (Linus Benedict Torvalds)
Newsgroups: comp.os.minix
Subject: Free minix-like kernel sources for 386-AT
Message-ID: <1991Oct5.054106.4647@klaava.Helsinki.FI>
Date: 5 Oct 91 05:41:06 GMT
Organization: University of Helsinki

你在怀念minix-1.1时代的美好时光吗?那时你自己写着驱动,充满了作男人的感觉。 现在没什么好项目可做了,是吗?你在拚命啃一个操作系统,修改它以满足你的需求,是吗? 现在minix已经没什么需要你去改进的了,你为此怅然若失,是吗? 没机会再熬通宵去改进一个小程序了,是吗?如果是这样的话,那这个帖子就是给你的 :-)

一个月(?)前我曾经提到过,我正在一个AT-386机器上开发一个自由版本的、类似minix的操作系统。 现在它终于出来了(尽管未必能满足你的期待)。我乐意把源代码公开出来,让它传播得更广。 它现在仅仅是0.02版(外加一个(很小的)补丁)。但是我已经成功地在它上面跑了 bash/gcc/gnu-make/gnu-sed/compress等程序。我这个小宝贝儿的源程序在 nic.funet.fi(128.214.6.100)下面的/pub/OS/Linux目录中可以找到。 该目录中还有些README文件,还有几个在linux下能工作的可执行文件(bash,update和gcc), 你还要求些什么呢:-)。完整的内核源代码都公布在这儿了,因为里面没用到minix的源程序。 而函数库的源程序只是部分开源,所以目前还不能提供出来。拿到源代码后,直接编译就行了。 编译完就能转了。哈哈。可执行程序(bash和gcc)的源代码可以在同一网站的/pub/gnu目录里找到。

几周以后,Linux 0.03版发布了。12月份,0.10版发布了。这时的Linux还显得很简陋。它只能支持AT硬盘,而且不用登录(启动就进bash)。0.11版有了 不少改进,可以支持多国语言键盘、软驱、VGA、EGA、Hercules等等。Linux的版本号从0.12直接上升到了0.95、0.96…不 久,Linux的源代码就通过在芬兰和其它一些地方的FTP站点传遍了全世界。

3 谁与争锋

./figs/laptop.png

Linus在展示一台Linux笔记本电脑

不久,Linus开始面对挑战。他面对的不是别人,正是Andrew Tanenbaum,那个开发出MINIX的伟大教师。在给Linus的一个回贴中,Tanenbaum写到:

“我还是坚持我的观点,在1991年还设计这样一个整体架构的内核是个根本性的 错误。你该庆幸不是我的学生。这么个设计,在我这儿你得不了高分:-)”

(Andrew Tanenbaum to Linus Torvalds)

Linus后来承认说,这是关于开发Linux他所得到的最坏评价。Tanenbaum是当时的知名教授,他说的话自然很有份量。但这次面对Linux,他的话没能奏效,因为Linus不是个轻易服输的人。

Tanenbaum还宣称:

“Linux过时了。”

现在轮到新的Linux一代开始反击了。以强大的Linux社区为后盾,Linus给了Tanenbaum一个恰如其分的回复:

“你的工作是教授、研究员。这对于minix的大脑损伤是个绝妙的解释。”

(Linus Torvalds to Andrew Tanenbaum)

Linux的开发在继续。不久,加入开发的人数就超过了一百,然后是数千,然后是数十万。Linux不再只是个黑客的玩具,配合上GNU项目开发出 的众多软件,Linux已经可以走向市场了。它最终在GNU公共许可证下发布,这保证任何人都可以自由获得它的源代码,可以自由复制、学习和修改它。学生 和程序员们都没错过这个机会。

不久,软件商们也来了。Linux是自由的操作系统。软件商们需要做的只是把各种各样的软件在Linux平台上编译,然后把它们组织成一种可以推向市场的形式。这和其它操作系统在运作模式上没什么区别,只是Linux是自由的。Redhat, Caldera, 和其它一些公司都获得了相当大的市场,获得了来自世界各地的用户。除了这些商业公司,非商业的编程专家们也志愿地组织了起来,推出了他们自己的品牌–享誉全球的Debian。配上崭新的图形界面(比如X Window System, KDE, GNOME), Linux的各个品牌都倍受欢迎。

好戏连台,惊喜不断。除了PC机,Linux又被移植到了许多其它平台上(PowerPC、 Sun Sparc、ARM、Alpha…Debian就支持十几种CPU)。它还被人安装到了3com的手掌计算机上。另外,利用集群技术,许多Linux单机 可以被组织成一个整体,用于并行计算。1996年4月, Los_Alamos国家实验室的研究人员利用68台Linux单机搭建了一个并行计算系统,用它来模拟原子弹爆炸的冲击波。与其它超级计算机不同的是, 用Linux搭建的集群计算机非常便宜。这种DIY出来的超级计算机只花费$152,000,连人工(连接68台PC的线缆)都包括了。这价格只是同级别 商业机的十分之一。它的峰值计算速度可达每秒190亿(19 billion, 19x10^9)次。在世界超级计算机排行榜中它排在第315位。它也极其稳定可靠,投入运行三个月后,还不必去重启动。

./figs/linusnow2.png

今天锋芒毕露的Linus

今天,Linux最大的优势就是推动它前进的巨大开发热情。一旦有新硬件问世,Linux内核就能快速被改进以适应它。比如,Intel Xeon微处理器才问世几个星期,Linux新内核就跟上来了。它还被用在了Alpha、MAC、PowerPC上。甚至在手掌机这一少人问津的领域都可 以运行Linux。正如它在1991年诞生时那样,Linux正以同样的热情阔步走向新世纪。

./figs/Linus_Torvalds.png

Linus,2002

至于Linus本人,他保持着简单的生活。不象比尔盖茨,Linus不是亿万富翁。完成学业之后,他移居美国,在Transmeta公司找了个工 作。Transmeta公司在指导完成了一个绝密项目的研发之后,推出了自己的Crusoe处理器。Linus是这个研发小组中活跃的一员。最近,他和 Tove结了婚,生了个女儿,取名Patricia Miranda Torvalds。世界范围内的计算机社区都对Linus推崇备至,到目前为止,他是我们这个星球上最受欢迎的程序员。

./figs/family.png

全家福

4 风雨十年

Linux的开发已经走过了十个年头。它用十年的蓬勃发展否定了所有持怀疑态度的警告和预言。今天,Linux是有史以来发展速度最快的操作系统之 一。从91、92年的几个技术狂热者发展到今天数以百万计的普通用户,这绝对是个不平凡的历程。大商业公司们“发现”了Linux,将数以百万计的美元倾 入到开发中来,这一事实无情地驳斥了“开源运动反商业”的谬论。IBM曾经视开源社区为洪水猛兽。而现在,它已经将大量的资金转移到以Linux为平台的 开源解决方案中来。

但真正让人感到惊喜的是,Linux开发团队持续不断地壮大,并在世界范围内扩散开来。这些开发者以旺盛的精力和高涨的热情不断改进着Linux的 功能和性能。Linux的开发工作并没有象“代码封闭论者”所妄言的那样“最终消失在一片混乱之中”。正相反,Linux的开发是有组织有秩序的,它采用 的是一种精心设计并被细心维护的开发模式。在这一高效开发模式下,数以千计的开发者们把各种 各样的应用软件注入到Linux平台中来。

商业企业不再对Linux心怀戒惧,因而大量的软件商开始提供Linux平台上的产品支持,软件质量有了更可靠的保障,在办公室里用Linux不必 再有“风险自负”的担心了。说到可靠性,Linux在1999年CIH病毒肆虐和一年后的‘爱虫’病毒流行时,证明了自己的强健。这些相当简单的小病毒把 世界搞得一团糟,而所有的Linux机器却丝毫不受影响。这充分显示了它出色的免疫力。当Redhat这样的Linux排头兵走向市场的时候,它们受到了 热烈的欢迎。甚至在近几年dot-com网络泡沫破灭之后,它们还在持续蓬勃地发展壮大。这也大大增强了人们对Linux的信心,许多大大小小的商业公司 开始采用Linux作服务器和工作站平台,把Linux作为办公室系统的可靠支撑。

4.1 桌面应用

那么,针对Linux人们报怨最多的是什么呢?在过去,也许就数它的字符界面了。很多对Linux感兴趣的人被传统的字符界面吓着了。“字符界面可 以让你无所不能”,一些执着的黑客会向你这样辩解。但对于数百万的普通用户,这意味着要花费大量的时间和精力去学习它。现成的XWindow图形界面和窗 口管理器并不能满足普通计算机用户的期待。这一直是MS Windows追随者们的攻击把柄。但在过去的几年间,情况发生了改变。象KDE和GNOME这样非常专业的桌面环境呈现在了人们的面前。这些桌面环境的 较新版本使人们对Linux的“用户友好性”有了更好的认识。尽管一些铁杆用户在报怨,图形化使黑客文化失去了其原有的纯正品味。但图形化大大改善了 Linux在普通用户心目中的形象,促进了Linux的流行与推广。

4.2 第三世界

Linux在发展中国家得到了广泛的传播。这也许是它对世界影响最大的地方。在Linux出现之前,发展中国家在计算科学领域大大落后于西方。虽然 硬件价格不断下滑,但在第三世界国家,计算机爱好者们饱有热情,却又囊中羞涩。软件的高昂价格一直是个巨大的经济负担。无奈中,他们只能求助于各种各样的 盗版软件。这直接导致了盗版的泛滥,盗版金额高达数万亿美元。话又说回来,大多数商业软件的标价都大大超过了发展中国家人民的承受力。举例来说,一个典型 的操作系统软件至少标价$100。在一个年人均收入只有$200-$300的国家,这$100是个巨额数字。

Linux和其它开源软件的崛起彻底改变了这一切。在适当的裁减之后,Linux可以在硬件配置极低的计算机上运行。这使得Linux成为穷人的理 想选择。在发达国家已经成为历史的老旧机器,比如486/Pentium1计算机,在发展中国家还在被使用着。Linux使得这些老旧机器继续发挥作用。 由于在穷国,高昂的软件价格是个大问题,所以开源软件得到了广泛的传播。在亚非拉,Linux成了众多计算机爱好者们的选择。在世界的各个角 落,Linux被本地化。这标志着它真正走向了全球。Linux的相关文件被翻译成了各种语言,包括很多冷门的语言,比如,越南语。

4.3 超级计算

Linus Torvalds当初开发Linux,只是出于一个黑客的爱好。自从Linux运行在了一个破386机器上以后,到现在,它已经走过了一条很长的路。今天,它最令人瞩目的应用领域是大规模并行计算集群。

2001年8月,BBC报道说,美国政府正在计划一个超大规模计算机。这个超级计算机将能够进行每秒13万亿次(13 trillion,13x10^12)计算(13.6TeraFLOPS)。这一项目被命名为“Teragrid”,是一个由四个美国超级计算中心组成的 网络。这四个超级计算中心是:

  1. 伊利诺斯大学国家超级计算机应用中心(National Center for Supercomputing Applications at the University of Illinois(NCSA))
  2. 加利福尼亚大学San Diego超级计算机中心(San Diego Supercomputer Center (SDSC) at the University of California)
  3. 芝加哥Argonne国家实验室(Argonne National Laboratory in Chicago)
  4. 加州理工学院帕萨迪纳分校(California Institute of Technology in Pasadena)

在每个计算中心都有一个Linux超级计算机集群。在Teragrid网中,总共将会有超过3000个处理器进行并行运算。截止至2005年,Linux超级应用再创新高。在2005年超级计算机500强中,使用Linux的超过了60%。而且前5名中,有4个用的是Linux。

4.4 走向未来

Linux从一个黑客的个人项目发展到一个遍布全球的操作系统,这一历程就象一次生物的进化。八十年代早期,Richard Stallman发起了GNU项目,为开源软件的发展奠定了基础。Andrew Tanenbaum教授开发的MINIX系统,把操作系统的学习研究从单纯的理论教学带入到实践阶段。最终,Linus Torvalds用他追求完美的无尽热情催生了Linux。在过去的几年中,开源社区成千上万的人们不断地呵护滋养着它,谱写了计算机革命史册的光辉一 页。今天,Linux不再是一个学生黑客的项目,它成了一个世界范围的奇迹。在开源运动的精神感召下,IBM这样的大公司和千百万热情的人们都加入了进 来。在计算科学的历史上,它将是人类最辉煌的成就之一。

5 企鹅绅士

./figs/logo.png

Linux的标志是一只小企鹅。不象其它商业操作系统,Linux没有采用一个令人肃然起敬的徽标。这个穿着黑色燕尾服的小家伙充分表达了自由软件 运动无忧、无虑、无畏的态度。这个可爱的徽标诞生于一个有趣的小故事。据Linus说,Linux最初并没有徽标。一次,Linus去南半球某地度假,碰 到了一只企鹅。它长得并不象现在的Linux徽标。Linus想去亲近这小家伙。结果,小企鹅在他手掌上重重地拍了一翅膀。这次有趣的经历导致了后来 Linux徽标的诞生。

6 轶闻趣事

下面是一些Linus的名言。

Dijkstra八成讨厌我。
(Linus Torvalds, in kernel/sched.c)

“我怎么知道它转不转?这是beta测试该做的事情。我只管编码。”
(Linus Torvalds的个性写照。摘自某个帖子)

“我真白痴…至少这个bug花了我五分钟才找到…”
(Linus Torvalds 给一个bug报告的回应)

“如果你想周游世界,想被邀请去到处演讲,那就写个Unix操作系统吧。”
(By Linus Torvalds)

>> Linux除了有一个酷名字以外,谁能说说为什么我该用 Linux 而不是BSD?
> 不,这就够了,有个酷名字就够了。在取名方面,我们花了老大的力气,希望它的名字能引起大家的兴趣。这招挺有效,数以千计的人们选择了Linux,就是为 了说:“OS/2?哈。我有Linux。多酷的名字。” 386BSD的名字里有太多数目字和奇怪的缩写,太失败了。听起来太技术化, 把人都吓跑了。
(摘自Linus Torvald的一个关于Linux的跟贴)
> 有朝一日,大家觉得有人能把Linux搞得更好的时候(自由软件基金会就是个选择),我就“退位”。我觉得这还不是我们现在该操心的事情,至少在可见的将 来还不会发生。我喜欢搞Linux,尽管工作量不小。 而且我还没听到有人报怨我(也就听到些很小声的提醒,都是关于我忘了或者忽略了某个小补丁。至今也没有什么真正的负面反映)。
> 别误会,我上面这些话并不是说一旦有人报怨我,我就撂挑子不干了。我皮很厚(Lasu正在我背后偷看我写这些东西,他说“更确切地说该是‘脸皮’很 厚”),厚得足以接受些难听的话。如果不是这样,早在听到ast(译注:Andrew S. Tanenbaum)嘲笑我模仿、复制minix的时候,我就停止开发了。我只是想说,Linux到现在一直是我的宝贝儿,如果有人想把它搞得更好,我不 会死抱不放、 舍不得撒手的。
Linus
> 嘿,也许我该到教皇那儿申请个圣徒的头衔。谁知道教皇的email?很高兴我 让你恶心了。
(摘自Linus给某位为Linux未来表示担忧的人的回复)

当你向人炫耀“我写了个能搞死Windows的程序”的时候,大家会木然地盯着你说“呵,我Linux系统里有得是这类程序,而且这系统不花钱”。
(By Linus Torvalds)

7 似水流年

日期 事件
1984年1月 Richard Stallman从MIT辞职,开始了他的GNU项目。
1985年某月 Richard Stallman成立了自由软件基金会。
1985年3月 Richard Stallman在Dr. Dobb's杂志上发表了《GNU宣言》。
在宣言中,他陈述了自由软件运动的起因。
1991年8月25号 Linus在Usenet新闻组上公开了关于Linux的构想。
1991年9月 Linux 0.01版在网上发布。
1992年1月 第一个Linux新闻组诞生:alt.os.linux。
1992年4月 Ari Lemmke在Usenet上创立了广受欢迎的comp.os.linux新闻组。
1992年11月 Adam Richter宣布他的公司推出了第一个Linux发行版: Yggdrasil。
1993年6月 Peter Volkerding推出了著名的Linux发行版:Slackware。
1993年8月 Matt Walsh推出《Linux安装与入门:第一版》。
1994年3月 Linux内核1.0版问世。

8 参考链接

下面是一些关于Linux历史的参考链接,也许对你有帮助。

9 鸣谢与版权

历史通常是枯燥乏味的,但计算科学和Linux的历史却是相当有趣的。这篇文章中的大多数信息都取自互联网。它的很多灵感来源于在孟加拉Linux用户俱乐部中的交流。谢谢大家。

本文涉及的所有资料的版权属于资料的原作者。所有的商标都属于它们的公司。 Microsoft和Windows是微软公司的注册商标。

本文的版权属于Ragib Hasan(1991+),作者保留所有版权。但不必担心,本文的任何部分都可以随意复制,前提是事先征得作者的同意。很简单,只要给他发个email就行了,不收钱。欢迎大力弘扬自由软件运动的精神。

如有任何建议和更正,请联系:

Ragib Hasan
Department of Computer Science
University of Illinois at Urbana-Champaign,
Urbana, IL 61801
United States
电子邮件:ragibhasan aaaaht gmail daaawt com (你明白我的意思 ;-)

本文可以从下列网址获得:

中文PDF版和TeX源文件可以从下列网址获得:

关于中文翻译的任何意见和问题,请联系:

百度和Google的算法区别/Difference between Baidu and Google Algorithm

百度和Google算法区别:

1、 公正性:Google比百度更加公正,因为百度有很多人为的因素干涉排名,而Google的PR(Page Rank)算法使得Google更加公正

2、 网站评价等级:Google的PR(Page Rank)是Google算法中一个重要因素,它给网站进行了评分,而百度没有类似的算法机制。

3、 网页收录:Google和百度都可以对网站进行收录,而其都是采用site命令查询。Google对网站的收录比较客观真实,百度收录一般都要比Google少,而其会少很多。

4、 算法稳定性:Google的算法相对稳定,而百度的算法基本上“天天在变”

5、 Sitemap:Google的sitemap功能方便“蜘蛛”爬取网站页面,即使一些链接很深的页面也可以通过sitemap引导“蜘蛛”爬到该页面;而百度没有sitemap功能,百度“蜘蛛”只能依靠网站HTML页面上的链接爬取网站页面。
Difference between Baidu and Google Algorithm:

1.     Impartiality:

Google is more fair than Baidu. Because Baidu is affected by human factor, but PR algorithm makes Google more fair.
2.     Site evaluation grade:

Google's PR (Page Rank) is an important factor in Google algorithm, and it grades sites, while Baidu has no similar algorithm mechanism.
3.     Web pages record:

Both Google and Baidu can record web pages with the same “site” order to search. But web pages in Google are more objective, true and also much more than Baidu. For example: hsw.cn, Google includes 15,500,000,but Baidu only includes: 2,150,000.
4.     Algorithm stability:

Google's algorithm is relatively stable, while Baidu's algorithm essentially "changing every day"
5.     Sitemap:

Google's sitemap feature to facilitate the "spider" crawling Web pages, even if some link deep in pages can also be guided through the sitemap "spider" climb up on the page; while there is no sitemap feature for Baidu, Baidu "spider" can only rely on Web site link on the page web site pages get crawled.

五种开源协议的比较(,LGPBSD,Apache,GPLL,MIT)

当Adobe、Microsoft、Sun等一系列巨头开始表现出对”开源”的青睐时,”开源”的时代即将到来!

最初来自:sinoprise.com/read.php?tid-662-page-e-fpage-1.html(遗憾的是这个链接已经打不开了),我基本未改动,只是进行了一些排版和整理。
参考文献:http://www.fsf.org/licensing/licenses/

现今存在的开源协议很多,而经过Open Source Initiative组织通过批准的开源协议目前有58种(http://www.opensource.org/licenses/alphabetical)。我们在常见的开源协议如BSD, GPL, LGPL,MIT等都是OSI批准的协议。如果要开源自己的代码,最好也是选择这些被批准的开源协议。

这里我们来看四种最常用的开源协议及它们的适用范围,供那些准备开源或者使用开源产品的开发人员/厂家参考。

BSD开源协议(original BSD licenseFreeBSD licenseOriginal BSD license

BSD开源协议是一个给于使用者很大自由的协议。基本上使用者可以”为所欲为”,可以自由的使用,修改源代码,也可以将修改后的代码作为开源或者专有软件再发布。

但”为所欲为”的前提当你发布使用了BSD协议的代码,或则以BSD协议代码为基础做二次开发自己的产品时,需要满足三个条件:

  1. 如果再发布的产品中包含源代码,则在源代码中必须带有原来代码中的BSD协议。
  2. 如果再发布的只是二进制类库/软件,则需要在类库/软件的文档和版权声明中包含原来代码中的BSD协议。
  3. 不可以用开源代码的作者/机构名字和原来产品的名字做市场推广。

BSD 代码鼓励代码共享,但需要尊重代码作者的著作权。BSD由于允许使用者修改和重新发布代码,也允许使用或在BSD代码上开发商业软件发布和销售,因此是对 商业集成很友好的协议。而很多的公司企业在选用开源产品的时候都首选BSD协议,因为可以完全控制这些第三方的代码,在必要的时候可以修改或者二次开发。

Apache Licence 2.0(Apache License, Version 2.0Apache License, Version 1.1Apache License, Version 1.0

Apache Licence是著名的非盈利开源组织Apache采用的协议。该协议和BSD类似,同样鼓励代码共享和尊重原作者的著作权,同样允许代码修改,再发布(作为开源或商业软件)。需要满足的条件也和BSD类似:

  1. 需要给代码的用户一份Apache Licence
  2. 如果你修改了代码,需要再被修改的文件中说明。
  3. 在延伸的代码中(修改和有源代码衍生的代码中)需要带有原来代码中的协议,商标,专利声明和其他原来作者规定需要包含的说明。
  4. 如果再发布的产品中包含一个Notice文件,则在Notice文件中需要带有Apache Licence。你可以在Notice中增加自己的许可,但不可以表现为对Apache Licence构成更改。

Apache Licence也是对商业应用友好的许可。使用者也可以在需要的时候修改代码来满足需要并作为开源或商业产品发布/销售。

GPL(GNU General Public License

我们很熟悉的Linux就是采用了GPL。GPL协议和BSD, Apache Licence等鼓励代码重用的许可很不一样。GPL的出发点是代码的开源/免费使用和引用/修改/衍生代码的开源/免费使用,但不允许修改后和衍生的代 码做为闭源的商业软件发布和销售。这也就是为什么我们能用免费的各种linux,包括商业公司的linux和linux上各种各样的由个人,组织,以及商 业软件公司开发的免费软件了。

GPL协议的主要内容是只要在一个软件中使用(”使用”指类库引用,修改后的代码或者衍生代码)GPL 协议的产品,则该软件产品必须也采用GPL协议,既必须也是开源和免费。这就是所谓的”传染性”。GPL协议的产品作为一个单独的产品使用没有任何问题,还可以享受免费的优势。

由于GPL严格要求使用了GPL类库的软件产品必须使用GPL协议,对于使用GPL协议的开源代码,商业软件或者对代码有保密要求的部门就不适合集成/采用作为类库和二次开发的基础。

其它细节如再发布的时候需要伴随GPL协议等和BSD/Apache等类似。

LGPL(GNU Lesser General Public License

LGPL是GPL的一个为主要为类库使用设计的开源协议。和GPL要求任何使用/修改/衍生之GPL类库的的软件必须采用GPL协议不同。LGPL 允许商业软件通过类库引用(link)方式使用LGPL类库而不需要开源商业软件的代码。这使得采用LGPL协议的开源代码可以被商业软件作为类库引用并 发布和销售。

但是如果修改LGPL协议的代码或者衍生,则所有修改的代码,涉及修改部分的额外代码和衍生的代码都必须采用LGPL协议。因此LGPL协议的开源 代码很适合作为第三方类库被商业软件引用,但不适合希望以LGPL协议代码为基础,通过修改和衍生的方式做二次开发的商业软件采用。

GPL/LGPL都保障原作者的知识产权,避免有人利用开源代码复制并开发类似的产品

MIT(MIT

MIT是和BSD一样宽范的许可协议,作者只想保留版权,而无任何其他了限制.也就是说,你必须在你的发行版里包含原许可协议的声明,无论你是以二进制发布的还是以源代码发布的.

本文来自:http://www.awflasher.com/blog/archives/939

自由软件 与 开源软件 区别(free software & open source)

提到自由软件,一般都会提到自由软件的四个自由度:

自由软件对于用户来说具有如下4个自由 度:

1. 出于任何目的,运行软件的自由。
2. 学习软件如何工作,以及为了满足自己的需要修改软件的自由。
3. 为了帮助你的邻居,将软件拷贝给他的自由。
4. 为了能够让整个社团受益,公开发行改进之后的软件的自由。

在 Richard Stallman 眼里,自由软件和开源软件的区别是:

自由软件和开源软件都是计算机软件,但是,从哲学角度看自由软件和开源软件是非常不同的。它们基于不同的价值观。自由软件关注自由和社团,是一场道德运动,要求我们尊重每个人使用计算机的自由,不能让人们成为被殖民者,因此自由软件涉及到对/错的问题。而开源软件的哲学并不涉及到对与错,它仅仅是一个实用的价值观,这种哲学认为,他们有一个开发的模式,如果你按照这个开发模式来工作的话,就会得到一个高质量的软件。

因此,一个自由软件基本上是开源的,但是自由软件不光如此,它还可以保证大家能够改进软件,这一点是非常重要。从使用的角度来看的话,这些研究是可以非常有用的,我也喜欢技术含量更高的软件。因此开源软件的哲学,忽视了一个非常重要的问题,也就是如果让其他人成为被殖民者是错误的,我们必须阻止。有一些部分开源软件是自由软件,但是几乎所有的自由软件都是开源的。

在我看来,自由软件坚持理想主义,开源软件坚持实用主义。和实用相比,我还是偏向于追求自由的精神。

et. fuck 2g: gfw&gxx,连这样的一篇纯技术文章都不让打开,氧化钙它祖宗!!!

fedora12+wine+fg,successful fuck 2g

----------------------------------
[以下来源于袁萌博客]
9月15日,自由软件奠基人Richard Stallman在回答《ComputerWorld》记者Peter Moon先生的提问时,明确指出:自由软件和开源软件是不同的两个概念,自由软件是一项政治运动;而开源软件是一种开发模式。

自由软件运动所关心的是它的伦理和社会价值,我们的目标是,为一切计算机用户(以下称为“你”)赢得进行相互协作、把握自己计算能力的自由性(Freedom),因而,对于你所使用的程序,你必须拥有以下4个方面的实质性自由:

1、如你所希望的那样运行这个程序;

2、能够研究其源代码,以便修改它,使其为你所用;

3、根据你的意愿,可以重新分发它,或者赠送他人,或者出售,两者都可以;

4、根据你的意愿,发布你修改过的那个程序的新版本。

1998年,有人不喜欢使用“自由软件”这种说法,发明了“开源软件”这一术语,但是,那时他们只吸取了其中(自由软件的)“使用方便性”这一个方面的价值(或观念)。开源软件拥护者鼓吹一种用户参与其中的“(社区)开发模式”,并且断言“如此这般,一定会获得最好的软件”,而他们所说的“最好”,也仅仅是在技术这一层面而言的。他们使用“开源软件”这一说法,(隐含地)意味着,仅涉及你的“实际的方便性”,而完全忽视了你的使用程序的自由性。

Richard Stallman先生最后明确表示,“我不是说,他们(指开源软件 拥护者)错了,而是说他们未抓住要点(missing the point)”。他接着说:“如果你忽视了使用软件(上述4种)自由性和整个社会的团结一致的价值,而仅仅是欣赏那种可靠、有效的软件,你就犯了一个严重的错误(Terrible mistake)”。

我认为,我们有必要区分自由软件与开源软件,这两者是不同的概念。在我国,人们往往把这两者混为一谈,尤其是故意回避前者,而且,各有各的想法,很是奇妙,也很滑稽。

关于google PR:PR0 - Google's PageRank 0 Penalty

http://pr.efactory.de/e-pr0.shtml

PR0 - Google's PageRank 0 Penalty

By the end of 2001, the Google search engine introduced a new kind of penalty for websites that use questionable search engine optimization tactics: A PageRank of 0. In search engine optimization forums it is called PR0 and this term shall also be used here. Characteristically for PR0 is that all or at least a lot of pages of a website show a PageRank of 0 in the Google Toolbar, even if they do have high quality inbound links. Those pages are not completely removed from the index but they are always at the end of search results and, thus, they are hardly to be found.

A PageRank of 0 does not always mean a penalty. Sometimes, websites which seam to be penalized simply lack inbound links with an sufficiently high PageRank. But if pages of a website which have formerly been placed well in search results, suddenly show the dreaded white PageRank bar, and if there have not been any substantial changes regarding the inbound links of that website, this means - according to the prevailing opinion - certainly a penalty by Google.

We can do nothing but speculate about the causes for PR0 because Google representatives rarely publish new information on Google's algorithms. But, non the less, we want to give a theoretical approach for the way PR0 may work because of its serious effects on search engine optimization.

The Background of PR0

Spam has always been one of the biggest problems that search engines had to deal with. When spam is detected by search engines, the usual proceeding is the banishment of those pages, websites, domains or even IP addresses from the index. But, removing websites manually from the index always means a large assignment of personnel. This causes costs and definitely runs contrary to Google's scalability goals. So, it appears to be necessary to filter spam automatically.

Filtering spam automatically carries the risk of penalizing innocent webmasters and, hence, the filters have to react rather sensibly on potential spam. But then, a lot of spam can pass the filters and some additional measures may be necessary. In order to filter spam effectively, it might be useful to take a look at links.

That Google uses link analysis in order to detect spam has been confirmed more or less clearly in WebmasterWorld's Google News Forum by a Google employee who posts as "GoogleGuy". Over and over again, he advises webmasters to avoid "linking to bad neighbourhoods". In the following, we want to specify the "linking to bad neighbourhoods" and, to become more precisely, we want to discuss how an identification of spam can be realized by the analysis of link structures. In particular, it shall be shown how entire networks of spam pages, which may even be located on a lot of different domains, can be detected.

BadRank as the Opposite of PageRank

The theoretical approach for PR0 as it is presented here was initially brought up by Raph Levien (www.advogato.org/person/raph). We want to introduce a technique that - just like PageRank - analyzes link structures, but, that unlike PageRank does not determine the general importance of a web page but rather measures its negative characteristics. For the sake of simplicity this technique shall be called "BadRank".

BadRank is in priciple based on "linking to bad neighbourhoods". If one page links to another page with a high BadRank, the first page gets a high BadRank itself through this link. The similarities to PageRank are obvious. The difference is that BadRank is not based on the evaluation of inbound links of a web page but on its outbound links. In this sense, BadRank represents a reversion of PageRank. In a direct adaptation of the PageRank algorithm, BadRank would be given by the following formula:

BR(A) = E(A) (1-d) + d (BR(T1)/C(T1) + ... + BR(Tn)/C(Tn))

where

BR(A) is the BadRank of page A,
BR(Ti) is the BadRank of pages Ti which are outbound links of page A,
C(Ti) is here the number of inbound links of page Ti and
d is the again necessary damping factor.

In the previously discussed modifications of the PageRank algorithm, E(A) represented the special evaluation of certain web pages. Regarding the BadRank algorithm, this value reflects if a page was detected by a spam filter or not. Without the value E(A), the BadRank algorithm would be useless because it was nothing but another analysis of link structures which would not take any further criteria into account.

By means of the BadRank algorithm, first of all, spam pages can be evaluated. A filter assigns a numeric value E(A) to them, which can, for example, be based on the degree of spamming or maybe even better on their PageRank. Thereby, again, the sum of all E(A) has to equal the total number of web pages. In the course of an iterative computation, BadRank is not only transfered to pages which link to spam pages. In fact, BadRank is able to identify regions of the web where spam tends to occur relatively often, just as PageRank identifies regions of the web which are of general importance.

Of course, BadRank and PageRank have significant differences, especially, because of using outbound and inbound links, respectively. Our example shows a simple, hierarchically structured website that reflects common link structures pretty well. Each page links to every page which is on a higher hierachical level and on its branch of the website's tree structure. Each page links to pages which are arranged hierarchically directly below them and, additionally, pages on the same branch and the same hierarchical level link to each other.

The following table shows the distribution of inbound and outbound links for the hierarchical levels of such a site.

Level inbound Links outbound Links
0 6 2
1 4 4
2 2 3

As to be expected, regarding inbound links, a hierarchical gradation from the index page downwards takes place. In contrast, we find the highest number of outbound links on the website's mid-level. We can see similar results, when we add another level of pages to our website while the above described linking rules stay the same.

Level inbound Links outbound Links
0 14 2
1 8 4
2 4 5
3 2 4

Again, there is a concentration of outbound links on the website's mid-level. But most of all, the outbound links are much more evenly distributed than the inbound links.

If we assign a value of 100 to the index page's E(A) in our original example, while all other values E equal 1 and if the damping factor d is 0.85, we get the following BadRank values:

Page BadRank
A 22.39
B/C 17.39
D/E/F/G 12.21

First of all, we see that the BadRank distributes from the index page among all other pages of the website. The combination of PageRank and BadRank will be discussed in detail below, but, no matter how the combination will be realized, it is obvious that both can neutralize each other very well. After all, we can assume that also the page's PageRank decreases, the lower the hierarchy level is, so that a PR0 can easily be achieved for all pages.

If we now assume that the hierarchically inferior page G links to a page X with a constant BadRank BR(X)=10, whereby the link from page G is the only inbound link for page X, and if all values E for our example website equal 1, we get, at a damping factor d of 0.85, the following values:

Page BadRank
A 4.82
B 7.50
C 14.50
D 4.22
E 4.22
F 11.22
G 17.18

In this case, we see that the distribution of the BadRank is less homogeneous than in the first scenario. Non the less, a distribution of BadRank among all pages of the website takes place. Indeed, the relatively low BadRank of the index page A is remarkable. It could be a problem to neutralize its PageRank which should be higher compared to the rest of the pages. This effect is not really desirable but it reflects the experiences of numerous webmasters. Quite often, we can see the phenomenom that all pages except for the index page of a website show a PR0 in the Google Toolbar, whereby the index page often has a Toolbar PageRank between 2 and 4. Therefore, we can probably assume that this special variant of PR0 is not caused by the detection of the according website by a spam filter, but the site rather received a penalty for "linking to bad neighbourhoods". Indeed, it is also possible that this variant of PR0 occurs when only hierarchical inferior pages of a website get trapped in a spam filter.

The Combination of PageRank and BadRank to PR0

If we assume that BadRank exists in the form presented here, there is now the question in which way BadRank and PageRank can be combined, in order to penalize as much spammers as possible while at the same time penalizing as few innocent webmasters as possible.

Intuitively, implementing BadRank directly in the actual PageRank computations seems to make sense. For instance, it is possible to calculate BadRank first and, then, divide a page's PageRank through its BadRank each time in the course of the iterative calculation of PageRank. This would have the advantage, that a page with a high BadRank could pass on just a little PageRank or none at all to the pages it links to. After all, one can argue that if one page links to a suspect page, all the other links on that page may also be suspect.

Indeed, such a direct connection between PageRank and BadRank is very risky. Most of all, the actual influence of BadRank on PageRank cannot be estimated in advance. It is to be considered that we would create a lot of pages which cannot pass on PageRank to the pages they link to. In fact, these pages are dangling links, and as it has been discussed in the section on outbound links, it is absolutely necessary to avoid dangling links while computing PageRank.

So, it would be advisable to have separate iterative calculations for PageRank and BadRank. Combining them afterwards can, for instance, be based on simple arithmetical operations. In principle, a subtraction would have the desirable consequence that relatively small BadRank values can hardly have a large influence on relatively high PageRank values. But, there would certainly be a problem to achieve PR0 for a large number of pages by using the subtraction. We would rather see a PageRank devaluation for many pages.

Achieving the effects that we know as PR0 seems easier to be realized by dividing PageRank through BadRank. But this would imply that BadRank receives an extremely high importance. However, since the average BadRank equals 1, a big part of BadRank values is smaller than 1 and, so, a normalization is necessary. Probably, normalizing and scaling BadRank to values between 0 and 1 so that "good" pages have values close to 1, and "bad" pages have values close to 0 and, subsequently, multiplying these values with PageRank would supply the best results.

A very effective and easy to realize alternative would probably be a simple stepped evaluation of PageRank and BadRank. It would be reasonable that if BadRank exceeds a certain value it will always lead to a PR0. The same could happen when the relation of PageRank to BadRank is below a certain value. Additionally, it would make sense that if BadRank and/or the relation of BadRank to PageRank is below a certain value, BadRank takes no influence at all.

Only if none of these cases occurs, an actual combination of PageRank and BadRank - for instance by dividing PageRank through BadRank - would be necessary. In this way, all unwanted effects could be avoided.

A Critical View on BadRank and PR0

How Google would realize the combination of PageRank and BadRank is of rather minor importance. Indeed, a separate computation and a subsequent combination of both has the consequence that it may not be possible to see the actual effect of a high BadRank by looking at the Toolbar. If a page has a high PageRank in the original sense, the influence of its BadRank can be negligible. But if another page links to it, this could have quite serious consequences.

An even bigger problem is the direct reversion of the PageRank algorithm as we have presented it here: Just as an additional inbound for one page can do nothing but increasing this page's PageRank, an additional outbound link can only increase its BadRank. This is because of the addition of BadRank values in the BadRank formula. So, it does not matter how many "good" outbound links a page has - one link to a spam page can be enough to lead to a PR0.

Indeed, this problem may appear in exceptional cases only. By our direct reversion of the PageRank algorithm, the BadRank of a page is divided by its inbound links and single links to pages with high BadRank transfer only a part of that BadRank in each case. Google's Matt Cutts' remark on this issue is: "If someone accidentally does a link to a bad site, that may not hurt them, but if they do twenty, that's a problem." (searchenginewatch.com/sereport/02/11-searchking.html)

However, as long as all links are weighted uniformly within the BadRank computation, there is another problem. If two pages differ widely in PageRank and both have a link to the same page with a high BadRank, this may lead to the page with the higher PageRank suffering far less from the transferred BadRank than the page with the low PageRank. We have to hope that Google knows how to deal with such problems. Nevertheless it shall be noted that, regarding the procedure presented here, outbound links can do nothing but harm.

Of course, all statements regarding how PR0 works are pure speculation. But in principle, the analysis of link structures similarly to the PageRank technique should be the way how only Google understands to deal with spam.

PageRank and Google are trademarks of Google Inc., Mountain View CA, USA. PageRank is protected by US Patent 6,285,999.

The content of this document may be reproduced on the web provided that a copyright notice is included and that there is a straight HTML hyperlink to the corresponding page at pr.efactory.de in direct context.

Urlaub Ägypten

(c)2002/2003 eFactory GmbH & Co. KG Internet-Agentur - written by Markus Sobek