找回密码
 FreeOZ用户注册
查看: 3065|回复: 14
打印 上一主题 下一主题

[网络技术] 维基百科如何依赖极少的预算应付巨大的访问量

[复制链接]
跳转到指定楼层
1#
发表于 26-6-2008 19:49:27 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?FreeOZ用户注册

x
FROM:http://hardware.solidot.org/hardware/08/06/26/0034201.shtml
非赢利的维基百科是世界上访问量最高的几个网站之一,它的维护资金主要来自捐赠,数额并不大。因此维基百科提供了一个不可多得的研究案例,如何花最少的钱做最好的网站。在这样一个时代里,微软和Google的数据中心遍布全球,每一个都要投入5亿美元去建造,而维基百科的基本设施却只有不到300台服务器,安放在佛罗里达州Tampa市中的单一数据中心内。在周一的Velocity讨论会上,MySQL/Sun的 DomasMituzas 提供了维基内部的技术信息,他称之为“压迫式运作”。Mituzas是Sun的MySQL支持工程师,他透露了维基百科是如何运作的:每秒50,000次http请求;
每秒80,000次 SQL查询;
7百万注册用户;
英文版有1800万页面对象;
2.5亿链接;
2.2亿个修订版;
1.5T压缩数据;
2001年维基百科上线时是使用Perl CGI脚本,运行在单一服务器上。现在维基百科有200个应用服务器,20个数据库服务器,70个Squid cache代理和缓存服务器。
回复  

使用道具 举报

2#
发表于 26-6-2008 20:30:24 | 只看该作者
相对而言,wiki的内容主要是文本和少量图片(才1.5T的压缩数据),所以对硬件资源的要求不高。
回复  

使用道具 举报

3#
发表于 26-6-2008 20:30:50 | 只看该作者
很想知道youtube的硬件资源有多大。
回复  

使用道具 举报

4#
 楼主| 发表于 26-6-2008 23:28:16 | 只看该作者

回复 #3 ubuntuhk 的帖子

youtube需要的资源是海量的

别的不说,据说Google的大部分网络带宽都被YouTube用掉了,而且不前一分钱不能挣
回复  

使用道具 举报

5#
发表于 27-6-2008 04:22:15 | 只看该作者
youtube 的架构 http://highscalability.com/youtube-architecture  

youtube有广告收入的,不过相对于流量费用而言,九牛一毛

评分

参与人数 2威望 +50 收起 理由
flyspirit + 20 这个很好,太感谢了
coredump + 30 谢谢分享!

查看全部评分

回复  

使用道具 举报

6#
发表于 1-7-2008 15:33:42 | 只看该作者

回复 #5 ritz 的帖子

我觉得这类公司的盈利方式不是显式的传统意义上的,他们依靠股市赚钱。就是说他们又开发了一种赌博的方式。例如扑克牌有black j,现在他们又发明了13点,玩的人不用为这种玩法付钱,你就玩就行了,有人给发明者报酬。
回复  

使用道具 举报

7#
发表于 1-7-2008 15:37:48 | 只看该作者
我的例子很简单只有3层  发明者->赌场->-玩家

但是现实中是   发明者->风险投资者->isp->玩家
风险投资者的回报来自  基金、股市等等
回复  

使用道具 举报

8#
发表于 1-7-2008 15:39:54 | 只看该作者
没看懂,到底维基怎么实现的呢?就因为图文要求低吗?还是有其他的技巧?
回复  

使用道具 举报

9#
发表于 3-7-2008 14:14:20 | 只看该作者
维基上面的内容不属实,因为每个人都可以编撰,所以对上面的东西要慎重对待。
回复  

使用道具 举报

10#
 楼主| 发表于 3-7-2008 16:02:37 | 只看该作者

回复 #7 NEWGAY 的帖子

你在说啥
回复  

使用道具 举报

11#
 楼主| 发表于 3-7-2008 17:42:19 | 只看该作者


维基百科强调的不是真实(没有任何绝对的真实),她强调的是引用真实性,也就是所有内容都必须找到可验证的来源。

所以维基百科记录的不是自身的有选择性真实性,而是忠实记录整个人类群体对该条目的真实性认知水平。
回复  

使用道具 举报

12#
发表于 3-7-2008 19:05:19 | 只看该作者
同意楼上,没有绝对的真实
回复  

使用道具 举报

13#
发表于 3-7-2008 22:12:30 | 只看该作者
wiki的架构主要是应对查询,充分cache就行了,可以采用廉价的x86服务器
每秒50,000次http,分布到200台web服务器的话,每台是250次/秒,主要看cache命中率了。
http server, db server,多数查询都该在cache里直接找到,这样就快了
回复  

使用道具 举报

14#
发表于 5-7-2008 20:52:07 | 只看该作者
原帖由 coredump 于 2008-7-3 14:42 发表


维基百科强调的不是真实(没有任何绝对的真实),她强调的是引用真实性,也就是所有内容都必须找到可验证的来源。

所以维基百科记录的不是自身的有选择性真实性,而是忠实记录整个人类群体对该条目的真实性认知 ...


维基百科的核心价值观之一是:中立的观点(natural point of view, NPOV)
http://zh.wikipedia.org/wiki/Wik ... 4%E8%A7%82%E7%82%B9
http://en.wikipedia.org/wiki/Wikipedia:Neutral_point_of_view

实际上我觉得维基百科比大多数的百科全书要强得多,当然,我不做专业的学术研究,这方面不做评价
回复  

使用道具 举报

15#
发表于 6-7-2008 21:50:08 | 只看该作者
newgay说提youtube吧,有新意!
回复  

使用道具 举报

您需要登录后才可以回帖 登录 | FreeOZ用户注册

本版积分规则

小黑屋|手机版|Archiver|FreeOZ论坛

GMT+11, 5-1-2025 09:11 , Processed in 0.047546 second(s), 33 queries , Gzip On, Redis On.

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表