星期四, 十一月 08, 2007

有关2006年Google索引的数据量

而来自伯克利信息管理系统的统计结果表明,
2006年,人类产生了约1000万TB的(不重复)数据,Google仅仅组织了其中的0.02%. 但是,仅仅是0.02%的数据却已经让Google的资本总额达到$225,000,000,000,可见在一望无际的数据搜索和挖掘领域还有多少市场等待着开发.




Google让人类可以通过简单的方法找到0.02% 的数据,未来呢?

上面是Cnbeta的报道,但是事实是这样的吗?80-90%都是porn之类的垃圾文件吧。Google
索引的只是文字相关的资料及其路径,如果真的要把这些视频 文件 和音频 都存储在一个地方难道确实是太大了,0.02%应该可以索引完50%左右的互联网内容,不知道这个数据是否准确

没有评论: