Google搜索技术揭秘

2016-01-29 18:23 5 1 收藏

Google搜索技术揭秘,Google搜索技术揭秘

【 tulaoshi.com - Linux 】

Google将其成功部分地归功于公司所发明的独有运算机制，令其搜索引擎可以在极短时间内对数以百万计的网络用户的搜索请求提供答案
Google昨（7）日宣布推出「Google桌面搜索」（Google Desktop Search）应用软件中文版，让用户在查找自己计算机的文件时，像在网络上使用Google搜索引擎一样快捷方便。
　　e表示，桌面搜索是把Google的搜索功能引入计算机硬盘，让用户可以轻松的找到所需要的数据。当前Google的桌面搜索仅提供Beta版本，大小约1.1MB。
　　Google指出，这项桌面搜索工具下载后，计算机的桌面上会显示一个浮动的搜索框，用户可以搜索自己的电子信函及各种文本文档、简报档、PDF档、音乐及图象文件等。当前这项软件仅适用于Windows XP、Windows 2000 Service Pack3或以上的窗口操作系统，所需的磁盘空间为500MB，内存最少为128MB。
副总裁泄玄机：Google搜索技术揭秘
　　Google将其成功部分地归功于公司所发明的独有运算机制，令其搜索引擎可以在极短时间内对数以百万计的网络用户的搜索请求提供答案。
　　上周三，Google副总裁Urs Hoelzle在Eclipse会议上的一番发言，令与会者有机会了解Google的搜索技术是如何产生以及该技术现在是如何运作的。　
　　Hoelzle对与会者说，要发明Google的技术，开发者必须抛弃过去大型数据库所使用技术的思维定势。由于一天里面所有搜索请求的内容都是不可预计的，因此手头上就必须拥有100亿左右的网页数据，这是确实是很大的挑战。
　　Hoelzle出示了一系列早期Google硬件数据中心的照片。1997年拍的照片中是两台破旧的台式电脑。1999年，是数台Intel服务器，机器后面露出一堆乱七八糟的数据线。2000年的数据中心内，摆放的是1000台排列整齐的双处理器服务器。
　　Hoelzle表示，“底层的硬件价格十分低廉，但却完成了许多工作。”同时，使用如此多的服务器，可靠性是Google关心的另一重点。Hoelzle表示，“Google使用自动控制的机制进行运作。否则，工程师们需要为重启服务器而疲于奔命。”

　　为了抵抗不可抗力带来的影响，Google搭建了Google文件系统，该系统与Google的搜索运算系统紧密结合，并且对服务器故障有很高的承受能力。
　　Google的所有操作均基于一系列的大容量文件，这些文件被拆分为64M大小的数据包，分布在多个“数据包服务器”中。文件的描述、数据包的数目和数据包的位置等资料都存放在中央服务器中。每一个64M的数据包都会在另外两个服务器上备份，三份拷贝的路径亦存放在中央服务器中。
　　由于所有的文件都存放在Red HatLinux服务器中，Google以很低的成本就保证了服务的可靠性。中央服务器会定时向数据包服务器发出脉冲信号，确定数据包服务器是否在正常运作。如果没有收到应答信号，又或者应答信号中显示某台数据包服务器的数据受到损害，中央服务器会从其他数据包服务器上取出数据包修复受损的服务器。这一工作通常在一分钟内则可以完成。
　　Hoelzle指出，只有三台服务器上的拷贝同时受损，才会对Google的服务有所影响。这时候，就需要用一段长时间去收集互联网的数据以重建受损文件。
　　Google会对Web Crawler收集到的网页进行索引， Web Crawler亦会对这些网页的作出描述。Hoelzle表示，建立网页的索引是很艰巨的一项工作，需要数百台计算机运算数天。同时，索引必须经常地更新。
　　为了高速地对索引进行检索，Google将其分成许多称为“碎片”的小块，分布在不同的服务器中，以便进行并行搜索。每一台服务器都搜索出一部分结果，然后再整合在一起成为完整的答案。
　　Hoelzle表示，Google的文件系统、索引技术及商用服务器的网格令每一次搜索的平均时间四分之一秒。而文件系统的定时脉冲信号机制，则给予Google很高的可靠性和可用性。
　　同时，当Google的服务器分析搜索请求的时候，会将该搜索请求拆分，然后再从数据库中找出令大部分用户满意的结果，这一过程称为“map reduction”。Hoelzle表示，“Google曾经在一次大型维护意外事故中失去了2000台mapreduction服务器中的1800台。”但由于系统的负载均衡机制，将未完成的搜索任务合理分配，Google仍然能完成所有的搜索请求。　　Hoelzle指出，“这一机制使我们能很快从故障中复原，并不影响我们的服务。” (来源：经济日报)

来源:http://www.tulaoshi.com/n/20160129/1505587.html

上一篇： XP操作系统十六招超级应用技巧
下一篇：在网页中实现OICQ里的头像选择的下拉框

看过《Google搜索技术揭秘》的人还看了以下文章更多>>

ASP+AJAX做类似google的搜索提示

标签： Web开发

主要要文件有: Index.html 实现功能,一个文本框,输入内容并实现提示 search.asp 查询功能,让文本框输入的内容在数据库中查询,然后返回给客户端 conn.asp 数据库连接功能,实现与数据库相连 xmlhttp.js AJAX 核心部分,用来把客户端的数据传给服务端,再把服务端的数据返还给客户端. style.css 样式文件,主要是对google提示框查询到的内容...

Google搜索帮忙你把安卓手机找回

标签： Android

Google搜索帮忙你把安卓手机找回 Google帮助用户寻回遗失手机的新功能要求用户使用桌面端的 Google 搜索引擎，来寻回遗失的 Android 手机。所以第九软件网图老师小编还是想建议大家如果想体验该功能最好tulaoshi有一定fq本领哦。 Google搜索帮忙你把安卓手机找回使用教程：安装使用桌面端的 Google 搜索引擎 ...

在IE9中添加google.com.hk搜索和开启搜索建议

标签：浏览器

在IE9中添加google.com.hk搜索和开启搜索建议在IE9地址栏自动完成的下拉列表中，单击右下角的添加按钮。然后在弹出的Internet Explorer 库 Add-ons网站中寻找到google搜索，再单击Click to install进行添加。在弹出的添加搜索程序对话框中，勾选将他设置为默认搜索提供程序，在单击添加按钮。此时我们还发现使用此提供...

搜索引擎技术核心揭密

标签： PHP

编者按：这是一篇精彩的编程教学文章，不但详细地剖析了搜索引擎的原理，也提供了笔者自己对使用ＰＨＰ编制搜索引擎的一些思路。整篇文章深入浅出，相信无论是高手还是菜鸟，都能从中得到不少的启发。谈到网页搜索引擎时，大多数人都会想到雅虎。的确，雅虎开创了一个互联网络的搜索时代。然而，雅虎目前用于搜索网页的技术却并...

黄芩种植技术揭秘高手支招

标签：花卉

黄芩别名：山茶根、黄芩茶，多年生草本植物。株高33-67厘米。总状花序，生于枝的上端叶腋，唇形花冠，蓝紫色。根呈椎形，黄色，药用其根。下面让我们来看看黄芩种植技术的讲究有哪些? 一、黄芩种植选地-整地选择土层深厚、排水渗水良好、疏松肥沃、阳光充足、中性或接近中性的壤土、沙壤土为宜，平地、缓坡地、梯田均...

查看更多精彩>>