大规模Web服务开发技术

内容简介

Hatena 是日本最大的Web 服务提供商之一，它提供的服务包括关键字（类似于维基百科）、部落格、相册等。本书的内容主要来自Hatena 为学生们举行的暑期实习的课程，内容涵盖广泛，介绍了性能最佳化、分散式、算法、系统架构等各个方面，甚至还介绍了硬体的经济成本，是运维工程师们必不可少的参考书。该书中包括几个算法实习课题，介绍了压缩算法、全文搜寻等算法的实现方法，对于打算靠Web 创业的人不失为一本很不错的参考书。

译者序

去年 8 月份，fcicq 向我推荐了《大规模Web 服务开发技术》这本书。当时这本书刚刚出版，在日本着实火了一段时间。后来到网上一查，发现我以前在日本的同事也写了一篇部落格推荐这本书，看样子这本书已成为Web 技术人员人手必备的参考读物了。

后来博文视点的策划编辑张春雨找到我，希望我翻译这本书。我在日本工作期间，就对日本的IT 技术十分佩服，尤其是Web 相关技术，很多知名的技术大牛，如伊藤直也、小饲弹等

都写过许多深入研究技术的文章，见解也相当独到。而在日本的书店里，Web 技术的书籍也是琳琅满目，其中不乏珍品。因此我很想找个机会把日本的技术书籍带到中国来。于是，与张编辑一拍即合，当即接下了这本书的翻译任务。

正如这本书的前言里所说，这本书的内容主要来自Hatena株式会为学生们举行的暑期实习课程，因此其形式也是以讲义为主，风格和一般的技术读物略有不同。其内容涵盖範围也很广，从性能最佳化、分散式，到算法、系统架构，甚至还介绍了硬体的经济成本。最吸引人的就是书中的几个实习课题，介绍了压缩算法、全文搜寻等算法的实现方法。

在翻译该书时，我想到了以前做网站开发时的几件事。

第一件就是性能最佳化的重要性。当时我们开发了一个类似于RSS 阅读器的网站，其中有个推荐功能，可以根据访问量、收藏人数等对文章进行社会化推荐。由于计算量很大，因此只能写成批处理放到夜间执行，但执行效率实在不堪忍受——40 万的数据量，计算一次就要3 个小时。后来我们对SQL 语句进行了最佳化，使得计算时间从3 小时一下子减少到了20 分钟。

第二件就是维护工作的辛苦程度。网站对 Web 伺服器採用了分散式，将请求分散到32 台伺服器上。每次版本更新，都要制定严密的更新计画，先改变负载均衡器设定，然后停掉一半伺服器，更新代码，再然后逐台测试；之后再切换负载均衡器以更新另一半伺服器并测试。更新都是在深夜进行的，每次更新都会持续到凌晨3 点多才能下班。

第三件就是不可知事件的应对策略。这本书里提到了Yahoo!攻击，这正是我们当年亲身经历过的。当时晚上9 点多，我们突然收到了大量报警邮件，报告相册服务的负载过高。一看伺服器已经几乎无法访问了。调查之后发现，一名博主引用了相册中的图片，而这篇文章又被Yahoo!上的一篇新闻引用。于是来自Yahoo!的巨大流量涌入我们的相册伺服器，导致服务中止。后来，我们改变了相册服务的架构，并增加了快取机制，以避免这类事件再次发生。

对于运维高手来说，解决这些问题应该是轻车熟路了，但当时我们的团队没有类似的经验，只能自己慢慢摸索解决方法。而Hatena 株式会的技术专家们将他们的运维经验写成了书，使我们有幸分享这些宝贵的经验和知识。如果当时我们有这样一本书，这几个问题也就迎刃而解了。愿这本书能对广大网站运维人员（特别是初涉该领域的新手们）有所帮助。

大规模Web服务开发技术

大规模Web服务开发技术

基本介绍

内容简介

译者序

前言

作品目录

相关推荐