1、内 容 简 介 本书围绕大型网站和支撑大型网站架构的 Java 中间件的实践展开介绍。从分布式系统的知识切入,让读者对分布式系统有基本的了解;然后介绍大型网站随着数据量、访问量增长而发生的架构变迁;接着讲述构建 Java 中间件的相关知识;之后的几章都是根据笔者的经验来介绍支撑大型网站架构的 Java 中间件系统的设计和实践。希望读者通过本书可以了解大型网站架构变迁过程中的较为通用的问题和解法,并了解构建支撑大型网站的 Java 中间件的实践经验。对于有一定网站开发、设计经验,并想了解大型网站架构和支撑这种架构的系统的开发、测试等的相关工程人员,本书有很大的参考意义;对于没有网站开发设计经验的
2、人员,通过本书也能宏观了解大型网站的架构及相关问题的解决思路和方案。未经许可,不得以任何方式复制或抄袭本书之部分或全部内容。版权所有,侵权必究。图书在版编目(CIP)数据 大型网站系统与 Java 中间件实践/曾宪杰著.北京:电子工业出版社,2014.4 ISBN 978-7-121-22761-5.大.曾.网站建设JAVA 语言程序设计.TP393.092TP312 中国版本图书馆 CIP 数据核字(2014)第 059272 号 策划编辑:张春雨 责任编辑:徐津平 印 刷:北京丰源印刷厂 装 订:三河市鹏成印业有限公司 出版发行:电子工业出版社 北京市海淀区万寿路 173 信箱 邮编 10
3、0036 开 本:787980 1/16 印张:21 字数:338.7 千字 印 次:2014 年 4 月第 1 次印刷 印 数:4000 册 定价:65.00 元 凡所购买电子工业出版社图书有缺损问题,请向购买书店调换。若书店售缺,请与本社发行部联系,联系及邮购电话:(010)88254888。质量投诉请发邮件至 ,盗版侵权举报请发邮件至 。服务热线:(010)88258888。推荐序一 从事互联网系统开发的人员大多希望成为资深的架构师或领域专家。但大部分人员由于自身工作环境及条件的限制,缺少大型系统实践经验,或者对核心的案例缺乏真实的了解,因此很难有机会理解分布式设计中的关键问题及应对方案
4、。如何才能找到有效的方法并早日成为资深系统架构师呢?大型网站系统与 Java 中间件实践一书介绍了大型网站分布式领域的各种问题,并且以互联网语言 Java 语言为主。这对于希望提升架构能力的技术人员来说,一方面有助于他们了解理论层面体系,掌握大型系统的全貌;另一方面,由于作者具有淘宝平台的丰富的架构及中间件开发经验,因而书中的要点都是大型网站在实际运行中的精华经验,不管你是使用一个已有的分布式开源解决方案,还是自行开发分布式组件,了解这些关键点都会帮助你快速深入地驾驭分布式领域的核心架构。书中内容尽是实战经验,虽不布道,但所述内容却不乏硝烟因为是作者在分布式系统的构建、拆分、服务化、部署、实战
5、过程中所经历的教训、积累的经验。书中还有很多性能优化分析、多种方案选择时的 tradeoff 及实战中的方案。方案选择无所谓最佳,只有最适合,这本书不仅给出了方案选择的方法,更给出了方案选择的原因。本书除了适合希望提升架构能力的技术人员阅读,对于正在从事大数据、高并发、中间件使用或研发的一线开发人员也很有价值。杨卫华(TimYang)新浪网技术总监 推荐序二 看了华黎寄给我的样章有很深的感触,时间仿佛又回到两年多前,当时“去哪儿”网的业务飞速发展,系统遇到了各种各样的问题。首先是系统无节制地变得臃肿庞大,大量的 web service 的调用将我们的系统变成了一个蜘蛛网,新进入的工程师需要很长
6、时间的熟悉才能对原有系统做出修改。其次系统随着业务量的不断增大变得不堪重负,开始还能通过增加硬件来扩容,后来增加硬件能够带来的效果已无济于事。还有,质量越来越难以保证,测试的时间变得越来越长,无法跟上和满足业务发展和变化的需要,团队的压力也越来越大,各个团队都需要增加人员,但是生产力的提升并不明显。回顾那段时间,故障频发,效率低下,团队人困马乏,成就感变得越来越低。于是我们参考了国内外经历过这个阶段的公司的做法,引入了服务化框架,将系统拆小,重视了系统层次,控制了系统之间的调用关系,也采用了可靠消息系统来应对业务系统之间的强耦合问题。经过两年的努力,现在终于看到了胜利的曙光。总结下来系统发展的
7、困难也是演进推动力,主要来自于三个方面:一是系统的 推荐序二 大型网站系统与 Java 中间件实践 VI 负载规模,二是系统的复杂度,三是由前两个方面带来的开发团队的规模扩张。而中间件技术是解决上述三个问题的重要方法。如果在两年甚至三年前华黎的这本书就已经出版,那么去哪儿网的系统发展就能少走很多弯路。过去两年中,我们为了概念和做法进行了无数次的讨论、争执、尝试、修正。因为我们当时获得经验的途径主要是通过阅读国内外各大网站的同行在各种技术会议上的演讲、PPT,或者与他们交流过程中得到各种启示,这对于一个快速成长中的系统来讲太不成体系了,无法对日常的工作进行指导。而华黎写的这本书融合了他过去在淘宝
8、的经验,书中的做法、理念经过了淘宝系统的爆炸性增长的检验,详实地阐述了 Java 中间件技术在大型网站,尤其是大型交易类网站的建设和应用经验。书若其人,这本书很实在,用现在流行的话语来讲,就是干货多。我认识华黎有三年了,三年内见过几面,每次见面我都有很多收获。这次他把他的经验和领悟集结成书,相信对很多正在投身于互联网系统开发,特别是高负载、高复杂度的系统开发的工程师们会有很大帮助。也衷心祝福华黎在未来的日子里,儿子健康成长,家庭幸福,工作顺利。吴永强(吴永强去哪)去哪网 CTO 前言 由于 2007 年一个很偶然的机会,我加入了淘宝平台架构组,职位是 C+工程师。然后我就在只完成了C 语言的一
9、个小功能后,开始了Java中间件的研究生涯。从 2007年下半年到 2013 年年初,近 6 年时间我都在和支撑整个网站应用的 Java 中间件打交道从设计实现消息中间件到参与数据访问层设计,再到负责整个 Java 中间件团队,我也从一个不太懂 Java 的 C+工程师成长为对 Java 中间件有一定了解和积累的工程负责人。在这个过程中,我也有幸参与了淘宝从集中式的 Java 应用到分布式 Java应用的架构变迁。本书从分布式系统说起,然后介绍大型网站的变迁中遇到的挑战和应对策略,接着讲解 Java 中间件的内容,重点介绍了笔者在实践中自主开发的支撑大型网站应用的几个 Java 中间件产品,包
10、括对它们的思考及其设计和实现原理。最后介绍了支撑大型网站的其他基础要素,包括 CDN、搜索、存储、计算平台,以及运维相关的系统等内容。通过阅读本书,笔者希望读者能够尽量完整地了解大型网站的挑战和应对办法,并且能够了解淘宝在大型网站变迁过程中产生的这几个中间件的具体产品及其背后的思考和设计,并能够对除中间件之外的支撑大型网站的其他系统有一定的了解。希望初学者能够更多地关注全貌,也希望有相关经验的人士可以从本书中得到一些启发,汲取一些经验。前言 大型网站系统与 Java 中间件实践 VIII 2013 年 5 月,我的岗位有了调整,在接下来的时间中我将带领淘宝技术部承担淘宝业务应用的开发工作。这本
11、书也是对自己淘宝中间件 6 年工作生涯的一份纪念。最后要说的是,能够完成本书有很多的人要感谢,首先要感谢淘宝给我这么好的平台和机会,没有这个机会就不会有本书。然后也非常感谢太太王海凤对我的支持,4 年前和林昊合著OSGi 原理与最佳实践一书的时候,我们刚谈恋爱,我把很多本应陪你的时间用在了写作上;4 年后,我又把本应陪你和儿子的时间用在了写作上,没有你的支持和理解,我不可能完成这次写作。最后也要感谢我的父母、岳父母、姑姑和小表妹,有你们照顾宸宸,我才能专心地写作本书。曾宪杰 2013 年 11 月于杭州 目录 第 1 章 分布式系统介绍 第 1 章 分布式系统介绍 1 1.1 初识分布式系统
12、1 1.1.1 分布式系统的定义 1 1.1.2 分布式系统的意义 3 1.2 分布式系统的基础知识 5 1.2.1 组成计算机的 5 要素 5 1.2.2 线程与进程的执行模式 6 1.2.3 网络通信基础知识 13 1.2.4 如何把应用从单机扩展到分布式 18 1.2.5 分布式系统的难点 31 第 2 章 大型网站及其架构演进过程 第 2 章 大型网站及其架构演进过程 35 2.1 什么是大型网站 35 2.2 大型网站的架构演进 37 2.2.1 用 Java 技术和单机来构建的网站 37 2.2.2 从一个单机的交易网站说起 38 2.2.3 单机负载告警,数据库与应用分离 40
13、2.2.4 应用服务器负载告警,如何让应用服务器走向集群 41 目录 大型网站系统与 Java 中间件实践 X 2.2.5 数据读压力变大,读写分离吧 50 2.2.6 弥补关系型数据库的不足,引入分布式存储系统 56 2.2.7 读写分离后,数据库又遇到瓶颈 58 2.2.8 数据库问题解决后,应用面对的新挑战 60 2.2.9 初识消息中间件 63 2.2.10 总结 64 第 3 章 构建 Java 中间件 第 3 章 构建 Java 中间件 67 3.1 Java 中间件的定义 67 3.2 构建 Java 中间件的基础知识 68 3.2.1 跨平台的 Java 运行环境JVM 69
14、3.2.2 垃圾回收与内存堆布局 70 3.2.3 Java 并发编程的类、接口和方法 72 3.2.4 动态代理 89 3.2.5 反射 91 3.2.6 网络通信实现选择 93 3.3 分布式系统中的 Java 中间件 94 第 4 章 服务框架 第 4 章 服务框架 97 4.1 网站功能持续丰富后的困境与应对 97 4.2 服务框架的设计与实现 100 4.2.1 应用从集中式走向分布式所遇到的问题 100 4.2.2 透过示例看服务框架原型 101 4.2.3 服务调用端的设计与实现 107 4.2.4 服务提供端的设计与实现 132 4.2.5 服务升级 137 4.3 实战中的优
15、化 138 目录 大型网站系统与 Java 中间件实践 XI4.4 为服务化护航的服务治理 142 4.5 服务框架与 ESB 的对比 146 4.6 总结 147 第 5 章 数据访问层 第 5 章 数据访问层 149 5.1 数据库从单机到分布式的挑战和应对 149 5.1.1 从应用使用单机数据库开始 149 5.1.2 数据库垂直/水平拆分的困难 150 5.1.3 单机变为多机后,事务如何处理 152 5.1.4 多机的 Sequence 问题与处理 165 5.1.5 应对多机的数据查询 168 5.2 数据访问层的设计与实现 174 5.2.1 如何对外提供数据访问层的功能 17
16、4 5.2.2 按照数据层流程的顺序看数据层设计 177 5.2.3 独立部署的数据访问层实现方式 192 5.2.4 读写分离的挑战和应对 194 5.3 总结 200 第 6 章 消息中间件 第 6 章 消息中间件 203 6.1 消息中间件的价值 203 6.1.1 消息中间件的定义 203 6.1.2 透过示例看消息中间件对应用的解耦 204 6.2 互联网时代的消息中间件 208 6.2.1 如何解决消息发送一致性 209 6.2.2 如何解决消息中间件与使用者的强依赖问题 218 6.2.3 消息模型对消息接收的影响 222 6.2.4 消息订阅者订阅消息的方式 229 目录 大型网站系统与 Java 中间件实践 XII6.2.5 保证消息可靠性的做法 230 6.2.6 订阅者视角的消息重复的产生和应对 245 6.2.7 消息投递的其他属性支持 249 6.2.8 保证顺序的消息队列的设计 252 6.2.9 Push 和 Pull 方式的对比 257 第 7 章 软负载中心与集中配置管理 第 7 章 软负载中心与集中配置管理 259 7.1 初识软负载中心 259 7