做自己的靠山 發表於 2015-8-10 16:11:27

技术解决方案专享 突然500万人的访问量来查台风怎么破?

<p><strong>前言</strong></p>
<p>台风苏迪罗于8月8日登陆我国沿海,台湾、福建、江西、浙江、安徽、江苏等地均受到影响。</p>
<p>&ldquo;台风到哪里了&rdquo;,这两天又成了一个全民话题。</p>
<p>浙江省水利厅研发的台风路径实时发布系统,可以让任何一个人都能通过网络及时了解台风信息。</p>
<p>台风的季节性反应在IT系统上,是访问量波峰和波谷的巨大差异。</p>
<p>随着关注度的提升,这种差异被不断拉大。台风来的时候需要紧急扩容,台风走了机器就闲置了。冗长的采购扩容流程和机器的复用问题难以解决。</p>
<p>2012年,浙江省水利厅选择将系统迁移到阿里云上,借助云计算的弹性应对巨大的峰谷差异。</p>
<p>台风带来的苦恼</p>
<p>服务器无法灵活的增删</p>
<p>先看一下网站近些年的业务量变化情况(由于缺少2012年及之前的数据故只能用现在的数据来让大家有个直观的感受):</p>
<p>2012年&ldquo;海葵&rdquo;期间峰值PV达到350W,UV达到120W</p>
<p>2015年&ldquo;灿鸿&rdquo;期间峰值PV达到1434W,UV达到508W</p>
<p>这些业务高峰基本上都是每年的7月至10月间产生的,其余时间网站访问量只有几千。对,没错,就是几千。</p>
<p>从数据来看,三年时间网站的关注度有了近5倍的增长。</p>
<p>与之对应的服务器数量,也是随着季节变化而变化。</p>
<p>比如平常只需要2台服务器即可,但是台风来了就需要增加到12台,那么10台物理机采购就需要近30W块,但是台风过后这10台物理机又没有任何负载了,怎么安置他们又是个问题。</p>
<p>未来,这一问题可能还会进一步加剧。</p>
<p><strong>运维成本太高</strong></p>
<p>由于浙江省水利厅内部IT平台较多,人员较少,没有办法安排专门的运维工程师和DBA来支持台风网站,平时都是由开发人员来兼职。</p>
<p>需要每个月基于网站的访问情况和历史数据,对平台服务器数量进行评估、调整,人力和工作量较大。</p>
<p>如果产品可以承担大部分的运维工作,做到自动化处理服务器的增删,数据库的备份等工作,那么将大大的节省了成本,并且能将更多的精力集中在台风平台的优化、业务逻辑优化上。</p>
<p><strong>攻击无解</strong></p>
<p>普通的IDC和自建机房最怕的就是大流量DDoS攻击,这种攻击会导致机房出口线路拥塞,影响该机房所有用户和业务。</p>
<p>综上所述,显然这种传统的处理方式反应速度太慢。对于台风路径实时发布系统这种灾害预警网站,如果长时间无法打开,容易影响到台风期间大家的日常生活安排。</p>
<p>毕竟现在通过手机就可以第一时间获取最新的台风位置等信息,非常便捷。</p>
<p><strong>云计算如何应对台风</strong></p>
<p>第一阶段</p>
<p>之前传统的方式会经常遇到&ldquo;平常时刻好用不要用,关键时刻想用不能用&rdquo;的尴尬局面。</p>
<p>于是浙江省水利厅在2012年做出创新,将台风网站迁入阿里云,当时主要考虑到平稳上云,所以并未对网站架构等做大量调整。当初仅使用了阿里云的云服务器(ECS)、负载均衡(SLB)和开放存储服务(OSS)产品。</p>
<p>上云之后,浙江省水利厅确实体会到了按量购买、快速调整的便利性,再无之前的顾虑。</p>
<p>当时的网站架构简单的描述如下:</p>
<p><span><img width="32" height="32" alt="" src="https://img.jbzj.com/file_images/article/201508/taifeng/taifeng1336.png" /><img width="554" height="382" alt="" src="https://img.jbzj.com/file_images/article/201508/taifeng/taifeng1339.png" /></span></p>
<p>经过这样的改造后,当年网站仅用5台云服务器就成功的支撑了峰值350W的访问量。</p>
<p>第二阶段</p>
<p>台风网站下一步需要对外提供移动端的支持,一旦移动端开放了,那么访问量将会剧增,毕竟移动端的便利性是PC端无法比拟的。</p>
<p>同时台风网站初次改版上云后发现使用开放存储服务(OSS)来做台风路径数据、云图数据的中转还是会有延时的问题。</p>
<p>于是,浙江省水利厅又再次对网站架构及产品使用上做了如下调整:</p>
<p><img width="554" height="470" alt="" src="https://img.jbzj.com/file_images/article/201508/taifeng/taifeng1537.png" /><span><img width="32" height="32" alt="" src="https://img.jbzj.com/file_images/article/201508/taifeng/taifeng1562.png" /></span></p>
<p>云服务器(ECS)里的网站环境部署及网站代码调整优化,与数据盘解耦,软件及数据全部放置到系统盘。</p>
<p>使用该系统盘制作自定义镜像,后面扩容机器即可使用自定义镜像快速扩容无需重新配置环境和拷贝网站数据。</p>
<p>启用弹性伸缩服务(ESS),对同一角色的服务器性能评估并在SLB中自动完成扩容、缩容,解放人力、提升效率。</p>
<p>将台风路径数据从开放存储服务(OSS)里迁移到云数据库(RDS)中。可以保证各WEB服务器获取到的台风路径数据的实时性和一致性。</p>
<p>由于台风路径数据同步周期为1个小时及以上,所以网站前端机没有必要每次访问都调用数据库。在网站前端机中配置缓存,节省数据库的资源,提升网站访问体验。</p>
<p>经过这样改造后,今年&ldquo;灿鸿&rdquo;期间,峰值PV达到1434W,UV超过500万,其中有1000W的访问量来至于移动端。</p>
<p>第三阶段</p>
<p>台风期间使用高防IP功能</p>
<p>高防IP是将大量攻击用户的流量引入到高防平台,由平台进行分析过滤,将正常的请求转发给真实的业务服务器。</p>
<p>阿里云安全品牌云盾的DDoS高防IP是东半球最大的高防中心,防御DDoS、CC攻击。用户无需部署,支持一键弹性升级防御量。</p>
<p>网站架构持续优化</p>
<p>&ldquo;灿鸿&rdquo;期间的峰值PV里有70%的流量是来自于移动端,且网站的访问量增长剧烈。</p>
<p>需要结合阿里云更多的产品,对自身架构上做些改造以应对未来的高速发展。</p>
<p>备注</p>
<p>云服务器(ECS)</p>
<p>一种简单高效,处理能力可弹性伸缩的计算服务助您快速构建更稳定、安全的应用。</p>
<p>提升运维效率,降低IT成本。</p>
<p>负载均衡(SLB)</p>
<p>对多台云服务器进行流量分发的负载均衡服务。</p>
<p>SLB可以通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。</p>
<p>开放存储服务(OSS)</p>
<p>对外提供的海量、安全和高可靠的云存储服务。</p>
<p>RESTFul&nbsp;API的平台无关性,容量和处理能力的弹性扩展,按实际容量付费真正使您专注于核心业务。</p>
<p>弹性伸缩服务(ESS)</p>
<p>根据用户的业务需求和策略,自动调整其弹性计算资源的管理服务。</p>
<p>其能够在业务增长时自动增加ECS实例,并在业务下降时自动减少ECS实例。</p>
<p>云数据库(RDS)</p>
<p>是构建在SSD盘上,完全兼容MySQL,SQLServer,PostgreSQL协议的关系型数据库服务。</p>
<p>采取主从双机热备架构,具有多重安全防护措施和完善的性能监控体系,并提供专业的数据库备份、恢复及优化方案。</p>
<p>开放缓存服务(OCS)</p>
<p>是在线缓存服务,为热点数据的访问提供高速响应。</p>
<p>高防DDoS专家服务</p>
<p>是一项防御DDoS攻击的托管服务。</p>
<p>主要内容包括:防护策略托管、攻击实时监控与及时通知用户、阶段性网络威胁分析报告和用户重大活动安全保障。</p>
<p>更多云产品:<a target="_blank" href="http://click.aliyun.com/m/1332/">http://click.aliyun.com/m/1332/</a></p>
頁: [1]
查看完整版本: 技术解决方案专享 突然500万人的访问量来查台风怎么破?