日前,263完成了对企业邮箱系统的全面升级与合并工作,涉及超过十万企业用户,数百万商务个人,这对于一家牢牢占据企业邮箱市场份额第一的服务型企业来说,要保证所用用户平稳、无感知的过渡到新xmail系统及云存储平台,是一项浩大的系统工程。对此,我们与263邮件应用开发部资深部门经理李志涛面对面,深喉探访263企业邮箱系统升级、整合之路。
系统改造化繁为简,合并前问题都解决
263企业邮箱的市场份额连续15年保持第一,用户数据量之大可想而知。据悉,此次263企业邮箱系统改造是从2013年12月启动。对于合并之前的状况,李志涛表示:“系统合并前是三个独立系统,运行规则以及程序版本都是多套,即以前的1套、2套和3套系统。开发与维护工作量非常大,需多套兼顾,管理起来非常不便,且维护成本成倍增加。”
的确,作为三套独立的系统,资源配置存在差异性,导致三个系统上的用户享受的资源不均等,常会出现1套用户向2套迁移等现象。并且,三个系统上的用户配置也是不同的,使得用户使用起来也非常不便。而3套系统合并后,无论是在管理运维方面还是在用户使用方面,都将大幅优化。
分阶段逐层“迁徙”,难点逐一攻破
据李志涛介绍,改造项目是从2013年12月启动,共分为三个阶段。第一阶段是邮件储存迁移。重点是将之前的淡季磁盘存放的邮件迁移到云储存平台,对邮件安全储存加大保障。迁往云端,是顺应发展与时俱进的必然之举,但是在现今数据量日益巨大的环境下,邮件的迁移成为了一道难点。
大数据量的迁移对接收程序的稳定性、准确性有较高要求,但同时对云储存平台的安全性、稳定性和处理性能的要求更高,进而对云储存平台可扩展性,动态扩容也提出了要求。
对于解决办法,李志涛表示:“系统设计除尽量考虑周全外,开发时采用交叉审查,即开发互相代码走查审阅对方的程序,测试和开发绑定,深入程序内部细节,精细测试每一个环节;另外,我们还将运维24小时备勤,及时查看迁移情况,有问题及时解决,确保迁移按时按量完成,以及数据准确性。最大限度降低对用户的影响,事实证明,紧密盯查下,我们做到了用户对改造波动无感知。”
第二阶段即业务合并,各套系统统一程序、统一配置,用户数据集中管理,功能服务集中,化繁为简。对于本阶段难点为二,一是在于旧系统规则多,个性化规则更多,调研难度大,工作量剧增,且无经验可参考。二是系统合并需改动模块,但有些模块只能合并当天才能上,并且线下不能复制线上环境,无法模拟演练,因此合并时有可能会出现不确定因素。
“项目组对此投入了相当大的人力物力,可谓群策群力之下一场紧张的‘战斗’。”李志涛提到人力投入时这样说。“产品团队此次集众人力量,做了细致入微的调研工作,每隔一段时间进行一次评审与沟通,不断沙盘演练模拟整个合并过程,记录每个合并细节,注意攻破、完成。为最大限度降低对用户的影响,反复论证合并策略,确保各模块有序进行。相关工作人员全部以合并工作为先,保证了此次合并的顺利与高效。”
第三阶段即域名统一。部署统一中枢,以均衡资源。此举主要是为客户IP加白,以及使用新域名。这个过程中客服人员承担的较多,投入更大的精力与人力,去通知数量庞大的客户。
系统合并极力“减震”,让客户无感知
系统做这么大的调整,可能最担心的就是客户端出现“震荡”。邮件收发不稳定、遗漏丢失都是很严重的问题。如何避免客户受到影响,也是李志涛团队细致去思考与解决的问题。
李志涛说道:“首先,团队执行过程中,选择的合并时间通常是空闲期,即周五晚上10点到早晨6点,大部分客户不使用系统的时段。其次对于时差客户,我们也提前通知到,尽量避开更新时间。最后对于更新的方案选择我们十分慎重,不能提前上线的模块讨论出最合理的更新方法,减少对用户的影响,并且在开发、测试、运维端全部备勤,便于立即处理异常。”
系统合并之后,用户配置客户端简单统一,并且所有用户都共享资源,系统资源更新可以统一、高效,杜绝资源不均的情况。如此新产品的新功能开发速度会大大提高,用户需求可以及时响应。最后,李志涛经理表示:“如此大规模的系统改造,一定是就用户利益出发而决心规划的,即一切为用户考虑,改造后用户都用上云存储,邮件存放更安全更高效,这也是用户关心的最大问题,也是我们所关心的最大问题。对待用户,必须用心,用户至上。”