混沌工程与系统稳定性设计模式

案例来源:ThoughtWorks
会议地点:深圳
分享时间: 2019-06-22 10:00-11:00

伍斌  |

ThoughtWorks 技术教练

能辅导软件开发团队又快又好地交付软件的ThoughtWorks技术教练。因搞编程道场,人称“道长”。经常在简书上撰写敏捷开发相关的博客,署名“吾真本”。 工作20多年,做过开发、测试、项目管理、技术教练。《驯服烂代码》作者,《Release It!》(第2版)、《优质代码》和《测试驱动数据库开发》译者。

课程概要

背景介绍:
混沌工程是什么?有什么价值?如何将系统设计得能在生产环境上抵御“混沌猴”的攻击和不可预知的灾难?

解决思路/成功要点:
不要止步于所发现的“根本原因”,简单地惩罚替罪羊了事。因为大部分现实问题都是非线形问题,既无法预测,又不易发现导致异常结果的细微原因
用所发现的“根本原因”作为启发,本着“不信有好事”和“能在局部破坏下实现自愈”的设计原则,进行系统的稳定性设计,把分布式系统各个子服务打造成“明哲自保”的自治子系统,从而维持整个系统的稳定性。

成果:
某金融公司的业务系统出现客户登录异常事故,重启了各种服务,排查了9个小时才发现是一台外部证书注册审批系统死机的问题。而这个问题可以使用超时、断路器和快速失败的系统稳定性模式来解决。

听众收益

1、了解什么是混沌工程
2、了解为什么要做混沌工程
3、了解系统稳定性设计的模式和反模式,来应对“混沌猴”的攻击和生产环境中不可预知的灾难

伍斌  |

ThoughtWorks
技术教练

能辅导软件开发团队又快又好地交付软件的ThoughtWorks技术教练。因搞编程道场,人称“道长”。经常在简书上撰写敏捷开发相关的博客,署名“吾真本”。 工作20多年,做过开发、测试、项目管理、技术教练。《驯服烂代码》作者,《Release It!》(第2版)、《优质代码》和《测试驱动数据库开发》译者。

课程概要

背景介绍:
混沌工程是什么?有什么价值?如何将系统设计得能在生产环境上抵御“混沌猴”的攻击和不可预知的灾难?

解决思路/成功要点:
不要止步于所发现的“根本原因”,简单地惩罚替罪羊了事。因为大部分现实问题都是非线形问题,既无法预测,又不易发现导致异常结果的细微原因
用所发现的“根本原因”作为启发,本着“不信有好事”和“能在局部破坏下实现自愈”的设计原则,进行系统的稳定性设计,把分布式系统各个子服务打造成“明哲自保”的自治子系统,从而维持整个系统的稳定性。

成果:
某金融公司的业务系统出现客户登录异常事故,重启了各种服务,排查了9个小时才发现是一台外部证书注册审批系统死机的问题。而这个问题可以使用超时、断路器和快速失败的系统稳定性模式来解决。

听众收益

1、了解什么是混沌工程
2、了解为什么要做混沌工程
3、了解系统稳定性设计的模式和反模式,来应对“混沌猴”的攻击和生产环境中不可预知的灾难

CopyRight © 2008-2019 Msup & 高可用架构