分布式基础
覆盖一致性、扩展性、高可用与容灾的基础权衡。
-
分布式基础(四):容灾-容错与灾难恢复
容灾是伞状概念,包含容错(Fault Tolerance)和灾难恢复(Disaster Recovery)。容错要求故障发生时零中断继续服务(用冗余掩盖故障);灾难恢复关注灾难后如何恢复(用备份和复制缩短恢复时间)。核心思想:故障不是"是否发生"而是"何时发生"——系统设计必须将故障视为常态。
-
分布式基础(三):高可用-通过冗余和自动故障转移消除单点故障
高可用 = 冗余(让故障不致命)+ 自动故障转移(让恢复足够快)。核心公式 Availability = MTBF / (MTBF + MTTR),降低 MTTR 的 ROI 远高于提高 MTBF,因为故障不可避免。每多一个 9,成本和复杂度指数级上升——大多数业务在 99.95%-99.99% 找到平衡点。
-
分布式基础(二):可扩展性-垂直扩展与水平扩展
可扩展性是"加资源后处理能力能否线性提升",不是"单次请求多快"(那是性能)。Amdahl 定律决定了串行瓶颈是理论天花板——加再多机器绕不过一把全局锁。正确路径:先垂直扩展 + 缓存(ROI 最高),瓶颈出现后再水平扩展(复杂度最高),每一步都由真实数据驱动而非预测。
-
分布式基础(一):一致性从强一致到最终一致的权衡光谱
"一致性"在 ACID/CAP/分布式模型中是三个完全不同的概念——ACID 的 C 是数据合法性,CAP 的 C 是线性一致性,分布式一致性模型是客户端可见性保证。选型的核心问题不是"要不要一致性",而是"业务能容忍多大程度的不一致"。默认从最弱开始,有明确理由才升级。