CAP原理和BASE思想

发布时间: 更新时间: 总字数:928 阅读时间:2m 作者: 分享 复制网址
专栏文章
  1. CAP原理和BASE思想(当前)
  2. CentOS 6.6编译libvirt-0.10.2支持Ceph Pool
  3. Ceph 源码构建与安装
  4. Ceph 介绍及对接 qemu 和 Ceph 命令
  5. Ceph 数据端到端的正确性保证和Scrub机制
  6. 日志文件系统 -- Journaling file system

转载写的比较好的文章:CAP 原理和 BASE 思想。

分布式领域 CAP 理论

  • Consistency(一致性), 数据一致更新,所有数据变动都是同步的
  • Availability(可用性), 好的响应性能
  • Partition tolerance(分区容错性) 可靠性

定理:任何分布式系统只可同时满足二点,没法三者兼顾。

忠告:架构师不要将精力浪费在如何设计能满足三者的完美分布式系统,而是应该进行取舍。

关系数据库的 ACID 模型拥有 高一致性 + 可用性 很难进行分区:

  • Atomicity 原子性:一个事务中所有操作都必须全部完成,要么全部不完成。
  • Consistency 一致性. 在事务开始或结束时,数据库应该在一致状态。
  • Isolation 隔离层. 事务将假定只有它自己在操作数据库,彼此不知晓。
  • Durability. 一旦事务完成,就不能返回。

跨数据库事务:2PC (two-phase commit), 2PC is the anti-scalability pattern (Pat Helland) 是反可伸缩模式的,JavaEE 中的 JTA 事务可以支持 2PC。因为 2PC 是反模式,尽量不要使用 2PC,使用 BASE 来回避。

BASE 模型反 ACID 模型,完全不同 ACID 模型,牺牲高一致性,获得可用性或可靠性:

  • Basically Available 基本可用。支持分区失败(e.g. sharding 碎片划分数据库)
  • Soft state 软状态 状态可以有一段时间不同步,异步。
  • Eventually consistent 最终一致,最终数据是一致的就可以了,而不是时时高一致。

BASE 思想的主要实现

1.按功能划分数据库

2.sharding 碎片

BASE 思想主要强调基本的可用性,如果你需要 High 可用性,也就是纯粹的高性能,那么就要以一致性或容错性为牺牲,BASE 思想的方案在性能上还是有潜力可挖的。

现在 NoSQL 运动丰富了拓展了 BASE 思想,可按照具体情况定制特别方案,比如忽视一致性,获得高可用性等等,NOSQL 应该有下面两个流派:

  1. Key-Value 存储,如 Amaze Dynamo 等,可根据 CAP 三原则灵活选择不同倾向的数据库产品。

  2. 领域模型 + 分布式缓存 + 存储 (Qi4j 和 NoSQL 运动),可根据 CAP 三原则结合自己项目定制灵活的分布式方案,难度高。

这两者共同点:都是关系数据库 SQL 以外的可选方案,逻辑随着数据分布,任何模型都可以自己持久化,将数据处理和数据存储分离,将读和写分离,存储可以是异步或同步,取决于对一致性的要求程度。

不同点:NOSQL 之类的 Key-Value 存储产品是和关系数据库头碰头的产品 BOX,可以适合非 Java 如 PHP RUBY 等领域,是一种可以拿来就用的产品,而领域模型 + 分布式缓存 + 存储是一种复杂的架构解决方案,不是产品,但这种方式更灵活,更应该是架构师必须掌握的。

专栏文章
  1. CAP原理和BASE思想(当前)
  2. CentOS 6.6编译libvirt-0.10.2支持Ceph Pool
  3. Ceph 源码构建与安装
  4. Ceph 介绍及对接 qemu 和 Ceph 命令
  5. Ceph 数据端到端的正确性保证和Scrub机制
  6. 日志文件系统 -- Journaling file system
最新评论
加载中...
Home Archives Categories Tags