从一次 database space exceeded 聊起:彻底搞懂 etcd 在 K8s 中的角色

管理 200+ 集群时 CR 大量累积触发 etcd space quota,所有写操作报 mvcc: database space exceeded。排查过程揭开 etcd 的全部秘密:Raft 共识如何保证一致性、MVCC 如何实现乐观并发控制、watch 如何驱动整个 K8s 事件循环,以及 compaction 和 defrag 为什么要分两步。

April 24, 2026 · 9 min · Zhao Xue