从一次 Reconcile 风暴聊起:彻底搞懂 K8s Controller 和 Operator 模式

200+ 集群同时断连后重连,固定 RequeueAfter 绕过指数退避导致 API Server 雪崩。排查过程揭开 Controller 核心机制的全部秘密:Informer 的 List-Watch、DeltaFIFO、Indexer 缓存、WorkQueue 限速策略,以及 Operator 模式的工程哲学。

April 24, 2026 · 8 min · Zhao Xue

从一次 CR 删不掉聊起:彻底搞懂 CRD、Finalizer 和 Webhook

kubectl delete 某个 CR 后一直卡在 Terminating,–force 也无效。排查过程串联 CRD 的设计哲学:自定义资源如何在 API Server 中’活起来’、Finalizer 如何保证安全清理、Webhook 如何扩展准入控制,以及那些让人抓狂的版本迁移坑。

April 24, 2026 · 13 min · Zhao Xue