<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>Kubernetes 深度原理实战 on Zhao Xue</title><link>https://xuezhaojun.github.io/collections/k8s-internals/</link><description>Recent content in Kubernetes 深度原理实战 on Zhao Xue</description><generator>Hugo</generator><language>en-us</language><lastBuildDate>Fri, 24 Apr 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://xuezhaojun.github.io/collections/k8s-internals/index.xml" rel="self" type="application/rss+xml"/><item><title>从一次 Webhook 拖垮集群聊起：彻底搞懂 K8s 架构设计</title><link>https://xuezhaojun.github.io/collections/k8s-internals/k8s-architecture/</link><pubDate>Fri, 24 Apr 2026 00:00:00 +0000</pubDate><guid>https://xuezhaojun.github.io/collections/k8s-internals/k8s-architecture/</guid><description>一个 MutatingAdmissionWebhook 后端挂掉导致整个集群&amp;rsquo;假死&amp;rsquo;，排查过程串联起 K8s 所有核心组件的职责与协作：API Server 的请求处理链、etcd 的唯一真相源角色、Controller Manager 的 Reconcile 循环、Scheduler 的选房策略、Kubelet 的工地执行、kube-proxy 的网络粘合。</description></item><item><title>从一次 Reconcile 风暴聊起：彻底搞懂 K8s Controller 和 Operator 模式</title><link>https://xuezhaojun.github.io/collections/k8s-internals/k8s-controller/</link><pubDate>Fri, 24 Apr 2026 00:00:00 +0000</pubDate><guid>https://xuezhaojun.github.io/collections/k8s-internals/k8s-controller/</guid><description>200+ 集群同时断连后重连，固定 RequeueAfter 绕过指数退避导致 API Server 雪崩。排查过程揭开 Controller 核心机制的全部秘密：Informer 的 List-Watch、DeltaFIFO、Indexer 缓存、WorkQueue 限速策略，以及 Operator 模式的工程哲学。</description></item><item><title>从一次 CR 删不掉聊起：彻底搞懂 CRD、Finalizer 和 Webhook</title><link>https://xuezhaojun.github.io/collections/k8s-internals/k8s-crd/</link><pubDate>Fri, 24 Apr 2026 00:00:00 +0000</pubDate><guid>https://xuezhaojun.github.io/collections/k8s-internals/k8s-crd/</guid><description>kubectl delete 某个 CR 后一直卡在 Terminating，&amp;ndash;force 也无效。排查过程串联 CRD 的设计哲学：自定义资源如何在 API Server 中&amp;rsquo;活起来&amp;rsquo;、Finalizer 如何保证安全清理、Webhook 如何扩展准入控制，以及那些让人抓狂的版本迁移坑。</description></item><item><title>从一次 database space exceeded 聊起：彻底搞懂 etcd 在 K8s 中的角色</title><link>https://xuezhaojun.github.io/collections/k8s-internals/k8s-etcd/</link><pubDate>Fri, 24 Apr 2026 00:00:00 +0000</pubDate><guid>https://xuezhaojun.github.io/collections/k8s-internals/k8s-etcd/</guid><description>管理 200+ 集群时 CR 大量累积触发 etcd space quota，所有写操作报 mvcc: database space exceeded。排查过程揭开 etcd 的全部秘密：Raft 共识如何保证一致性、MVCC 如何实现乐观并发控制、watch 如何驱动整个 K8s 事件循环，以及 compaction 和 defrag 为什么要分两步。</description></item><item><title>从一次 Pod Pending 但节点资源充足聊起：彻底搞懂 K8s 调度器原理</title><link>https://xuezhaojun.github.io/collections/k8s-internals/k8s-scheduler/</link><pubDate>Fri, 24 Apr 2026 00:00:00 +0000</pubDate><guid>https://xuezhaojun.github.io/collections/k8s-internals/k8s-scheduler/</guid><description>kubectl describe pod 显示 0/5 nodes available: Insufficient cpu，但 kubectl top nodes 显示 CPU 使用率才 30%。排查过程揭开调度器的全部秘密：Scheduler Framework 的完整扩展点链、Filter 和 Score 的内置插件、抢占机制、以及 TopologySpread 的死锁陷阱。</description></item><item><title>从一次滚动更新 502 聊起：彻底搞懂 Pod 生命周期与容器运行时</title><link>https://xuezhaojun.github.io/collections/k8s-internals/k8s-pod-lifecycle/</link><pubDate>Fri, 24 Apr 2026 00:00:00 +0000</pubDate><guid>https://xuezhaojun.github.io/collections/k8s-internals/k8s-pod-lifecycle/</guid><description>滚动更新时出现 502/504 错误，旧 Pod 收到 SIGTERM 后立即关闭端口，但 iptables 规则还没更新完。排查过程串联 Pod 的完整生命周期：从 Pending 到 Running 的每一步、三种 Probe 的设计哲学、优雅终止的并行竞态、以及 CRI 容器运行时的调用链。</description></item><item><title>从一次 Service Endpoints 为空聊起：彻底搞懂 K8s 网络模型</title><link>https://xuezhaojun.github.io/collections/k8s-internals/k8s-networking/</link><pubDate>Fri, 24 Apr 2026 00:00:00 +0000</pubDate><guid>https://xuezhaojun.github.io/collections/k8s-internals/k8s-networking/</guid><description>curl Service 超时，kubectl get endpoints 返回空列表。排查过程串联 K8s 整个网络模型：Pod 网络的三个基本原则、Service 的四种类型和 kube-proxy 实现、Ingress 的 L7 路由、NetworkPolicy 的白名单语义陷阱，以及 DNS ndots:5 的性能坑。</description></item><item><title>从一次 pods/exec forbidden 聊起：彻底搞懂 K8s RBAC 权限模型</title><link>https://xuezhaojun.github.io/collections/k8s-internals/k8s-rbac/</link><pubDate>Fri, 24 Apr 2026 00:00:00 +0000</pubDate><guid>https://xuezhaojun.github.io/collections/k8s-internals/k8s-rbac/</guid><description>kubectl get pods 正常，但 kubectl exec 报 forbidden: cannot create resource pods/exec。排查过程揭开 RBAC 的全部细节：Role 和 ClusterRole 的作用域、Binding 的组合关系、ServiceAccount 的 Token 演进、子资源权限的隐藏坑，以及多租户隔离的最佳实践。</description></item><item><title>从管理 200+ 集群的实战经验聊起：K8s 多集群架构设计与性能优化</title><link>https://xuezhaojun.github.io/collections/k8s-internals/k8s-multi-cluster/</link><pubDate>Fri, 24 Apr 2026 00:00:00 +0000</pubDate><guid>https://xuezhaojun.github.io/collections/k8s-internals/k8s-multi-cluster/</guid><description>5 年 ACM 多集群管理经验的系统总结：Hub-Spoke vs 联邦架构的本质区别、ManifestWork 资源分发与 Placement 调度的设计、CSR 注册与反向隧道网络互通、以及管理 200+ 集群时遇到的真实性能挑战和优化方案。</description></item></channel></rss>