kubeedge-部署篇

云端组件 边缘组件 处理daemonset 为边缘节点增加污点 启用kubectl logs/exec功能 metrics server修改 排障 调度pod验证安装 参考 云端组件 云端环境kubernetes 1.21.6 直接使用helm chart部署cloudcore即可 需要注意证书的ip和域名配置。如果首次部署出现了问题,需要手动删除kubeedge命名空间下的secret以重新

- 阅读全文 -

kubelet非最佳配置导致的系统频繁OOM问题排查与解决

问题 排查 解决 取消kubelet对system.slice的硬限 重新配置system.slice的硬限 总结 参考 问题 开发环境集群中的业务pod每天频繁更新重建,最近发现部分节点出现以下问题: pod经常在创建时提示runc/pod sandbox相关的错误 想登陆节点时发现ssh也连不上节点 某个节点上的系统pod以及业务pod中的微服务均会出现不稳定的状态 node的状态会

- 阅读全文 -

基于operator-sdk的kubernetes-operator实现

简介 准备工作 控制器实现 触发 父子关系 增删改查 状态维护 幂等性 协调结果 本地调试 集群部署 集群卸载 参考 简介 本文基于operator-sdk,实现一个简单的operator,一方面学习和了解operator,另一方面通过该operator实现一个简单的功能:对于符合名称前缀的一系列命名空间,约束某些命名空间的deployment replica为0,仅允许白名单里的name

- 阅读全文 -

基于kubernetes调度框架的自定义调度器实现-优化篇

简介 framework.Handle kubectl top 实现 简介 上一篇中实现了一个kubernetes调度框架的调度插件。虽然功能已经可用,但是其核心打分阶段使用了裸奔的http库直接去请求prometheus api,没有充分地利用kubernetes集群的能力,稍显笨拙。本文在上篇所实现的调度插件基础上,探索利用kubernetes原生能力获取节点内存用量,优化调度插件。 fr

- 阅读全文 -