一次目录权限导致的ssh无法连接问题

问题 初步排查 发现问题 原因 修复 总结 问题 之前通过密钥能正常连接ssh的linux机器,现在无法连接 ❯ ssh ws root@ws: Permission denied (publickey). 初步排查 ~/.ssh/authorized_keys中检查公钥,发现还在且无误 /etc/ssh/sshd_config中检查ssh服务的配置,发现和常用的配置并无区别 检查

- 阅读全文 -

一次使用linux硬链接的场景记录

背景 场景 解决 参考 背景 之前学习过linux的链接分为软链接和硬链接,软链接就像Windows下的快捷方式一样,很好理解也比较常用。 但是硬链接的使用场景至今从未亲自遇到过。今天遇到了必须用硬链接的一个场景,特地记录下来。 场景 在k8s pod中有一个容器,通过volume mount,把节点上的/usr/local/bin目录mount到容器中,以期能够直接使用node上的一些二进制

- 阅读全文 -

手动配置NUMA Node的大页内存

背景 numa开启时大页内存的基本分配逻辑 大页内存超分 用户态接口的重复问题 大页内存分配策略 配置实测 参考 背景 机器开启了numa支持 通过内核启动参数配置了大页内存 通过以上两点,可以简单地实现预留大页内存,供linux中的一些特殊应用,或者k8s中pod去申请。 但是在开启了numa支持时,大页内存的细节也会更复杂一些。本文档基于大页内存的内核官方文档,摘选出大页和numa相关

- 阅读全文 -

大页内存配置不生效问题

问题 排查 多numa node下的大页内存 按numa node手工配置大页内存 同时设置 解决 参考 问题 一个其他部门的同事用我们的部署包安装了k8s集群,需要配置大页内存150GB,但是在群里反馈说修改大页内存配置无效,启动后总是只有70GB大页内存。于是求助。 排查 正常配置大页内存的方式是在/etc/default/grub中修改内核的启动参数,在其中加入类似default_h

- 阅读全文 -

基于nohz_full的内核CPU隔离

part1:问题背景 part2:解决方案(理论) part3:解决方案(实践) part4:为清理工作保留核心 part5:实操案例 part6:故障排除 参考 以下摘要大部分由chatgpt生成,然后人工补充了一些遗漏的关键部分 part1:问题背景 本博客是SUSE实验室团队探索内核CPU隔离和其中的核心组件Full Dynticks(或Nohz Full)的技术系列的第一篇。

- 阅读全文 -