祥积宫 无限进步
技术实战 · 生活记录 · 光影收藏

祥积宫的博客

无限进步

虚拟化与云计算 Linux 与运维排障 Kubernetes 与容器 摄影与生活记录

把复杂问题讲清楚,把一线经验整理成真正能复用的文字资产。

祥积宫
祥积宫 联系我 / About

把真实环境里的排障、迁移、修复和复盘,整理成可以回看的经验。

126 文章
15 分类
24 标签
从 Prompt Engineering 到 Harness Engineering

Ai 技术

从 Prompt Engineering 到 Harness Engineering

一、为什么最近大家都在聊HarnessEngineering如果你最近在看AIAgent相关视频、文章或技术分享,你大概率会发现一个现象:前几年大家在讨论PromptEngineering,后来开始讨论RAG、ContextEngineering,而最近越来越多人开始讨论HarnessEnginee

【DB2 数据库】06 模拟故障排查系列:表空间容器不可访问(权限异常)实验

DB2数据库

【DB2 数据库】06 模拟故障排查系列:表空间容器不可访问(权限异常)实验

一、这篇文章要解决什么问题前面的几篇实验,我已经把表空间容量这一条线基本讲完整了:表空间打满ADD扩容EXTEND扩容AUTORESIZE自动扩容但在真实运维里,表空间出问题并不只有“空间不够”这一种情况。还有一类非常典型、也非常容易让人一开始看懵的故障:表空间的底层容器文件还在,但DB2突然不让访

【DB2 数据库】08 模拟故障排查系列:事务日志打满(LOG FULL)实验

DB2数据库

【DB2 数据库】08 模拟故障排查系列:事务日志打满(LOG FULL)实验

一、这篇文章要解决什么问题前面的几篇实验,我已经把“表空间”和“容器”这一条线讲得比较完整了:表空间打满ADD/EXTEND/AUTORESIZE容器权限异常容器路径异常但在真实值班里,比“容器异常”更常见的一类故障,其实是:事务日志打满这类问题的典型现象通常是:SQL突然失败但磁盘不一定满表空间也

【DB2 数据库】05 模拟故障排查系列:表空间自动扩容(AUTORESIZE)实验

DB2数据库

【DB2 数据库】05 模拟故障排查系列:表空间自动扩容(AUTORESIZE)实验

一、这篇文章要解决什么问题前面的实验里,我已经分别验证了两种手工扩容方式:ADDEXTEND但在真实运维里,除了手工扩容,还经常会碰到另外一个问题:表空间能不能自己长大?这篇文章要解决的就是这个问题。这次我单独创建了一个新的小表空间TS3,专门验证下面3件事:开启AUTORESIZE后,表空间是否真

【DB2 数据库】07 模拟故障排查系列:表空间容器不可访问(路径异常)实验

DB2数据库

【DB2 数据库】07 模拟故障排查系列:表空间容器不可访问(路径异常)实验

一、这篇文章要解决什么问题上一篇文章里,我已经验证了这样一类故障:容器文件还在,但权限被改坏,DB2无法访问。但在真实运维里,除了权限异常,还有另一类非常常见的故障:DB2记录中的容器路径还在,但操作系统上的那个文件路径已经失效了。比如:文件被误改名文件被挪走挂载点异常后,原路径下不再是原来的容器文

【DB2 数据库】03 模拟故障排查系列:表空间打满后的扩容与恢复

DB2数据库

【DB2 数据库】03 模拟故障排查系列:表空间打满后的扩容与恢复

一、这篇文章要解决什么问题上一篇文章中,我已经通过一个很小的DMS表空间TS2,成功复现了“表空间被打满”的故障现象。这一篇文章继续沿着同一个实验环境往下做,重点解决下面几个问题:表空间打满之后,如何判断故障还在表空间打满之后,如何通过扩容恢复扩容前后应该重点观察哪些指标为什么扩容后Highwate

【DB2 数据库】01 模拟故障排查系列:从零搭建TESTDB并理解表空间与Schema

DB2数据库

【DB2 数据库】01 模拟故障排查系列:从零搭建TESTDB并理解表空间与Schema

一、这篇文章解决什么问题这篇文章不是单纯记录“怎么创建一个数据库”,而是基于一次真实实验,把下面几个初学时最容易混淆的问题一次理顺:DB2实例、数据库、Schema、表空间,到底是什么层级关系新建数据库后,表默认落在哪个表空间为什么生产环境通常不会长期直接用默认USERSPACE1如何手工创建独立表

【DB2 数据库】02 模拟故障排查系列:构造TS2表空间打满并恢复

DB2数据库

【DB2 数据库】02 模拟故障排查系列:构造TS2表空间打满并恢复

一、这篇文章要解决什么问题在DB2日常运维里,“表空间打满”是非常常见、也非常适合拿来做入门演练的一类故障。这一篇文章基于真实实验,完整复现了下面这个过程:手工创建一个很小的表空间TS2在TS2中创建测试表T3持续插入大字段数据,直到表空间被打满观察表空间打满时的状态删除测试表后,验证空间是否恢复可

【DB2 数据库】04 模拟故障排查系列:表空间扩容方式对比(ADD、EXTEND)

DB2数据库

【DB2 数据库】04 模拟故障排查系列:表空间扩容方式对比(ADD、EXTEND)

一、这篇文章要解决什么问题在前两篇关于TS2的实验里,我已经分别完成了:表空间打满通过ADD新容器恢复但在实际运维中,“表空间扩容”并不只有一种方式。最常见、也最容易混淆的两种方式就是:ADDEXTEND这篇文章的目标,就是基于真实实验,把这两种扩容方式彻底区分开:ADD到底加了什么EXTEND到底

VMware vSAN 节点存储链路故障分析报告

VMware

VMware vSAN 节点存储链路故障分析报告

一、事件概述2026年4月3日凌晨(UTC06:09起),vSAN集群节点esxi04在运行过程中突发存储I/O链路级故障,导致直连SAS磁盘设备出现介质错误(MediumError)、I/O超时以及命令被强制取消等连锁反应。由于该主机处于vSAN集群中,故障磁盘是vSAN分布式存储池的组成部分,本

【ESXi】记一次 ESXi 8.0 挂载 USB 3.1 设备导致宿主机卡死、配置丢失的排查全过程

VMware

【ESXi】记一次 ESXi 8.0 挂载 USB 3.1 设备导致宿主机卡死、配置丢失的排查全过程

最近在ESXi8.0.2环境下折腾一台Windows虚拟机(模板机)时,遇到了一个极其诡异且折磨人的大坑。为了挂载一个USB3.1的U盘,差点把整个宿主机的管理服务给干崩了。在这里复盘并记录一下排查过程,希望能帮到遇到类似灵异事件的朋友。🎯诡异的故障现象起初只是想给虚拟机直通一个慧荣主控的U盘,结

【DB2 数据库】00 模拟故障排查系列:环境准备

DB2数据库

【DB2 数据库】00 模拟故障排查系列:环境准备

这篇文章用于搭建一套可重复使用的DB2故障演练环境,目标不是单纯把数据库装起来,而是提前把数据盘、备份盘和用户体系准备好,方便后续继续做故障模拟与恢复练习。背景因为工作需要学习DB2数据库运维,但生产环境不适合频繁制造故障,所以更合理的方式是先搭一套测试环境,再手动模拟问题进行演练。环境说明系统版本

vSAN 提示磁盘不合格

vSAN

vSAN 提示磁盘不合格

在配置vSAN磁盘组时,如果页面里提示某块磁盘“不合格且未声明”,通常说明这块盘当前状态不满足vSAN的接管条件。实验环境里比较常见的原因,是磁盘上还残留着原有分区或其他历史数据。背景在所有环境中搜索VSANCLUSTER操作咖啡更新数据存储配置摘要主机网络权限虚拟机喷10.0.0.251磁盘管理服

【vCenter】VMware 克隆失败分析报告

运维技术

【vCenter】VMware 克隆失败分析报告

这篇文章不是常规的“解决步骤记录”,而是一份基于现场日志和后续分析整理出来的克隆失败排障报告。重点不在于给出一条立即可执行的命令,而在于把问题是如何一步步收敛出来的说明白。1.事件背景反馈在vCenter中克隆虚拟机VM-业务系统-A时失败,前台报错为:无法完成文件.../VM-业务系统-A_12-

12 9