2025.11–2026.03实习相关整理-调用量存储与展示
背景 主调模块,被调模块,两种模块之间会有有向调用,要记录每对模块的每个有向调用每秒的调用量到数据库里,前端展示他们最近(一般最近一周/一天)的调用量曲线(粒度为分钟)。 实现 数据库里存 主调模块-被调模块 当作key,再存对应调用量数据的COS文件路径(需要查两次)。 COS文件按周拆分,告警分析是按周为一个周期的,每个COS文件最开头存了一个基数(就是一周第一秒的调用量值),后续就只用存差值【根据基数和差 值计算出调用量实际值】(节省1/3的空间),本来每次都要存几位数字(百万左右),现在只需要存2-3位(百左右)。 当上游通过消息队列推送过来的调用量数据中出现同一秒有两个值的数据...
2025.11–2026.03实习相关整理-实习中的工作
实现的优化 数据库表按时间分区,注意跨时间分区的处理 变更单的变更时间可能跨天,数据库表按天分区,处理时需注意 变更审计 判断已经关单和结单的变更单中哪些是有审批的?是否有关联对应计划链接? 判断上报的变更单有没有执行灰度步骤? 审计后台变更单的发布人是否已经通过了灰度考试? 判断回退的变更单有没有触发变更阻断? 分析变更单变更期间的告警的类型分布,各占比多少? 依据 change_action_type 字段含义(见 变更审计工具设计与实现 )对数据表中的每条变更操作行为进行重新清洗,生成有业务意义的 change_action_type 编号,对于源数据缺失、无法判定或无法映射 c...
2025.11–2026.03实习相关整理-时间序列异常检测完整方案指南
时间序列异常检测完整方案指南 一、需求拆解 1.1 需要覆盖的数据类型 周期性指标 特征:存在明显日周期/周周期(如图1、图2、图5的”每天起伏”) 需要识别的异常: 异常点/异常区间的时间点(峰值、低谷、形态改变) 周期形态不再符合历史规律(幅度变大、基线抬升、周期被破坏) 结构性变化(整体进入新水平) 非周期性指标 特征:没有稳定周期(如图3、图4的”突发/阶跃”) 需要识别的异常: 突发尖峰/脉冲 阶跃/平台 突然归零/持续低值 方差变大/噪声变大 1.2 图片理解 图号 特征描述 异常类型 图1 整体周期性很强,但在后段(约03-20后)波动幅度与...
2025.11–2026.03实习相关整理-拓扑图组件技术文档
拓扑图组件技术文档 一、组件概述 技术栈:TypeScript + Konva + ELK 核心功能:架构图的拓扑可视化渲染套件 视图模式 模块调用图(Module Call Graph) 模块接口调用图(Module Interface Call Graph) 二、核心功能 2.1 图渲染能力 ✅ 自动布局:基于ELK布局算法,自动计算节点位置 ✅ 画布缩放:支持滚轮缩放,缩放范围可配置 ✅ 画布拖拽:支持鼠标拖拽平移视图 ✅ 视图自适应:自动适配容器大小,支持居中显示 ✅ 节点聚焦:双击节点自动聚焦并居中显示 ✅ 节点高亮:支持高亮显示选中的节点及其关联节点/边 ✅ 小地...
2025.11–2026.03实习相关整理-后台系统发展历程
后台系统发展历程 本文收录了在产品发展的各个阶段,后台系统的点滴成长。 从无到有 产品正式发布。这一天距离项目启动日约为数月。就在这数月里,产品从无都有,大家可能会好奇这期间后台做的最重要的事情是什么? 我想应该是以下三件事: 1. 确定了消息模型 产品起初定位是一个通讯工具,作为通讯工具最核心的功能是收发消息。产品团队源于研发团队,消息模型跟邮箱的邮件模型也很有渊源,都是存储转发。 graph LR A[发送者] -->|发送消息| B[后台存储] B -->|推送通知| C[接收者] C -->|主动收取| B 图 1 消息模型 图1展示了这...
2025.11–2026.03实习相关整理-AI画图技术笔记
AI画图技术笔记 1. SVG(Scalable Vector Graphics) 矢量图形格式,可无损缩放 适合用于图标、图表、插图等 代码可编辑,便于精确控制 2. Mermaid 基于文本的图表生成工具 支持流程图、时序图、甘特图等 适合技术文档和架构图 3. HTML(通过Google Doc转为PPT) 使用HTML创建可视化内容 通过Google Docs转换为PPT演示文稿 适合创建演示文稿和幻灯片 4. Nano Banana AI辅助绘图工具 用于快速生成图形内容 提示词使用指南 科研风格 风格描述:科研风白底黑字图 特点:简洁、专业、学术感 适用场景...
2025.11–2026.03实习相关整理-问题排查和避坑文档整理2
问题排查和避坑文档整理 发布时需要监控指标 一、内存过高问题 - Go值传递导致的问题 Go语言默认都是值传递,只有显式使用指针才是引用传递。当传递大结构体或大对象时,值传递会导致内存复制和占用增加。 问题代码示例 1234567891011121314151617181920212223242526272829303132333435363738// 不推荐:使用值传递,会导致整个User结构体被复制func ProcessUser(u User) error { // 处理用户逻辑 u.Name = "Updated" return nil}// 推荐:使用指针传递...
2025.11–2026.03实习相关整理-企业监控告警平台
企业监控告警平台 1. 背景 随着企业业务的发展,服务实例数不断增长的同时监控数据的类型和数量也呈现爆发式增长的趋势。为了更好地管理这些监控指标数据,我们引入了一个统一监控平台,旨在统一管理各类监控数据指标,包括指标配置、告警订阅、告警通知、数据查看、拓展接入、开放接口等。 通过这个平台,帮助业务更及时、精确地定位和解决问题,提高服务的可用性和稳定性。标准化告警配置与告警口径,降低理解成本,提升效率。 2. 监控平台 2.1 数据指标 监控平台接入的监控数据分类: graph TD A[监控数据] --> B[业务指标] A --> C[拓展指标] A...
2025.11–2026.03实习相关整理-告警查找链路分析
告警查找链路分析 一、链路结构概述 1.1 核心实体 1用例 → CGI → 模块 → 模块 → …… 实体 说明 特点 用例 提供给用户使用的接口 调用链的最前面,用户可直接感知 CGI 通用网关接口 一个用例会调用多个CGI,会被传递到后续所有模块中 模块 具体的功能处理单元 CGI后面跟着一个模块调用链 1.2 实体关系图 graph LR A[用例] -->|调用| B1[CGI 1] A -->|调用| B2[CGI 2] A -->|调用| Bn[CGI N] B1 -->...
2025.11–2026.03实习相关整理-外部重大事件信息同步-方案设计
外部重大事件信息同步-方案设计 1. 项目目标 核心目标 满足公司合规与风险管理的规范要求,感知外部重大事件最新进展,分析对xxxx组内部服务的影响 具体目标 感知进展:记录外部重大事件的最新进展 分析影响:分析外部重大事件对部门内的影响 2. 外部重大事件要素模型 2.1 外部重大事件公告例子 事件分类与级别:公告类型是【故障公告】公告级别是【重大事件】,即:重大事件的故障公告 事件详细内容: 提取出以下字段: 公告编号: 公告标题: 公告类型:故障公告(唯一取值) 公告级别:重大事件(唯一取值) 关联单号: 公告接受人: 公告内容:17:13 现场反馈:所有演练范围机架已恢复...