个人介绍
🌐 技术博客: https://www.whiteenzuo.cn💼 GitHub: https://github.com/WhiteEnzuo📞 电话: 19304012350✉️ 邮箱: 210327422@qq.com🏫 学校: 广东石油化工学院 · 物联网工程(2025届学士)
🧭 个人简介我是张粤,一名2025年毕业的物联网工程专业本科生,专注于后端开发、系统架构设计与AI工程化落地。热爱技术,追求极致的系统性能与用户体验,具备扎实的计算机基础和丰富的项目实战经验。
在实习与个人项目中,我主导并参与了多个高并发、高可用系统的架构设计与核心开发,尤其在 CRM系统、AI智能体平台、动态化小程序架构、数据驱动运营、RAG搜索、多智能体编排、低代码生成 等领域有深入实践。擅长将前沿AI技术与传统后端工程结合,推动业务智能化升级。
💼 工作经历万物心选 | 后端开发实习生2025.06 – 至今
参与公司核心产品 ...
holo的SQL优化
SQL优化过程背景当前数据查询量大,早期SQL开发侧重功能实现,未充分考虑服务器资源(CPU、内存)消耗,导致数仓服务器负载较高。目前数仓主要由两大系统构成:MaxCompute(简称MC)和 Hologres(简称Holo)。
Hologres:基于内存的实时查询系统,速度快,适合几百GB以内的在线查询,但对硬件要求高。
MaxCompute:基于Hadoop的离线计算平台,支持PB级数据处理,资源消耗低,但数据延迟为T+1,适合批处理。
由于Hologres承担了大部分查询任务,其CPU和内存占用居高不下,亟需通过SQL优化降低资源消耗。
⚠️ 注意:所有SQL优化必须基于实际业务逻辑,避免因优化导致数据错误。
优化方案核心目标:在联表查询过程中,尽可能减少中间结果集的数据量,从而降低计算和内存开销。
联表方式对比
联表类型
说明
优化建议
笛卡尔积
两表行数相乘,数据量爆炸,性能最差
避免使用
Inner Join
仅保留两表匹配的记录
适合两表均有数据的场景
Left Join
以左表为基础,右表无匹配则补NULL
建议左表尽可能小
Right ...