全部文章 - 26
2026
看懂 Transformer Block:Attention、MLP、Residual 和 Norm 到底怎么配合
看懂 Transformer Block:Attention、MLP、Residual 和 Norm 到底怎么配合
从一次 Docker 迁移,看 Hermes Agent 里的 HOME 边界
从一次 Docker 迁移,看 Hermes Agent 里的 HOME 边界
npm global 不应该被当成系统级包管理器
npm global 不应该被当成系统级包管理器
基于大模型 API 构建上层应用的知识地图
基于大模型 API 构建上层应用的知识地图
ReAct、CoT 与 Tool-Use:从想清楚到做清楚
ReAct、CoT 与 Tool-Use:从想清楚到做清楚
为什么"把聊天记录全塞进去"是 LLM 产品最常见的自杀行为
为什么"把聊天记录全塞进去"是 LLM 产品最常见的自杀行为
推理模型如何"思考":一切都只是 Token
推理模型如何"思考":一切都只是 Token
深入理解 LLM 函数调用:模型不会"决定"用工具
深入理解 LLM 函数调用:模型不会"决定"用工具
LLM 解码策略:temperature、采样与 beam search,到底在选什么
LLM 解码策略:temperature、采样与 beam search,到底在选什么
多模态 AI 聊天的图像上传:从字节流到用户体验
多模态 AI 聊天的图像上传:从字节流到用户体验
Transformer 到底怎么生成文本:逐层拆解
Transformer 到底怎么生成文本:逐层拆解
从 Token 到 RAG:理解 AI Native 数据管道
从 Token 到 RAG:理解 AI Native 数据管道
低端设备上让 AI 原生应用"感觉快"的实战指南
低端设备上让 AI 原生应用"感觉快"的实战指南
流式输出:AI 原生应用的默认交互范式
流式输出:AI 原生应用的默认交互范式
2024
React/Next/Vercel + LeanCloud 快速搭建一个网站
完美的代码无法拯救你的公司
我的软路由折腾心得
我心目中合格的 NAS
64 位 Ubuntu 部署饥荒独立服务器
基于 docker-dst-server 的饥荒独立服务器部署
iOS v.s. Android,我的小众视角
相伴三年,我对 AB 实验的一些感悟
Don't Starve Together Dedicated Server 使用问题记录
删代码到底有多难
面向对象与函数式编程中的 event listener
使用 HashMap 优化数组交集计算