独立创作者
设计程序化视频流水线,AI Agent 工具链,多平台内容运营。
全栈开发者,专注于创意工程。擅长用代码驱动视频制作、构建 AI Agent 工作流、以及实现高质量的交互体验。追求技术与创意的交汇。
设计程序化视频流水线,AI Agent 工具链,多平台内容运营。
React / Node.js / 数据库设计。系统架构与代码质量实践。
Languages: TypeScript, Python, GLSL Frontend: React, Three.js, GSAP, Remotion Backend: Node.js, Bun Tools: FFmpeg, Git, Docker, Caddy AI: LLM Agents, MCP, Gemini API
这不是一个视频编辑软件,而是一个视频编译器。输入是 YAML 配置文件和素材,输出是完整的短视频。
整个系统的核心理念是:视频制作应该是工程问题,而不是手工艺。每一个镜头的时长、每一句字幕的出现时机、每一段配乐的音量包络——都由数据驱动,可精确控制到帧级别。
技术栈上,用 React 组件定义画面结构,GSAP 控制动画时间线,FFmpeg 处理音视频编解码。整个流水线从素材收集(AI Agent 辅助)到最终 MP4 输出,完全自动化。
构建了一套完整的 AI Agent 基础设施。通过 MCP (Model Context Protocol) 将各种工具以标准接口接入 AI,让大模型能直接操作:
• 搜索引擎 — Tavily 广域搜索 + Firecrawl 深度抓取
• 视频分析 — Gemini 视频理解,自动标注时间戳和画面内容
• B 站工具链 — 视频搜索、UP主信息、弹幕获取
• 媒体处理 — yt-dlp 下载 + FFmpeg 裁剪的自动化调度
这不只是 "调 API",而是一个有状态、可编排的 Agent 系统。定义好任务目标,Agent 自己决定调用哪些工具、以什么顺序执行。
从原生 WebGL 到 CSS 3D 变换,我喜欢探索浏览器能力的边界。
Ray Marching SDF — 不用 Three.js,纯手写 fragment shader。用 Signed Distance Functions 定义几何体,smooth union 实现有机融合,加上菲涅尔、次表面散射等光照模型。
WebGL Crosswarp 转场 — 你正在体验的效果。html2canvas 截取 DOM 为纹理,上传到 WebGL,用 GLSL crosswarp shader 在两张纹理之间做 GPU 加速的平滑空间扭曲转场。
程序化动画 — GSAP ScrollTrigger + Timeline 构建复杂的滚动驱动动画系统。在 Remotion 中同样适用,做到制作和渲染一致。