排序
Modal如何将GPU推理冷启动时间缩短40倍:技术深度解析
Modal如何将GPU推理冷启动时间缩短40倍,使用Lazy Paging、FUSE、Checkpoint/Restore和CUDA-checkpoint技术。
Needle:26MB的Gemini工具调用蒸馏模型,让小设备也能调用AI工具
Needle是一个仅26MB的工具调用模型,通过蒸馏Gemini能力让小设备也能调用AI工具。支持结构化JSON工具调用,适合移动设备和边缘计算场景。
Kanbots:开源看板工具,每个卡片上跑一个AI Agent并行开发
Kanbots是一个开源看板工具,能在每张任务卡片上运行Claude Code或Codex Agent并行开发,支持autopilot自动拆分和执行任务。
Gemini CLI完全指南:Google开源终端AI Agent,免费额度用到爽
Google开源Gemini CLI终端AI Agent完全指南:安装配置、基础使用、实用技巧,免费额度对个人开发者非常友好。
GPT Promo Scanner:AI自动扫描全网促销代码,薅羊毛利器
GPT Promo Scanner 使用 AI 自动识别和提取网页、邮件中的促销代码。支持自动验证、分类整理和过期提醒,是网购达人和站长的实用工具。
local-deep-research:支持本地LLM的AI深度研究工具,SimpleQA准确率达95%
local-deep-research是支持本地LLM的AI深度研究工具,SimpleQA准确率达95%。支持20多种研究策略,可搜索学术论文和私有文档,Docker一键部署,支持MCP集成。
Vercel Zero编程语言入门:专为AI Agent设计的新语言怎么用
Vercel Labs开源的Zero编程语言专为AI Agent设计,GitHub 2800+ Star。本文介绍Zero的设计理念、主要特点、安装方法和适用场景。
Claude 推出小型企业版:15个AI自动化工作流,帮小团队省时间
Anthropic推出Claude for Small Business,提供15个预设AI自动化工作流,覆盖客服、销售、运营等场景。本文详解工作流内容和站长可借鉴的实现思路。
A股全栈数据工具包自建教程:28端点13数据源,零第三方依赖
a-stock-data是一个零第三方依赖的A股数据工具包,提供28个API端点和13个数据源。本文介绍如何在自己的服务器上搭建,用于量化交易和股票分析。









