排序
Needle:26MB的Gemini工具调用蒸馏模型,让小设备也能调用AI工具
Needle是一个仅26MB的工具调用模型,通过蒸馏Gemini能力让小设备也能调用AI工具。支持结构化JSON工具调用,适合移动设备和边缘计算场景。
GPT Promo Scanner:AI自动扫描全网促销代码,薅羊毛利器
GPT Promo Scanner 使用 AI 自动识别和提取网页、邮件中的促销代码。支持自动验证、分类整理和过期提醒,是网购达人和站长的实用工具。
local-deep-research:支持本地LLM的AI深度研究工具,SimpleQA准确率达95%
local-deep-research是支持本地LLM的AI深度研究工具,SimpleQA准确率达95%。支持20多种研究策略,可搜索学术论文和私有文档,Docker一键部署,支持MCP集成。
AI Agent开发新思路:用控制流取代堆提示词,构建更可靠的Agent系统
AI Agent开发不应过度依赖提示词工程,真正让Agent可靠工作的是控制流设计。用状态机、条件判断和错误处理来约束Agent行为,LLM只负责语义理解和判断。
用Swift训练LLM:从Gflop/s到Tflop/s的矩阵乘法优化实战教程
一篇详细的技术教程,记录了在Apple Silicon上用纯Swift实现10种矩阵乘法方案的过程,从最初的0.054 tokens/s优化到11.1 tokens/s,性能提升382倍。
Rapid-MLX 让苹果芯片跑本地 AI 更快,Mac 用户可以试试 OpenAI 兼容接口
Rapid-MLX 是面向 Apple Silicon 的本地 AI 推理引擎,项目介绍中强调 OpenAI 兼容接口、工具调用和提示缓存。Mac 用户可作为 Ollama 之外的候选方案。
2026年AI Agent多Agent编排模式详解:四种子Agent架构实战
详解2026年主流的四种AI Agent编排模式:内联工具、扇出等待、Agent池和团队协作。每种模式的适用场景、实现方式和所需模型能力各不相同,本文帮你选对架构。
ds4:Redis 作者 antirez 开发的 DeepSeek V4 Flash 本地推理引擎,Mac Metal 加速
Redis 创始人 antirez 最新开源项目 ds4,专为 DeepSeek V4 Flash 打造的 Metal 推理引擎。支持 2-bit 量化、磁盘 KV 缓存、OpenAI/Anthropic 兼容 API,MacBook Pro M3 Max 可达 26 token/s。...
2026最新Claude Code国内使用教程:安装配置与常见问题解决
Claude Code是Anthropic推出的AI编程协作工具,本文介绍国内用户如何安装、配置和使用Claude Code,包含常见报错处理方法。
DeepClaude:用 DeepSeek V4 Pro 替换 Claude Code 后端,成本降低 17 倍
DeepClaude 是一个开源 API 代理项目,让你用 DeepSeek V4 Pro 替换 Claude Code 后端,在保持使用体验不变的同时将 API 成本降低约 17 倍。










