AI教程 第2页
如何从零构建大语言模型?Andrej Karpathy 系统讲解 GPT 训练全流程-枫选

如何从零构建大语言模型?Andrej Karpathy 系统讲解 GPT 训练全流程

前 OpenAI 联合创始人 Karpathy 系统讲解从零构建 GPT 的完整流程:预训练、监督微调、奖励模型、强化学习。附学习路线、硬件需求和社区推荐的补充资源。
迪滴的头像-枫选迪滴前天
0439
无监督自编码器在自然语言处理中的应用:原理与实践-枫选

无监督自编码器在自然语言处理中的应用:原理与实践

自编码器在自然语言处理中有着广泛应用,从文本异常检测、降维聚类到语义检索。本文介绍去噪自编码器、VAE、序列自编码器等变体在 NLP 中的原理和实践建议。
迪滴的头像-枫选迪滴前天
03312
在 M4 Mac 上本地运行大语言模型:模型选择和性能实测指南-枫选

在 M4 Mac 上本地运行大语言模型:模型选择和性能实测指南

在 M4 Mac 上本地运行大语言模型已经从'能用'进化到'好用'。本文整理了 Ollama、LM Studio 等工具的使用方法,以及不同内存配置下推荐的模型和性能参考数据。
迪滴的头像-枫选迪滴前天
0457
Mirage:让AI Agent像操作文件一样调用工具,统一虚拟文件系统部署教程-枫选

Mirage:让AI Agent像操作文件一样调用工具,统一虚拟文件系统部署教程

Mirage将AI Agent的工具调用抽象为虚拟文件系统操作,支持Claude Code、OpenAI Agents、LangChain等框架。一套工具,多框架复用。
迪滴的头像-枫选迪滴前天
0315
antirez开源ds4:在Mac上本地运行DeepSeek V4 Flash推理引擎,6000星项目实战-枫选

antirez开源ds4:在Mac上本地运行DeepSeek V4 Flash推理引擎,6000星项目实战

Redis之父antirez开源ds4项目,专门用于在Mac上本地运行DeepSeek V4 Flash模型推理。支持2-bit量化和Metal GPU加速,GitHub超6000星。
迪滴的头像-枫选迪滴前天
0448
2026年AI Agent多Agent编排模式详解:四种子Agent架构实战-枫选

2026年AI Agent多Agent编排模式详解:四种子Agent架构实战

详解2026年主流的四种AI Agent编排模式:内联工具、扇出等待、Agent池和团队协作。每种模式的适用场景、实现方式和所需模型能力各不相同,本文帮你选对架构。
别再裸用Claude Code了:Skills和MCP配置教程,开发效率翻倍-枫选

别再裸用Claude Code了:Skills和MCP配置教程,开发效率翻倍

Claude Code可以通过Skills和MCP大幅扩展能力。Skills让AI更懂怎么干,MCP让AI真的能去干。本文介绍必装技能推荐、MCP服务器配置方法和使用建议。
迪滴的头像-枫选迪滴4天前
0297
how-to-train-your-gpt:从零开始学习大语言模型的完整路线图-枫选

how-to-train-your-gpt:从零开始学习大语言模型的完整路线图

GitHub开源项目how-to-train-your-gpt整理了从零开始学习大语言模型的完整路线图,包括Transformer原理、GPT实现、训练方法和推理优化。本文梳理学习路径和实用建议。
迪滴的头像-枫选迪滴4天前
0465
Mojo 1.0 Beta发布:Python开发者也能写的高性能语言入门教程-枫选

Mojo 1.0 Beta发布:Python开发者也能写的高性能语言入门教程

Mojo 1.0 Beta发布,LLVM之父打造的高性能编程语言,兼容Python语法但速度提升数万倍。包含安装步骤、第一个程序、与Python的差异、SIMD支持、适用场景和当前限制。
迪滴的头像-枫选迪滴4天前
02010
AI Agent开发新思路:用控制流取代堆提示词,构建更可靠的Agent系统-枫选

AI Agent开发新思路:用控制流取代堆提示词,构建更可靠的Agent系统

AI Agent开发不应过度依赖提示词工程,真正让Agent可靠工作的是控制流设计。用状态机、条件判断和错误处理来约束Agent行为,LLM只负责语义理解和判断。
迪滴的头像-枫选迪滴5天前
03914