Ollama本地运行Kimi-K2.5、GLM-5等国产大模型教程

3天前发布

0456

Ollama 是目前最流行的本地大模型运行工具，支持在个人电脑或服务器上一键部署和运行各种开源大模型。随着国产大模型的快速发展，现在 Ollama 已经支持 Kimi-K2.5、GLM-5、Qwen3、DeepSeek 等最新模型，站长和开发者可以在本地零成本体验这些模型。

安装 Ollama

Linux

curl -fsSL https://ollama.com/install.sh | sh

macOS

从 ollama.com/download 下载安装包，或者使用 Homebrew：

brew install ollama

验证安装

ollama --version

下载和运行国产模型

安装完成后，可以通过简单的命令下载和运行模型：

# Kimi K2.5（Moonshot 最新模型）
ollama pull kimi-k2.5
ollama run kimi-k2.5

# GLM-5（智谱最新模型）
ollama pull glm5
ollama run glm5

# Qwen3（通义千问最新模型）
ollama pull qwen3:latest
ollama run qwen3

# DeepSeek V3
ollama pull deepseek-v3
ollama run deepseek-v3

每个模型的下载大小不同，从几 GB 到几十 GB 不等。建议根据服务器磁盘空间和内存选择合适的模型大小。

各模型适用场景对比

模型	特点	适合场景	内存需求
Kimi K2.5	长上下文能力强	文档分析、长文总结	16GB+
GLM-5	中文理解好	中文对话、文案写作	16GB+
Qwen3	综合能力强	通用对话、代码生成	8GB+
DeepSeek V3	代码和推理能力强	编程辅助、数学推理	32GB+

API 调用方式

Ollama 启动后会自动提供兼容 OpenAI 格式的 API 服务：

# 默认端口 11434
curl http://localhost:11434/v1/chat/completions   -H "Content-Type: application/json"   -d '{
    "model": "qwen3",
    "messages": [{"role": "user", "content": "你好，介绍一下自己"}]
  }'

这意味着你可以直接把 Ollama 的 API 接入任何支持 OpenAI 格式的工具和平台，比如 Open WebUI、ChatBox、LobeChat 等。

服务器部署注意事项

GPU 加速：如果有 NVIDIA GPU，Ollama 会自动使用 CUDA 加速，推理速度大幅提升
内存要求：模型越大需要的内存越多，7B 模型约需 8GB，70B 模型需要 64GB+
安全配置：默认只监听 localhost，如果需要远程访问，设置 OLLAMA_HOST=0.0.0.0
开机自启：Linux 安装后会自动创建 systemd 服务

搭配 Open WebUI 使用

想要一个更好看的 Web 界面？可以同时部署 Open WebUI：

docker run -d -p 3000:8080   -e OLLAMA_BASE_URL=http://host.docker.internal:11434   --name open-webui   ghcr.io/open-webui/open-webui:main

访问 http://localhost:3000 就能看到类似 ChatGPT 的对话界面，支持选择不同的本地模型。

Ollama 让本地运行大模型变得非常简单，对于注重数据隐私、想节省 API 费用或者想测试不同模型的站长来说，是目前最好的选择之一。

来源：GitHub – ollama/ollama | ollama.com

文章版权声明 1、本网站名称：枫选
2、本站永久网址：https://feng.cx
3、本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长进行删除处理。
4、本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5、本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报
6、本站资源大多存储在云盘，如发现链接失效，请联系我们我们会第一时间更新。

THE END

喜欢就支持一下吧

Vercel Zero-Native：用Web技术构建原生桌面应用，两天Star破千

GitHub本周最火的项目之一，TradingAgents在短短时间内获得了超过7万星标，成为多Agent AI应用领域的标杆项目。这个基于大语言模型的多Agent金融交易框架，让"AI炒股"从概念走向了可实验的开源工具。

项目简介

TradingAgents是一个开源的多Agent金融交易分析框架，核心思路是让多个AI Agent各司其职，协同完成金融市场的分析和交易决策。项目地址：GitHub - TauricResearch/TradingAgents

架构设计

TradingAgents的设计借鉴了真实金融交易团队的分工模式，将不同职责分配给不同的Agent：

分析师Agent：负责分析市场数据、财报、新闻等信息，产出分析报告。
研究员Agent：深入研究特定行业或公司，提供基本面分析。
交易员Agent：根据分析结果制定交易策略和执行计划。
风控Agent：评估交易风险，设置止损和仓位控制。
决策Agent：综合各方意见，做出最终交易决策。

这种多Agent协作的模式，模拟了真实对冲基金的决策流程。每个Agent可以使用不同的LLM模型，甚至可以使用同一模型的不同温度参数来产生多样化的观点。

使用场景

学术研究

TradingAgents是研究多Agent系统在金融领域应用的优秀平台。研究人员可以修改Agent的提示词、调整协作机制、测试不同的决策算法。

策略回测

框架支持接入历史市场数据，可以用来回测AI交易策略的表现。这对于量化交易团队评估AI辅助决策的价值很有帮助。

学习和教育

对于想了解AI在金融领域应用的开发者，TradingAgents是一个很好的学习项目。代码结构清晰，文档完善，适合上手研究。

安装和运行

# 克隆项目
git clone https://github.com/TauricResearch/TradingAgents.git
cd TradingAgents

# 安装依赖
pip install -r requirements.txt

# 配置API密钥
cp .env.example .env
# 编辑 .env 文件，填入 OpenAI API key

重要风险提示

⚠️ 以下几点需要特别注意：

不要用真金白银：TradingAgents是一个研究和实验框架，不是成熟的交易系统。绝对不要用它来做实盘交易。
AI不是万能的：金融市场受到无数因素影响，AI模型无法预测黑天鹅事件、政策变化、市场情绪等非理性因素。
回测不等于实盘：在历史数据上表现好的策略，在真实交易中可能完全失败（过拟合问题）。
合规风险：在某些司法管辖区，使用AI进行自动化交易可能受到监管限制。

架构设计

TradingAgents的设计借鉴了真实金融交易团队的分工模式，将不同职责分配给不同的Agent：

分析师Agent：负责分析市场数据、财报、新闻等信息，产出分析报告。
研究员Agent：深入研究特定行业或公司，提供基本面分析。
交易员Agent：根据分析结果制定交易策略和执行计划。
风控Agent：评估交易风险，设置止损和仓位控制。
决策Agent：综合各方意见，做出最终交易决策。

使用场景

学术研究

TradingAgents是研究多Agent系统在金融领域应用的优秀平台。研究人员可以修改Agent的提示词、调整协作机制、测试不同的决策算法。

策略回测

框架支持接入历史市场数据，可以用来回测AI交易策略的表现。这对于量化交易团队评估AI辅助决策的价值很有帮助。

学习和教育

对于想了解AI在金融领域应用的开发者，TradingAgents是一个很好的学习项目。代码结构清晰，文档完善，适合上手研究。

安装和运行

# 克隆项目
git clone https://github.com/TauricResearch/TradingAgents.git
cd TradingAgents

# 安装依赖
pip install -r requirements.txt

# 配置API密钥
cp .env.example .env
# 编辑 .env 文件，填入 OpenAI API key

重要风险提示

⚠️ 以下几点需要特别注意：

不要用真金白银：TradingAgents是一个研究和实验框架，不是成熟的交易系统。绝对不要用它来做实盘交易。
AI不是万能的：金融市场受到无数因素影响，AI模型无法预测黑天鹅事件、政策变化、市场情绪等非理性因素。
回测不等于实盘：在历史数据上表现好的策略，在真实交易中可能完全失败（过拟合问题）。
合规风险：在某些司法管辖区，使用AI进行自动化交易可能受到监管限制。

项目简介

TradingAgents是一个开源的多Agent金融交易分析框架，核心思路是让多个AI Agent各司其职，协同完成金融市场的分析和交易决策。项目地址：GitHub – TauricResearch/TradingAgents

架构设计

TradingAgents的设计借鉴了真实金融交易团队的分工模式，将不同职责分配给不同的Agent：

分析师Agent：负责分析市场数据、财报、新闻等信息，产出分析报告。
研究员Agent：深入研究特定行业或公司，提供基本面分析。
交易员Agent：根据分析结果制定交易策略和执行计划。
风控Agent：评估交易风险，设置止损和仓位控制。
决策Agent：综合各方意见，做出最终交易决策。

使用场景

学术研究

TradingAgents是研究多Agent系统在金融领域应用的优秀平台。研究人员可以修改Agent的提示词、调整协作机制、测试不同的决策算法。

策略回测

框架支持接入历史市场数据，可以用来回测AI交易策略的表现。这对于量化交易团队评估AI辅助决策的价值很有帮助。

学习和教育

对于想了解AI在金融领域应用的开发者，TradingAgents是一个很好的学习项目。代码结构清晰，文档完善，适合上手研究。

安装和运行

# 克隆项目
git clone https://github.com/TauricResearch/TradingAgents.git
cd TradingAgents

# 安装依赖
pip install -r requirements.txt

# 配置API密钥
cp .env.example .env
# 编辑 .env 文件，填入 OpenAI API key

重要风险提示

⚠️ 以下几点需要特别注意：

不要用真金白银：TradingAgents是一个研究和实验框架，不是成熟的交易系统。绝对不要用它来做实盘交易。
AI不是万能的：金融市场受到无数因素影响，AI模型无法预测黑天鹅事件、政策变化、市场情绪等非理性因素。
回测不等于实盘：在历史数据上表现好的策略，在真实交易中可能完全失败（过拟合问题）。
合规风险：在某些司法管辖区，使用AI进行自动化交易可能受到监管限制。

Ollama本地运行Kimi-K2.5、GLM-5等国产大模型教程

安装 Ollama

Linux

macOS

验证安装

下载和运行国产模型

各模型适用场景对比

API 调用方式

服务器部署注意事项

搭配 Open WebUI 使用

架构设计

使用场景

学术研究

策略回测

学习和教育

安装和运行

重要风险提示

同类项目参考

项目简介

架构设计

使用场景

学术研究

策略回测

学习和教育

安装和运行

重要风险提示

同类项目参考

请登录后发表评论