Mirage:用自然语言替代CSS选择器的浏览器自动化测试工具

2026 年 5 月 8 日,一个名为 Mirage 的开源项目登上了 Hacker News 首页。这个工具用自然语言描述来替代传统的 CSS 选择器和 XPath 定位方式,让浏览器自动化测试和数据采集变得更直观、更易维护。

Mirage 是什么

Mirage 是一个浏览器自动化框架,核心特点是用自然语言来定位页面元素。传统工具(如 Selenium、Playwright)需要写 CSS 选择器或 XPath 来定位按钮、链接、输入框等元素,而 Mirage 让你用人类能读懂的描述来完成同样的操作。

安装方法

# 克隆仓库
git clone https://github.com/strukto-ai/mirage.git
cd mirage

# 安装依赖
npm install

# 或通过 npm 直接安装
npm install @strukto-ai/mirage

基本用法

传统方式 vs Mirage 方式

// 传统 Playwright 定位方式
await page.click('[data-testid="login-button"]');
await page.fill('input[name="email"]', 'user@example.com');
await page.fill('#password', 'password123');

// Mirage 自然语言定位方式
await mirage.click("点击登录按钮");
await mirage.fill("在邮箱输入框中输入 user@example.com");
await mirage.fill("在密码输入框中输入 password123");

数据采集场景

// 传统方式
const prices = await page.$$eval('.product-card .price', 
  els => els.map(el => el.textContent));

// Mirage 方式
const prices = await mirage.extract("获取所有商品的价格");

Mirage 的工作原理

Mirage 底层结合了视觉识别和语义理解:

  • DOM 解析:分析页面的 HTML 结构和可访问性标签
  • 视觉理解:使用视觉模型识别页面元素的位置和类型
  • 语义匹配:将自然语言描述与页面元素进行语义匹配

适用场景

  • UI 测试:用自然语言写测试用例,降低测试代码的编写和维护成本
  • 数据采集:用自然语言描述要抓取的内容,不用分析页面结构
  • RPA 自动化:模拟人工操作网页的自动化流程
  • 快速原型:快速验证网页交互逻辑,不用写复杂的定位代码

注意事项

  • Mirage 依赖 AI 模型来理解自然语言,可能需要配置 API Key
  • 对于高度动态的页面,自然语言描述可能不如精确的选择器稳定
  • 目前项目还比较新,社区生态和文档还在完善中
  • 在 CI/CD 环境中使用时,注意 AI 模型调用的延迟和成本

同类工具对比

  • Selenium:最成熟的浏览器自动化工具,社区大,但 API 老旧
  • Playwright:微软出品,现代化 API,支持多浏览器
  • Puppeteer:Google 出品,专注 Chrome/Chromium
  • Mirage:自然语言定位,降低学习门槛,但依赖 AI 模型

总结

Mirage 的出现让浏览器自动化测试和数据采集的门槛进一步降低。虽然目前还不够成熟,但”用自然语言操作浏览器”这个方向很有前景。如果你的测试或采集场景比较标准化,Mirage 值得关注。

项目地址:https://github.com/strukto-ai/mirage

© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享
相关推荐
<p>GitHub本周最火的项目之一,TradingAgents在短短时间内获得了超过7万星标,成为多Agent AI应用领域的标杆项目。这个基于大语言模型的多Agent金融交易框架,让”AI炒股”从概念走向了可实验的开源工具。</p>

<h2>项目简介</h2>

<p>TradingAgents是一个开源的多Agent金融交易分析框架,核心思路是让多个AI Agent各司其职,协同完成金融市场的分析和交易决策。项目地址:<a href=GitHub – TauricResearch/TradingAgents

架构设计

TradingAgents的设计借鉴了真实金融交易团队的分工模式,将不同职责分配给不同的Agent:

  • 分析师Agent:负责分析市场数据、财报、新闻等信息,产出分析报告。
  • 研究员Agent:深入研究特定行业或公司,提供基本面分析。
  • 交易员Agent:根据分析结果制定交易策略和执行计划。
  • 风控Agent:评估交易风险,设置止损和仓位控制。
  • 决策Agent:综合各方意见,做出最终交易决策。

这种多Agent协作的模式,模拟了真实对冲基金的决策流程。每个Agent可以使用不同的LLM模型,甚至可以使用同一模型的不同温度参数来产生多样化的观点。

使用场景

学术研究

TradingAgents是研究多Agent系统在金融领域应用的优秀平台。研究人员可以修改Agent的提示词、调整协作机制、测试不同的决策算法。

策略回测

框架支持接入历史市场数据,可以用来回测AI交易策略的表现。这对于量化交易团队评估AI辅助决策的价值很有帮助。

学习和教育

对于想了解AI在金融领域应用的开发者,TradingAgents是一个很好的学习项目。代码结构清晰,文档完善,适合上手研究。

安装和运行

# 克隆项目
git clone https://github.com/TauricResearch/TradingAgents.git
cd TradingAgents

# 安装依赖
pip install -r requirements.txt

# 配置API密钥
cp .env.example .env
# 编辑 .env 文件,填入 OpenAI API key

重要风险提示

⚠️ 以下几点需要特别注意:

  • 不要用真金白银:TradingAgents是一个研究和实验框架,不是成熟的交易系统。绝对不要用它来做实盘交易。
  • AI不是万能的:金融市场受到无数因素影响,AI模型无法预测黑天鹅事件、政策变化、市场情绪等非理性因素。
  • 回测不等于实盘:在历史数据上表现好的策略,在真实交易中可能完全失败(过拟合问题)。
  • 合规风险:在某些司法管辖区,使用AI进行自动化交易可能受到监管限制。

同类项目参考

如果你对AI+金融感兴趣,还可以关注以下项目:

  • FinRL:深度强化学习金融交易框架
  • Qlib:微软开源的量化投资平台
  • GPT-Financial-Analyst:基于GPT的财务分析工具

来源:

-枫选">

GitHub本周最火的项目之一,TradingAgents在短短时间内获得了超过7万星标,成为多Agent AI应用领域的标杆项目。这个基于大语言模型的多Agent金融交易框架,让”AI炒股”从概念走向了可实验的开源工具。

项目简介

TradingAgents是一个开源的多Agent金融交易分析框架,核心思路是让多个AI Agent各司其职,协同完成金融市场的分析和交易决策。项目地址:GitHub – TauricResearch/TradingAgents

架构设计

TradingAgents的设计借鉴了真实金融交易团队的分工模式,将不同职责分配给不同的Agent:

  • 分析师Agent:负责分析市场数据、财报、新闻等信息,产出分析报告。
  • 研究员Agent:深入研究特定行业或公司,提供基本面分析。
  • 交易员Agent:根据分析结果制定交易策略和执行计划。
  • 风控Agent:评估交易风险,设置止损和仓位控制。
  • 决策Agent:综合各方意见,做出最终交易决策。

这种多Agent协作的模式,模拟了真实对冲基金的决策流程。每个Agent可以使用不同的LLM模型,甚至可以使用同一模型的不同温度参数来产生多样化的观点。

使用场景

学术研究

TradingAgents是研究多Agent系统在金融领域应用的优秀平台。研究人员可以修改Agent的提示词、调整协作机制、测试不同的决策算法。

策略回测

框架支持接入历史市场数据,可以用来回测AI交易策略的表现。这对于量化交易团队评估AI辅助决策的价值很有帮助。

学习和教育

对于想了解AI在金融领域应用的开发者,TradingAgents是一个很好的学习项目。代码结构清晰,文档完善,适合上手研究。

安装和运行

# 克隆项目
git clone https://github.com/TauricResearch/TradingAgents.git
cd TradingAgents

# 安装依赖
pip install -r requirements.txt

# 配置API密钥
cp .env.example .env
# 编辑 .env 文件,填入 OpenAI API key

重要风险提示

⚠️ 以下几点需要特别注意:

  • 不要用真金白银:TradingAgents是一个研究和实验框架,不是成熟的交易系统。绝对不要用它来做实盘交易。
  • AI不是万能的:金融市场受到无数因素影响,AI模型无法预测黑天鹅事件、政策变化、市场情绪等非理性因素。
  • 回测不等于实盘:在历史数据上表现好的策略,在真实交易中可能完全失败(过拟合问题)。
  • 合规风险:在某些司法管辖区,使用AI进行自动化交易可能受到监管限制。

同类项目参考

如果你对AI+金融感兴趣,还可以关注以下项目:

  • FinRL:深度强化学习金融交易框架
  • Qlib:微软开源的量化投资平台
  • GPT-Financial-Analyst:基于GPT的财务分析工具

来源:

GitHub本周最火的项目之一,TradingAgents在短短时间内获得了超过7万星标,成为多Agent AI应...

3天前 50
<p>DocuSign是全球最知名的电子签名服务,但其定价对中小站长和创业团队来说并不友好。DocuSeal是一个开源免费的电子签名平台,GitHub上已获得16000+星标,支持自部署,可以作为DocuSign的替代方案。</p>

<h2>项目简介</h2>

<p>DocuSeal是一个功能完整的电子签名解决方案,支持创建、发送和签署PDF文档。项目使用Ruby on Rails开发,提供直观的Web界面,适合需要在自己的服务器上部署电子签名服务的团队。</p>

<p>项目地址:<a href=GitHub – docusealco/docuseal

核心功能

  • 文档模板:上传PDF文档,通过拖拽方式添加签名框、日期框、文本框等表单字段。
  • 多方签署:支持多个签署人按顺序或并行签署同一文档。
  • 邮件通知:自动发送签署邀请和完成通知邮件。
  • API接口:提供REST API,可以集成到现有应用中。
  • Webhook:签署完成后通过Webhook通知你的系统。
  • 审计日志:记录完整的签署过程,包括IP地址、时间戳等。
  • 多语言:支持中文在内的多种语言界面。

Docker部署教程

DocuSeal推荐使用Docker部署,步骤如下:

1. 创建docker-compose.yml

version: "3"
services:
  docuseal:
    image: docuseal/docuseal:latest
    ports:
      - "3000:3000"
    volumes:
      - docuseal-data:/data
    environment:
      - DATABASE_URL=sqlite3:/data/docuseal.sqlite3
      - RAILS_ENV=production
      - SECRET_KEY_BASE=your-random-secret-key-here

volumes:
  docuseal-data:

2. 启动服务

docker-compose up -d

3. 访问初始化

打开浏览器访问 http://your-server:3000,按照向导创建管理员账户。

4. 配置邮件(可选)

在环境变量中添加SMTP配置:

SMTP_ADDRESS=smtp.example.com
SMTP_PORT=587
SMTP_USERNAME=your-email@example.com
SMTP_PASSWORD=your-password
SMTP_DOMAIN=example.com

与DocuSign对比

特性DocuSeal(自部署)DocuSign(SaaS)
价格免费开源$10-60/月/用户
数据控制完全在自己服务器存储在DocuSign云端
自定义可完全自定义受限于平台功能
法律效力取决于当地法律全球认可
合规认证需要自行确保SOC 2、ISO 27001等
维护成本需要自行运维平台托管

适合谁使用

  • 中小团队:需要内部合同签署,但不想为每个用户付费。
  • 数据敏感行业:不想将签署文档存储在第三方云端。
  • 定制化需求:需要将签署功能集成到自己的业务系统中。
  • 学习和研究:想了解电子签名系统的技术实现。

注意事项

  • 电子签名的法律效力因国家和地区而异,重要合同建议咨询法律专业人士。
  • 自部署需要自行负责服务器安全、数据备份和SSL证书配置。
  • 对于需要全球法律认可的签署场景,DocuSign等成熟SaaS仍然是更稳妥的选择。

来源:

-枫选">

DocuSign是全球最知名的电子签名服务,但其定价对中小站长和创业团队来说并不友好。DocuSeal是一个开源免费的电子签名平台,GitHub上已获得16000+星标,支持自部署,可以作为DocuSign的替代方案。

项目简介

DocuSeal是一个功能完整的电子签名解决方案,支持创建、发送和签署PDF文档。项目使用Ruby on Rails开发,提供直观的Web界面,适合需要在自己的服务器上部署电子签名服务的团队。

项目地址:GitHub – docusealco/docuseal

核心功能

  • 文档模板:上传PDF文档,通过拖拽方式添加签名框、日期框、文本框等表单字段。
  • 多方签署:支持多个签署人按顺序或并行签署同一文档。
  • 邮件通知:自动发送签署邀请和完成通知邮件。
  • API接口:提供REST API,可以集成到现有应用中。
  • Webhook:签署完成后通过Webhook通知你的系统。
  • 审计日志:记录完整的签署过程,包括IP地址、时间戳等。
  • 多语言:支持中文在内的多种语言界面。

Docker部署教程

DocuSeal推荐使用Docker部署,步骤如下:

1. 创建docker-compose.yml

version: "3"
services:
  docuseal:
    image: docuseal/docuseal:latest
    ports:
      - "3000:3000"
    volumes:
      - docuseal-data:/data
    environment:
      - DATABASE_URL=sqlite3:/data/docuseal.sqlite3
      - RAILS_ENV=production
      - SECRET_KEY_BASE=your-random-secret-key-here

volumes:
  docuseal-data:

2. 启动服务

docker-compose up -d

3. 访问初始化

打开浏览器访问 http://your-server:3000,按照向导创建管理员账户。

4. 配置邮件(可选)

在环境变量中添加SMTP配置:

SMTP_ADDRESS=smtp.example.com
SMTP_PORT=587
SMTP_USERNAME=your-email@example.com
SMTP_PASSWORD=your-password
SMTP_DOMAIN=example.com

与DocuSign对比

特性DocuSeal(自部署)DocuSign(SaaS)
价格免费开源$10-60/月/用户
数据控制完全在自己服务器存储在DocuSign云端
自定义可完全自定义受限于平台功能
法律效力取决于当地法律全球认可
合规认证需要自行确保SOC 2、ISO 27001等
维护成本需要自行运维平台托管

适合谁使用

  • 中小团队:需要内部合同签署,但不想为每个用户付费。
  • 数据敏感行业:不想将签署文档存储在第三方云端。
  • 定制化需求:需要将签署功能集成到自己的业务系统中。
  • 学习和研究:想了解电子签名系统的技术实现。

注意事项

  • 电子签名的法律效力因国家和地区而异,重要合同建议咨询法律专业人士。
  • 自部署需要自行负责服务器安全、数据备份和SSL证书配置。
  • 对于需要全球法律认可的签署场景,DocuSign等成熟SaaS仍然是更稳妥的选择。

来源:

DocuSign是全球最知名的电子签名服务,但其定价对中小站长和创业团队来说并不友好。DocuSeal...

3天前 49
评论 抢沙发

请登录后发表评论

    暂无评论内容