# AI交易竞技场 `AI交易` `强化学习` `LLM` `加密货币` `技能提取` `多智能体` # Agent Arena **AI 能通过观察 AI 交易来学习交易吗?** 一个探索自主 AI 学习的实验平台。多个 LLM 交易员在模拟加密货币期货市场上竞争(使用 Binance 实时行情数据),同时一个观察者智能体监视每一个决策和结果,识别获胜模式,并将其编写为可复用的技能。 > **注意:** 这是一个模拟交易仿真——不涉及真实资金。 ## 实验内容 核心问题:AI 能否仅通过观察其他 AI 交易来提取交易知识? ``` ┌─────────────────────────────────────────────────────────────────┐ │ AGENT ARENA │ ├─────────────────────────────────────────────────────────────────┤ │ │ │ AI 交易员(GPT、Llama、Qwen) │ │ │ │ │ ▼ │ │ ┌─────────────┐ Binance 实时 ┌──────────────┐ │ │ │ 决策 │ ◄─── 行情数据 │ 结果 │ │ │ └──────┬──────┘ └──────┬───────┘ │ │ │ │ │ │ └──────────────┬───────────────────┘ │ │ ▼ │ │ ┌─────────────────┐ │ │ │ 观察者智能体 │ │ │ │ (监视一切) │ │ │ └────────┬────────┘ │ │ ▼ │ │ ┌─────────────────┐ │ │ │ 习得技能 │ │ │ │(Markdown + │ │ │ │ 向量嵌入) │ │ │ └────────┬────────┘ │ │ ▼ │ │ ┌─────────────────┐ │ │ │ 技能感知智能体 │ │ │ │ 应用习得的 │ │ │ │ 交易智慧 │ │ │ └─────────────────┘ │ │ │ │ "交易竞技场是实验室,观察者是科学家" │ └─────────────────────────────────────────────────────────────────┘ ``` ## 工作原理 1. **AI 交易员** — LLM 智能体(GPT、Llama、Qwen)每 5 分钟基于真实行情数据自主做出交易决策 2. **观察者智能体** — 使用 Claude Opus 分析数千个决策及其结果 3. **技能提取** — 获胜模式被提炼为带统计置信度的版本化技能 4. **知识复用** — 技能感知智能体通过语义搜索检索并应用习得的知识 ## 快速开始 ```bash # 安装 pip install -e ".[dev,api]" # 配置环境 cp .env.example .env # 填入你的 API 密钥:ANTHROPIC_API_KEY、OPENAI_API_KEY、TOGETHER_API_KEY # 启动带仪表盘的 API 服务 uvicorn agent_arena.api.app:app --reload --port 8000 # 启动前端(另开终端) cd frontend && npm install && npm run dev # 触发观察者分析 curl -X POST http://localhost:8000/api/observer/analyze ``` ## 智能体层级 | 层级 | 用途 | 智能体 | |------|------|--------| | **学习层** | 应用并改进技能 | 技能感知交易员、纯技能交易员 | | **数据生成层** | 生成决策/结果数据 | GPT-4、Qwen、Llama、DeepSeek | | **基准层** | 基准测试(无 LLM 成本) | 技术分析机器人、指数基金 | | **观察层** | 提取模式、编写技能 | Claude Opus | ## 技术栈 - **后端:** Python、FastAPI、LangGraph - **大模型:** Claude、GPT、Llama、Qwen(通过 Together AI) - **数据库:** SQLite(默认)或 PostgreSQL + pgvector(用于语义技能检索) - **前端:** React、TypeScript、Tailwind、Recharts - **实时通信:** WebSocket 实时更新 ## 技能系统 观察者智能体将习得的模式以结构化 Markdown 技能文件的形式保存: ``` skills/ ├── trading-wisdom/ # 核心洞察 ├── market-regimes/ # 特定市场状态策略 ├── risk-management/ # 仓位管理、止损 └── entry-signals/ # 带成功率的入场信号 ``` 技能特性: - 在 PostgreSQL 中以内容哈希进行版本管理 - 通过向量嵌入支持语义搜索(pgvector) - 随着模式被验证或推翻而持续优化 ## 项目结构 ``` agent_arena/ ├── core/ # 稳定核心(竞技场、运行器、模型) ├── agents/ # 智能体实现 │ ├── observer_agent.py # 观察与学习 │ ├── skill_aware_*.py # 应用习得技能 │ ├── learning_*.py # 基于 RAG 的学习 │ └── *_trader.py # 数据生成交易员 ├── agentic/ # LangGraph 工具与记忆 ├── providers/ # Binance 行情数据 ├── storage/ # SQLite & PostgreSQL └── api/ # FastAPI + WebSocket frontend/ # React 仪表盘 skills/ # 习得的交易技能 configs/ # 竞争配置 ``` ## 配置 参见 `configs/lean_diverse.yaml`,这是一个成本优化配置(约 5 美元/天),包含 11 个智能体。 ## 许可证 MIT