# AI交易竞技场

`AI交易` `强化学习` `LLM` `加密货币` `技能提取` `多智能体`

# Agent Arena

**AI 能通过观察 AI 交易来学习交易吗？**

一个探索自主 AI 学习的实验平台。多个 LLM 交易员在模拟加密货币期货市场上竞争（使用 Binance 实时行情数据），同时一个观察者智能体监视每一个决策和结果，识别获胜模式，并将其编写为可复用的技能。

> **注意：** 这是一个模拟交易仿真——不涉及真实资金。

## 实验内容

核心问题：AI 能否仅通过观察其他 AI 交易来提取交易知识？

```
┌─────────────────────────────────────────────────────────────────┐
│                        AGENT ARENA                               │
├─────────────────────────────────────────────────────────────────┤
│                                                                  │
│   AI 交易员（GPT、Llama、Qwen）                                  │
│         │                                                        │
│         ▼                                                        │
│   ┌─────────────┐    Binance 实时    ┌──────────────┐           │
│   │    决策     │ ◄─── 行情数据      │     结果     │           │
│   └──────┬──────┘                    └──────┬───────┘           │
│          │                                  │                    │
│          └──────────────┬───────────────────┘                    │
│                         ▼                                        │
│               ┌─────────────────┐                                │
│               │  观察者智能体   │                                │
│               │  （监视一切）   │                                │
│               └────────┬────────┘                                │
│                        ▼                                         │
│               ┌─────────────────┐                                │
│               │   习得技能      │                                │
│               │（Markdown +     │                                │
│               │   向量嵌入）    │                                │
│               └────────┬────────┘                                │
│                        ▼                                         │
│               ┌─────────────────┐                                │
│               │  技能感知智能体 │                                │
│               │  应用习得的     │                                │
│               │    交易智慧     │                                │
│               └─────────────────┘                                │
│                                                                  │
│   "交易竞技场是实验室，观察者是科学家"                           │
└─────────────────────────────────────────────────────────────────┘
```

## 工作原理

1. **AI 交易员** — LLM 智能体（GPT、Llama、Qwen）每 5 分钟基于真实行情数据自主做出交易决策
2. **观察者智能体** — 使用 Claude Opus 分析数千个决策及其结果
3. **技能提取** — 获胜模式被提炼为带统计置信度的版本化技能
4. **知识复用** — 技能感知智能体通过语义搜索检索并应用习得的知识

## 快速开始

```bash
# 安装
pip install -e ".[dev,api]"

# 配置环境
cp .env.example .env
# 填入你的 API 密钥：ANTHROPIC_API_KEY、OPENAI_API_KEY、TOGETHER_API_KEY

# 启动带仪表盘的 API 服务
uvicorn agent_arena.api.app:app --reload --port 8000

# 启动前端（另开终端）
cd frontend && npm install && npm run dev

# 触发观察者分析
curl -X POST http://localhost:8000/api/observer/analyze
```

## 智能体层级

| 层级 | 用途 | 智能体 |
|------|------|--------|
| **学习层** | 应用并改进技能 | 技能感知交易员、纯技能交易员 |
| **数据生成层** | 生成决策/结果数据 | GPT-4、Qwen、Llama、DeepSeek |
| **基准层** | 基准测试（无 LLM 成本） | 技术分析机器人、指数基金 |
| **观察层** | 提取模式、编写技能 | Claude Opus |

## 技术栈

- **后端：** Python、FastAPI、LangGraph
- **大模型：** Claude、GPT、Llama、Qwen（通过 Together AI）
- **数据库：** SQLite（默认）或 PostgreSQL + pgvector（用于语义技能检索）
- **前端：** React、TypeScript、Tailwind、Recharts
- **实时通信：** WebSocket 实时更新

## 技能系统

观察者智能体将习得的模式以结构化 Markdown 技能文件的形式保存：

```
skills/
├── trading-wisdom/      # 核心洞察
├── market-regimes/      # 特定市场状态策略
├── risk-management/     # 仓位管理、止损
└── entry-signals/       # 带成功率的入场信号
```

技能特性：
- 在 PostgreSQL 中以内容哈希进行版本管理
- 通过向量嵌入支持语义搜索（pgvector）
- 随着模式被验证或推翻而持续优化

## 项目结构

```
agent_arena/
├── core/               # 稳定核心（竞技场、运行器、模型）
├── agents/             # 智能体实现
│   ├── observer_agent.py    # 观察与学习
│   ├── skill_aware_*.py     # 应用习得技能
│   ├── learning_*.py        # 基于 RAG 的学习
│   └── *_trader.py          # 数据生成交易员
├── agentic/            # LangGraph 工具与记忆
├── providers/          # Binance 行情数据
├── storage/            # SQLite & PostgreSQL
└── api/                # FastAPI + WebSocket

frontend/               # React 仪表盘
skills/                 # 习得的交易技能
configs/                # 竞争配置
```

## 配置

参见 `configs/lean_diverse.yaml`，这是一个成本优化配置（约 5 美元/天），包含 11 个智能体。

## 许可证

MIT