catalog/repos/0xhubed--agent-trading-arena.md

139 lines
6.7 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# AI交易竞技场
`AI交易` `强化学习` `LLM` `加密货币` `技能提取` `多智能体`
# Agent Arena
**AI 能通过观察 AI 交易来学习交易吗?**
一个探索自主 AI 学习的实验平台。多个 LLM 交易员在模拟加密货币期货市场上竞争(使用 Binance 实时行情数据),同时一个观察者智能体监视每一个决策和结果,识别获胜模式,并将其编写为可复用的技能。
> **注意:** 这是一个模拟交易仿真——不涉及真实资金。
## 实验内容
核心问题AI 能否仅通过观察其他 AI 交易来提取交易知识?
```
┌─────────────────────────────────────────────────────────────────┐
│ AGENT ARENA │
├─────────────────────────────────────────────────────────────────┤
│ │
│ AI 交易员GPT、Llama、Qwen
│ │ │
│ ▼ │
│ ┌─────────────┐ Binance 实时 ┌──────────────┐ │
│ │ 决策 │ ◄─── 行情数据 │ 结果 │ │
│ └──────┬──────┘ └──────┬───────┘ │
│ │ │ │
│ └──────────────┬───────────────────┘ │
│ ▼ │
│ ┌─────────────────┐ │
│ │ 观察者智能体 │ │
│ │ (监视一切) │ │
│ └────────┬────────┘ │
│ ▼ │
│ ┌─────────────────┐ │
│ │ 习得技能 │ │
│ │Markdown + │ │
│ │ 向量嵌入) │ │
│ └────────┬────────┘ │
│ ▼ │
│ ┌─────────────────┐ │
│ │ 技能感知智能体 │ │
│ │ 应用习得的 │ │
│ │ 交易智慧 │ │
│ └─────────────────┘ │
│ │
│ "交易竞技场是实验室,观察者是科学家" │
└─────────────────────────────────────────────────────────────────┘
```
## 工作原理
1. **AI 交易员** — LLM 智能体GPT、Llama、Qwen每 5 分钟基于真实行情数据自主做出交易决策
2. **观察者智能体** — 使用 Claude Opus 分析数千个决策及其结果
3. **技能提取** — 获胜模式被提炼为带统计置信度的版本化技能
4. **知识复用** — 技能感知智能体通过语义搜索检索并应用习得的知识
## 快速开始
```bash
# 安装
pip install -e ".[dev,api]"
# 配置环境
cp .env.example .env
# 填入你的 API 密钥ANTHROPIC_API_KEY、OPENAI_API_KEY、TOGETHER_API_KEY
# 启动带仪表盘的 API 服务
uvicorn agent_arena.api.app:app --reload --port 8000
# 启动前端(另开终端)
cd frontend && npm install && npm run dev
# 触发观察者分析
curl -X POST http://localhost:8000/api/observer/analyze
```
## 智能体层级
| 层级 | 用途 | 智能体 |
|------|------|--------|
| **学习层** | 应用并改进技能 | 技能感知交易员、纯技能交易员 |
| **数据生成层** | 生成决策/结果数据 | GPT-4、Qwen、Llama、DeepSeek |
| **基准层** | 基准测试(无 LLM 成本) | 技术分析机器人、指数基金 |
| **观察层** | 提取模式、编写技能 | Claude Opus |
## 技术栈
- **后端:** Python、FastAPI、LangGraph
- **大模型:** Claude、GPT、Llama、Qwen通过 Together AI
- **数据库:** SQLite默认或 PostgreSQL + pgvector用于语义技能检索
- **前端:** React、TypeScript、Tailwind、Recharts
- **实时通信:** WebSocket 实时更新
## 技能系统
观察者智能体将习得的模式以结构化 Markdown 技能文件的形式保存:
```
skills/
├── trading-wisdom/ # 核心洞察
├── market-regimes/ # 特定市场状态策略
├── risk-management/ # 仓位管理、止损
└── entry-signals/ # 带成功率的入场信号
```
技能特性:
- 在 PostgreSQL 中以内容哈希进行版本管理
- 通过向量嵌入支持语义搜索pgvector
- 随着模式被验证或推翻而持续优化
## 项目结构
```
agent_arena/
├── core/ # 稳定核心(竞技场、运行器、模型)
├── agents/ # 智能体实现
│ ├── observer_agent.py # 观察与学习
│ ├── skill_aware_*.py # 应用习得技能
│ ├── learning_*.py # 基于 RAG 的学习
│ └── *_trader.py # 数据生成交易员
├── agentic/ # LangGraph 工具与记忆
├── providers/ # Binance 行情数据
├── storage/ # SQLite & PostgreSQL
└── api/ # FastAPI + WebSocket
frontend/ # React 仪表盘
skills/ # 习得的交易技能
configs/ # 竞争配置
```
## 配置
参见 `configs/lean_diverse.yaml`,这是一个成本优化配置(约 5 美元/天),包含 11 个智能体。
## 许可证
MIT