64 lines
2.6 KiB
Markdown
64 lines
2.6 KiB
Markdown
# macOS自动化AI技能包
|
||
|
||
`macOS自动化` `AI代理` `辅助功能API` `Claude Code` `窗口管理`
|
||
|
||
# MacPilot 技能包
|
||
|
||
[MacPilot](https://github.com/adhikjoshi/macpilot) 的 AI 代理技能 —— 一个通过辅助功能 API 实现 macOS 自动化的 CLI 工具。
|
||
|
||
这些技能教会 AI 编程代理(Claude Code、Cursor、Codex 等)如何使用 MacPilot 来自动化 macOS 任务:点击按钮、输入文本、管理窗口、处理文件对话框、截图等。
|
||
|
||
## 安装
|
||
|
||
```bash
|
||
npx skills add adhikjoshi/macpilot-skills
|
||
```
|
||
|
||
使用 [skills](https://github.com/vercel-labs/skills) CLI 将技能安装到你选择的代理中。
|
||
|
||
## 可用技能
|
||
|
||
| 技能 | 描述 |
|
||
|------|------|
|
||
| **macpilot-automation** | 核心 macOS 自动化 —— 鼠标、键盘、应用、菜单、剪贴板(含历史记录与搜索)、通知、Shell、系统控制 |
|
||
| **macpilot-ui-inspector** | 通过辅助功能 API 检查并与 UI 元素交互 —— 查找、点击、读取和修改控件 |
|
||
| **macpilot-dialog-handler** | 处理原生文件对话框(打开、保存、打印)—— 导航文件夹、选择文件、关闭弹窗、等待并点击主按钮 |
|
||
| **macpilot-screenshot-ocr** | 截取屏幕截图、OCR 点击(在屏幕上查找并点击文字)、支持暂停/恢复的屏幕录制 |
|
||
| **macpilot-window-manager** | 管理窗口 —— 列出、移动、调整大小、贴靠、全屏、多桌面空间、保存/恢复布局 |
|
||
|
||
## 前置条件
|
||
|
||
1. **已安装 MacPilot** —— 从源码构建或从 [releases](https://github.com/adhikjoshi/macpilot/releases) 下载
|
||
2. **辅助功能权限** —— 在「系统设置 > 隐私与安全性 > 辅助功能」中授权 MacPilot.app
|
||
3. **屏幕录制权限**(用于截图/OCR 技能)—— 在「系统设置 > 隐私与安全性 > 屏幕录制」中授权
|
||
|
||
## 快速开始
|
||
|
||
```bash
|
||
# 将 MacPilot 技能安装到 Claude Code
|
||
npx skills add adhikjoshi/macpilot-skills
|
||
|
||
# 现在可以让 Claude Code 自动化 macOS 操作:
|
||
# "打开 Safari 并导航到 example.com"
|
||
# "截取 Finder 窗口的截图"
|
||
# "将 VS Code 贴靠到左半边,Terminal 贴靠到右半边"
|
||
# "将此文件保存到桌面"
|
||
```
|
||
|
||
## 手动安装
|
||
|
||
如果不想使用 `npx skills`,可以将任意 `SKILL.md` 文件复制到代理的技能目录:
|
||
|
||
```bash
|
||
# Claude Code(项目范围)
|
||
mkdir -p .claude/skills/macpilot-automation
|
||
cp skills/macpilot-automation/SKILL.md .claude/skills/macpilot-automation/
|
||
|
||
# Claude Code(全局范围)
|
||
mkdir -p ~/.claude/skills/macpilot-automation
|
||
cp skills/macpilot-automation/SKILL.md ~/.claude/skills/macpilot-automation/
|
||
```
|
||
|
||
## 许可证
|
||
|
||
MIT |