catalog/repos/agiseek--agent-skills.md

91 lines
2.6 KiB
Markdown
Raw Normal View History

2026-04-07 11:44:56 +08:00
# AI编程助手技能集
`AI代理` `技能扩展` `图像处理` `语音合成` `工具集`
# Agent SkillsAI 代理技能集)
一套面向 AI 编程代理的技能合集。技能是打包好的指令与脚本,用于扩展代理的能力。
技能遵循 Agent Skills 格式。
中文版本:[README.zh-CN.md](README.zh-CN.md)
## 可用技能
### gemini-watermark
通过反向 alpha 混合算法去除图片中可见的 Gemini AI 水印。快速、离线、单一二进制文件,零运行时依赖。
**适用场景:**
- 去除 AI 生成图片中的 Gemini 星形/闪光 logo 水印
- 批量处理一整个目录的 Gemini 生成图片
- 在发布或分享前清理图片
**特性:**
- 数学精确的反向 alpha 混合算法
- 三阶段水印检测(自动跳过无水印图片)
- **纯 Python** — 无需下载二进制文件,无需网络访问,完全离线
- 仅需依赖:`pip install Pillow numpy`
- 支持 JPEG、PNG、WebP、BMP 格式
### libvips-image
基于 libvips 的高性能图像处理。支持缩放、转换、加水印及批量处理,速度快、内存占用低。
**适用场景:**
- 缩放、裁剪或生成缩略图
- 格式转换JPEG、PNG、WebP、AVIF、HEIC
- 添加水印或文字叠层
- 批量处理大量图片
- 处理需要低内存占用的大图
**特性:**
- 13 种图像操作(缩放、缩略图、转换、裁剪、旋转、水印、合成、调整、锐化、模糊、翻转、灰度、信息查看)
- 支持并行工作线程的批量处理
- 跨平台macOS、Linux、Windows
- 支持 uv 的一键安装程序
- 内存占用比 ImageMagick/PIL 低 10-100 倍
### qwen3-tts-mlx
在 Apple Silicon 上通过 MLX 本地运行 Qwen3-TTS 语音合成。支持 CustomVoice预设音色、VoiceDesign音色设计和 VoiceClone音色克隆可用于离线旁白与多语言 TTS。
**适用场景:**
- 在 Mac 上本地生成语音
- 创作旁白、有声书或视频配音
- 需要可控风格或自定义音色设计
**特性:**
- 内置预设音色CustomVoice
- 通过自然语言提示进行音色设计
- 从参考音频克隆音色
- 批量配音脚本
## 安装
```bash
npx skills add AGISeek/agent-skills
```
## 使用方法
技能安装后自动可用。当检测到相关任务时,代理会自动调用对应技能。
**示例:**
```
在本地生成新闻风格的中文男声旁白
```
```
使用 VoiceDesign 创建自定义音色
```
## 技能结构
每个技能包含:
- `SKILL.md` — 代理的指令说明
- `scripts/` — 辅助脚本(可选)
- `references/` — 支持文档(可选)
## 许可证
MIT