91 lines
2.6 KiB
Markdown
91 lines
2.6 KiB
Markdown
# AI编程助手技能集
|
||
|
||
`AI代理` `技能扩展` `图像处理` `语音合成` `工具集`
|
||
|
||
# Agent Skills(AI 代理技能集)
|
||
|
||
一套面向 AI 编程代理的技能合集。技能是打包好的指令与脚本,用于扩展代理的能力。
|
||
|
||
技能遵循 Agent Skills 格式。
|
||
|
||
中文版本:[README.zh-CN.md](README.zh-CN.md)
|
||
|
||
## 可用技能
|
||
|
||
### gemini-watermark
|
||
|
||
通过反向 alpha 混合算法去除图片中可见的 Gemini AI 水印。快速、离线、单一二进制文件,零运行时依赖。
|
||
|
||
**适用场景:**
|
||
- 去除 AI 生成图片中的 Gemini 星形/闪光 logo 水印
|
||
- 批量处理一整个目录的 Gemini 生成图片
|
||
- 在发布或分享前清理图片
|
||
|
||
**特性:**
|
||
- 数学精确的反向 alpha 混合算法
|
||
- 三阶段水印检测(自动跳过无水印图片)
|
||
- **纯 Python** — 无需下载二进制文件,无需网络访问,完全离线
|
||
- 仅需依赖:`pip install Pillow numpy`
|
||
- 支持 JPEG、PNG、WebP、BMP 格式
|
||
|
||
### libvips-image
|
||
|
||
基于 libvips 的高性能图像处理。支持缩放、转换、加水印及批量处理,速度快、内存占用低。
|
||
|
||
**适用场景:**
|
||
- 缩放、裁剪或生成缩略图
|
||
- 格式转换(JPEG、PNG、WebP、AVIF、HEIC)
|
||
- 添加水印或文字叠层
|
||
- 批量处理大量图片
|
||
- 处理需要低内存占用的大图
|
||
|
||
**特性:**
|
||
- 13 种图像操作(缩放、缩略图、转换、裁剪、旋转、水印、合成、调整、锐化、模糊、翻转、灰度、信息查看)
|
||
- 支持并行工作线程的批量处理
|
||
- 跨平台:macOS、Linux、Windows
|
||
- 支持 uv 的一键安装程序
|
||
- 内存占用比 ImageMagick/PIL 低 10-100 倍
|
||
|
||
### qwen3-tts-mlx
|
||
|
||
在 Apple Silicon 上通过 MLX 本地运行 Qwen3-TTS 语音合成。支持 CustomVoice(预设音色)、VoiceDesign(音色设计)和 VoiceClone(音色克隆),可用于离线旁白与多语言 TTS。
|
||
|
||
**适用场景:**
|
||
- 在 Mac 上本地生成语音
|
||
- 创作旁白、有声书或视频配音
|
||
- 需要可控风格或自定义音色设计
|
||
|
||
**特性:**
|
||
- 内置预设音色(CustomVoice)
|
||
- 通过自然语言提示进行音色设计
|
||
- 从参考音频克隆音色
|
||
- 批量配音脚本
|
||
|
||
## 安装
|
||
|
||
```bash
|
||
npx skills add AGISeek/agent-skills
|
||
```
|
||
|
||
## 使用方法
|
||
|
||
技能安装后自动可用。当检测到相关任务时,代理会自动调用对应技能。
|
||
|
||
**示例:**
|
||
```
|
||
在本地生成新闻风格的中文男声旁白
|
||
```
|
||
```
|
||
使用 VoiceDesign 创建自定义音色
|
||
```
|
||
|
||
## 技能结构
|
||
|
||
每个技能包含:
|
||
- `SKILL.md` — 代理的指令说明
|
||
- `scripts/` — 辅助脚本(可选)
|
||
- `references/` — 支持文档(可选)
|
||
|
||
## 许可证
|
||
|
||
MIT |