# AI编程助手技能集 `AI代理` `技能扩展` `图像处理` `语音合成` `工具集` # Agent Skills(AI 代理技能集) 一套面向 AI 编程代理的技能合集。技能是打包好的指令与脚本,用于扩展代理的能力。 技能遵循 Agent Skills 格式。 中文版本:[README.zh-CN.md](README.zh-CN.md) ## 可用技能 ### gemini-watermark 通过反向 alpha 混合算法去除图片中可见的 Gemini AI 水印。快速、离线、单一二进制文件,零运行时依赖。 **适用场景:** - 去除 AI 生成图片中的 Gemini 星形/闪光 logo 水印 - 批量处理一整个目录的 Gemini 生成图片 - 在发布或分享前清理图片 **特性:** - 数学精确的反向 alpha 混合算法 - 三阶段水印检测(自动跳过无水印图片) - **纯 Python** — 无需下载二进制文件,无需网络访问,完全离线 - 仅需依赖:`pip install Pillow numpy` - 支持 JPEG、PNG、WebP、BMP 格式 ### libvips-image 基于 libvips 的高性能图像处理。支持缩放、转换、加水印及批量处理,速度快、内存占用低。 **适用场景:** - 缩放、裁剪或生成缩略图 - 格式转换(JPEG、PNG、WebP、AVIF、HEIC) - 添加水印或文字叠层 - 批量处理大量图片 - 处理需要低内存占用的大图 **特性:** - 13 种图像操作(缩放、缩略图、转换、裁剪、旋转、水印、合成、调整、锐化、模糊、翻转、灰度、信息查看) - 支持并行工作线程的批量处理 - 跨平台:macOS、Linux、Windows - 支持 uv 的一键安装程序 - 内存占用比 ImageMagick/PIL 低 10-100 倍 ### qwen3-tts-mlx 在 Apple Silicon 上通过 MLX 本地运行 Qwen3-TTS 语音合成。支持 CustomVoice(预设音色)、VoiceDesign(音色设计)和 VoiceClone(音色克隆),可用于离线旁白与多语言 TTS。 **适用场景:** - 在 Mac 上本地生成语音 - 创作旁白、有声书或视频配音 - 需要可控风格或自定义音色设计 **特性:** - 内置预设音色(CustomVoice) - 通过自然语言提示进行音色设计 - 从参考音频克隆音色 - 批量配音脚本 ## 安装 ```bash npx skills add AGISeek/agent-skills ``` ## 使用方法 技能安装后自动可用。当检测到相关任务时,代理会自动调用对应技能。 **示例:** ``` 在本地生成新闻风格的中文男声旁白 ``` ``` 使用 VoiceDesign 创建自定义音色 ``` ## 技能结构 每个技能包含: - `SKILL.md` — 代理的指令说明 - `scripts/` — 辅助脚本(可选) - `references/` — 支持文档(可选) ## 许可证 MIT