2.6 KiB
2.6 KiB
AI编程助手技能集
AI代理 技能扩展 图像处理 语音合成 工具集
Agent Skills(AI 代理技能集)
一套面向 AI 编程代理的技能合集。技能是打包好的指令与脚本,用于扩展代理的能力。
技能遵循 Agent Skills 格式。
中文版本:README.zh-CN.md
可用技能
gemini-watermark
通过反向 alpha 混合算法去除图片中可见的 Gemini AI 水印。快速、离线、单一二进制文件,零运行时依赖。
适用场景:
- 去除 AI 生成图片中的 Gemini 星形/闪光 logo 水印
- 批量处理一整个目录的 Gemini 生成图片
- 在发布或分享前清理图片
特性:
- 数学精确的反向 alpha 混合算法
- 三阶段水印检测(自动跳过无水印图片)
- 纯 Python — 无需下载二进制文件,无需网络访问,完全离线
- 仅需依赖:
pip install Pillow numpy - 支持 JPEG、PNG、WebP、BMP 格式
libvips-image
基于 libvips 的高性能图像处理。支持缩放、转换、加水印及批量处理,速度快、内存占用低。
适用场景:
- 缩放、裁剪或生成缩略图
- 格式转换(JPEG、PNG、WebP、AVIF、HEIC)
- 添加水印或文字叠层
- 批量处理大量图片
- 处理需要低内存占用的大图
特性:
- 13 种图像操作(缩放、缩略图、转换、裁剪、旋转、水印、合成、调整、锐化、模糊、翻转、灰度、信息查看)
- 支持并行工作线程的批量处理
- 跨平台:macOS、Linux、Windows
- 支持 uv 的一键安装程序
- 内存占用比 ImageMagick/PIL 低 10-100 倍
qwen3-tts-mlx
在 Apple Silicon 上通过 MLX 本地运行 Qwen3-TTS 语音合成。支持 CustomVoice(预设音色)、VoiceDesign(音色设计)和 VoiceClone(音色克隆),可用于离线旁白与多语言 TTS。
适用场景:
- 在 Mac 上本地生成语音
- 创作旁白、有声书或视频配音
- 需要可控风格或自定义音色设计
特性:
- 内置预设音色(CustomVoice)
- 通过自然语言提示进行音色设计
- 从参考音频克隆音色
- 批量配音脚本
安装
npx skills add AGISeek/agent-skills
使用方法
技能安装后自动可用。当检测到相关任务时,代理会自动调用对应技能。
示例:
在本地生成新闻风格的中文男声旁白
使用 VoiceDesign 创建自定义音色
技能结构
每个技能包含:
SKILL.md— 代理的指令说明scripts/— 辅助脚本(可选)references/— 支持文档(可选)
许可证
MIT