catalog/repos/agiseek--agent-skills.md

2.6 KiB
Raw Permalink Blame History

AI编程助手技能集

AI代理 技能扩展 图像处理 语音合成 工具集

Agent SkillsAI 代理技能集)

一套面向 AI 编程代理的技能合集。技能是打包好的指令与脚本,用于扩展代理的能力。

技能遵循 Agent Skills 格式。

中文版本:README.zh-CN.md

可用技能

gemini-watermark

通过反向 alpha 混合算法去除图片中可见的 Gemini AI 水印。快速、离线、单一二进制文件,零运行时依赖。

适用场景:

  • 去除 AI 生成图片中的 Gemini 星形/闪光 logo 水印
  • 批量处理一整个目录的 Gemini 生成图片
  • 在发布或分享前清理图片

特性:

  • 数学精确的反向 alpha 混合算法
  • 三阶段水印检测(自动跳过无水印图片)
  • 纯 Python — 无需下载二进制文件,无需网络访问,完全离线
  • 仅需依赖:pip install Pillow numpy
  • 支持 JPEG、PNG、WebP、BMP 格式

libvips-image

基于 libvips 的高性能图像处理。支持缩放、转换、加水印及批量处理,速度快、内存占用低。

适用场景:

  • 缩放、裁剪或生成缩略图
  • 格式转换JPEG、PNG、WebP、AVIF、HEIC
  • 添加水印或文字叠层
  • 批量处理大量图片
  • 处理需要低内存占用的大图

特性:

  • 13 种图像操作(缩放、缩略图、转换、裁剪、旋转、水印、合成、调整、锐化、模糊、翻转、灰度、信息查看)
  • 支持并行工作线程的批量处理
  • 跨平台macOS、Linux、Windows
  • 支持 uv 的一键安装程序
  • 内存占用比 ImageMagick/PIL 低 10-100 倍

qwen3-tts-mlx

在 Apple Silicon 上通过 MLX 本地运行 Qwen3-TTS 语音合成。支持 CustomVoice预设音色、VoiceDesign音色设计和 VoiceClone音色克隆可用于离线旁白与多语言 TTS。

适用场景:

  • 在 Mac 上本地生成语音
  • 创作旁白、有声书或视频配音
  • 需要可控风格或自定义音色设计

特性:

  • 内置预设音色CustomVoice
  • 通过自然语言提示进行音色设计
  • 从参考音频克隆音色
  • 批量配音脚本

安装

npx skills add AGISeek/agent-skills

使用方法

技能安装后自动可用。当检测到相关任务时,代理会自动调用对应技能。

示例:

在本地生成新闻风格的中文男声旁白
使用 VoiceDesign 创建自定义音色

技能结构

每个技能包含:

  • SKILL.md — 代理的指令说明
  • scripts/ — 辅助脚本(可选)
  • references/ — 支持文档(可选)

许可证

MIT