Featured image of post Hermes Agent 实战:用 AI Agent 搭建全自动数据运营系统

Hermes Agent 实战:用 AI Agent 搭建全自动数据运营系统

从数据采集、DuckDB 分析、自动报告到多平台发布——用 Hermes Agent 搭建一个 7×24 小时运转的全自动数据运营系统。30 个自动化任务、横跨 5 个平台的真实案例。

你的人工运维,正在被 Agent 取代

凌晨 3 点,你还在手动执行脚本?

收盘后,你还在复制粘贴数据做日报?

发了文章,你还要去 5 个平台手动发布?

这些工作,AI Agent 已经可以全自动了。

2026 年,以 Hermes Agent 为代表的 AI Agent 框架,正在让「一人运营一个数据产品」成为现实。不再需要写复杂的调度系统、不再需要手动推送、不再需要临晨爬起来看脚本有没有跑崩。

本文不做概念科普,直接上实战——用 Hermes Agent 从零搭建一个全自动数据运营系统。所有代码、配置、管线设计全部开源。


Hermes Agent 是什么?一句话

一个能按计划自动执行任务的 AI 助手,支持工具调用、定时调度、多平台分发、数据持久化。

和传统脚本的区别:

对比项传统脚本Hermes Agent
调度能力crontab内置 cron,支持「每隔 N 分钟」「工作日 15:00」等
数据存储自己写文件DuckDB 数据湖自动管理
多平台分发每个平台写一套 API一次配置,多平台分发
异常处理脚本崩了就崩了自动重试、失败告警
智能决策固定逻辑能搜索、判断、做内容选题
扩展性加功能要改代码加 Skill 即加能力

核心架构极简:LLM(大模型) + Tools(工具) + Skills(技能) + Cron(调度)。每一个部分都可以独立配置、替换、扩展。


实战:搭建你的第一套自动管线

先看一个最简单的例子:每天收盘后,自动分析 A 股板块轮动数据并推送到手机。

Step 1:数据采集

Hermes Agent 可以定时执行任何命令。配置一个交易日 15:00 运行的采集任务:

# collect_sector.py — 从 akshare 拉取 90 个板块数据
import akshare as ak
import duckdb

# 遍历全部 90 个行业板块
sectors = ak.stock_board_industry_name_em()
con = duckdb.connect("sector.duckdb")

for _, row in sectors.iterrows():
    df = ak.stock_board_industry_hist_em(
        symbol=row["板块名称"],
        start_date="20260101",
        end_date="20260601"
    )
    con.execute("INSERT INTO sector_daily SELECT * FROM df")

print(f"✅ 采集 {len(sectors)} 个板块")

核心参数:

  • ak.stock_board_industry_name_em() — 获取全部 90 个板块列表
  • ak.stock_board_industry_hist_em(symbol) — 获取单个板块日线数据
  • DuckDB 存储 — 读取速度快、支持 SQL 窗口函数、零配置

这段代码放在 ~/.hermes/scripts/collect_sector.py,然后配置 Cron:

# 工作日 15:00 自动执行
cron:
  sector_pipeline:
    schedule: "0 15 * * 1-5"
    script: collect_sector.py
    notify_on_failure: true

Step 2:SQL 分析

数据到手后,用 DuckDB 的窗口函数算动量(整个分析只需要 10 行 SQL):

WITH sector_5d AS (
    SELECT sector,
           ROUND((收盘 - FIRST_VALUE(收盘) OVER (
               PARTITION BY sector ORDER BY 日期
           )) / FIRST_VALUE(收盘) OVER (
               PARTITION BY sector ORDER BY 日期
           ) * 100, 2) AS ret_5d
    FROM sector_daily
    WHERE 日期 >= CURRENT_DATE - 5
)
SELECT * FROM sector_5d
WHERE 日期 = (SELECT MAX(日期) FROM sector_daily)
ORDER BY ret_5d DESC LIMIT 10;

这条 SQL 做了三件事:

  1. FIRST_VALUE 窗口函数 — 取 5 天前的收盘价
  2. PARTITION BY sector — 每个板块独立计算
  3. ORDER BY ret_5d DESC — 按 5 日涨幅排序

再包装一个综合评分模型,加入 20 日动量、成交量变化、波动率等因子,就能生成买卖信号。

Step 3:AI 自动分析

Hermes Agent 可以调用 DeepSeek API 对数据进行智能解读:

def generate_report(data):
    prompt = f"""
    你是 A 股量化分析师。分析今日板块轮动:
    
    【强势 Top5】
    {data['top5']}
    
    请给出:市场风格判断、轮动趋势、操作建议。
    """
    
    response = deepseek_client.chat.completions.create(
        model="deepseek-chat",
        messages=[{"role": "user", "content": prompt}]
    )
    return response.choices[0].message.content

不需要复杂的前端,Agent 生成的文本报告可以直接推送到 Telegram 频道。

Step 4:自动推送

配置 Agent 将报告自动发送到 Telegram:

# Agent Skill 配置
skills:
  - sector-analyst

deliver:
  enabled: true
  channels:
    - telegram:
        chat_id: "@duckdblab"

完整运行效果

收盘后 5 分钟,你的手机就会收到这样一条报告:

📊 A股板块轮动日报
📅 2026-06-01 周一

━━━ 市场概览 ━━━
  🟢 48涨 42跌 / 90板块
  成交额: 9856亿

━━━ 领涨 TOP 5 ━━━
  🔥 煤炭开采加工  +10.87%
  📈 电力           +5.70%
  📈 油气开采       +4.28%

━━━ AI 分析 ━━━
🎯 市场风格: 结构性行情
🔥 强势方向: 煤炭、电力
💡 建议: 关注回调后的低吸机会

从数据采集到 AI 分析到手机推送,全程零人工干预。


进阶:5 套实战管线拆解

上面的例子只是一个起点。在我自己运营的系统中,Hermes Agent 每天自动运行 30+ 个任务,覆盖以下场景:

管线一:内容自动生成与多平台发布

这是我最有价值的管线——AI 自动写文章,自动推送到 5 个平台

工作流:

每天 09:00 → AI 搜索今日热点 → 撰写文章
        → 上传公众号草稿箱
        → 推送到 Telegram 频道
        → 同步到 Hugo 博客
        → (可选) 生成短视频

关键 Skill 配置:

daily_content_pipeline:
  schedule: "0 9 * * *"
  skills:
    - web_search        # 搜索热点
    - wechat-viral-article  # 公众号爆款写作
    - china-content-platform-posting  # 多平台发布

实际产出:

时间任务输出
07:00AI 行业日报生成198007.xyz 自动更新
09:00公众号日更 → 草稿箱WeChat 后台自动推送
10:30每日新工具推荐博客 + 频道同步
14:00AI 工具评测长文章 + 多平台
18:00科技简报推送Telegram 头条号
20:00爆款资讯 → 公众号晚间流量高峰

效率对比:以前每天要花 2-3 小时写文章、手动发布。现在 Agent 7×24 自动运转,每月产出 30+ 篇原创内容。

管线二:板块轮动监控系统

完整的量化数据管线:

15:00 → akshare 采集 90 板块
15:01 → DuckDB 窗口函数算动量
15:02 → 综合评分模型 → 买卖信号
15:03 → DeepSeek AI 分析
15:05 → 报告推送到 Telegram
        → Streamlit 看板自动刷新

技术栈:Python + akshare + DuckDB + Streamlit + DeepSeek

数据存储使用统一数据湖架构:

~/.hermes/data-lake/
├── sector.duckdb      # 板块日线数据
├── pipeline_log.duckdb # 运行日志
└── cron_history.duckdb  # 内容去重

亮点: 看板通过 Cloudflare Tunnel 公网暴露,手机浏览器随时查看,比打开交易软件快 10 倍。

管线三:YouTube Shorts 自动生成

AI 每天自动生产 5 条 DuckDB 技巧 Shorts:

① Agent 选题 → 写文案(英文)
② edge-tts 生成配音
③ Remotion 渲染视频
④ 上传到 YouTube
⑤ 全平台推广

一条 30 秒的技术 Shorts,从选题到发布 全自动。以前做一个视频需要 1-2 小时,现在 Agent 每天出 5 条。

管线四:GitHub 变现项目分析

每天自动扫描 GitHub Trending,筛选有变现潜力的开源项目:

20:00 → GitHub Search API 采集 200 个项目
     → 4 维变现评分模型打分
     → Top5 项目推送到 Telegram
     → 写入 cron_history 防重复

评分维度:

维度权重说明
技术相关性30%是否是你技术栈内的项目
变现潜力30%能否包装成 SaaS/教程/咨询
活跃度25%Star 增长、最近 commit
竞争度15%同类工具数量

这个管线让我每天花 30 秒浏览推送,就能发现值得深入研究的项目。

管线五:网站健康自动监控

每天自动检测 5 个站点的运行状况:

HTTP 状态 → SSL 证书 → DNS 解析 → 页面加载 → 反爬检测
→ 生成 HTML 报告 → 推送到 Telegram
→ 异常自动告警

以前靠人工巡检,经常是「网站挂了三天才发现」。现在 Agent 每小时检查一次,出问题立刻通知。


架构设计:单一数据湖 + 模块化 Skill

整个系统的核心设计理念——所有数据统一存放,每个功能独立为 Skill

数据湖

所有管线共享一个 DuckDB 数据湖,避免数据孤岛:

data_lake:
  path: "~/.hermes/data-lake/"
  databases:
    sector.duckdb:       # 板块轮动数据
    pipeline_log.duckdb:  # 管线运行日志
    cron_history.duckdb:  # 内容发布历史
    umami.duckdb:        # 网站分析数据

这样做的好处:

  • 去重:发布内容前查询 cron_history,避免重复
  • 审计:pipeline_log 记录每次运行的耗时、结果
  • 跨管线分析:可以写 SQL 关联不同数据源

Skill 模块化

每个管线对应一个独立 Skill,可单独启用、调试、迭代:

skills/
├── sector-pipeline/      # 板块轮动
├── daily-article/        # 每日文章
├── github-analyzer/      # GitHub 分析
├── website-monitor/      # 网站监控
└── video-pipeline/       # 视频生成

增加新功能就是新增一个 Skill 文件夹,不需要改现有代码。

去重机制(关键坑)

内容型 cron 任务最大的问题是重复推送。同一篇文章、同一条项目被推了两次,用户会取消关注。

解决:统一去重数据库 + 强制搜索验证。

def check_duplicate(title):
    """发布前检查是否已推送过"""
    con = duckdb.connect("~/.hermes/data-lake/cron_history.duckdb")
    count = con.execute("""
        SELECT COUNT(*) FROM cron_history
        WHERE content LIKE ?
    """, [f"%{title[:20]}%"]).fetchone()[0]
    return count > 0  # 重复则跳过

禁止直接用模板用语。每次生成必须包含:

  1. Topic 轮换池(至少 10 个方向)
  2. 实时搜索最新信息
  3. 不同标题结构

为什么选 Hermes Agent 而不是其他方案?

市面上有 n8n、Make、Zapier 等自动化工具,但 Hermes Agent 有几个独特优势:

1. AI 原生

传统自动化工具只能做「如果 A 那么 B」的固定流程。Hermes Agent 能在任务中调用大模型做判断、生成、筛选

# 传统工具无法实现的逻辑
skills:
  - web_search    # Agent 自主决定搜什么
  - write_article # Agent 自主决定怎么写
  - check_quality # Agent 自主判断质量够不够

2. 纯本地运行

所有工具调用、数据存储都在你的服务器上。不依赖第三方云服务(除了大模型 API),数据安全可控。

3. DuckDB 原生集成

Hermes Agent 的数据层基于 DuckDB,查询速度比 SQLite 快 10 倍以上,支持窗口函数、Parquet 直接查询等高级功能。

4. 极低成本

一个 $5/月的 VPS 就能跑 30+ 个自动化任务。相比 n8n 的 Pro 版 $49/月、Zapier 的 $149/月,成本只有十分之一。


从零搭建:你的第一个 Hermes Agent 任务

安装

# 一键安装
pip install hermes-agent
hermes init
hermes start

配置你的第一个任务

编辑 ~/.hermes/config.yaml

cron:
  my_first_pipeline:
    schedule: "0 9 * * *"
    prompt: |
      今天的任务是:搜索 AI 行业最新动态,
      用中文写一篇 300 字的行业简报,
      推送到我的 Telegram。
    deliver: telegram

启动

hermes start

Agent 会自动运行所有配置的任务。查看运行日志:

hermes log my_first_pipeline

5 分钟内,你就能看到第一条自动推送的内容。


常见陷阱与最佳实践

1. 内容去重是第一优先级

不要相信「Agent 会自动翻新」——不加去重机制,一周内必定出现重复推送。

做法: 统一用 DuckDB 记录历史,生成前先查库。

2. 不要一次配太多任务

从 1-2 个任务开始运行一周,确认稳定后再增加。一次性配 10 个任务,出问题都不知道找谁。

3. 异常必须通知

notify_on_failure: true
alarm_channel: telegram

没有告警的自动化系统 = 不知道什么时候崩了。

4. 定期审计输出

你仍然需要每周检查一次 Agent 的输出质量。

AI 生成的文字、数据、报告的终审责任在你。不需要每天看,但需要每周扫一眼。

5. Pipeline 日志是救命稻草

每次运行都记录耗时、结果、错误信息。出问题时从日志回溯最有效。


效果与数据

我的系统已经稳定运行 60 天+

指标数据
每日自动化任务30+ 个
覆盖平台Telegram / 微信公众号 / B站 / YouTube / Hugo 博客
月均内容产出30+ 篇文章 + 150 条推送 + 150 条 Shorts
运维时间每天 < 30 分钟(审核+异常处理)
服务器成本$15/月
故障率< 2%(主要是上游 API 限流)

以前:每天 2-3 小时写文章、推内容、做数据。

现在:每天 30 分钟审核输出、处理异常。Agent 帮你做了 80% 的重复劳动。


下一步

Hermes Agent 的能力远不止本文展示的。你可以:

  • 📊 接入你自己的数据源(数据库、API、文件)
  • 🎬 自动生成视频内容(Remotion + TTS)
  • 🤖 构建私有知识库(DuckDB + 向量搜索)
  • 🛒 加上支付系统(Gumroad + Stripe)→ 数据产品变现
  • 🌐 扩展到英文市场(英文内容管线 + YouTube SEO)

限于篇幅,本文只拆解了核心架构和 5 套管线。在之后的系列文章中,我会逐一深入:

  1. 《Hermes Agent + DuckDB:数据湖搭建与去重实战》
  2. 《AI 自动写文章:从选题到多平台发布全流程》
  3. 《用 Remotion 自动生成 YouTube Shorts》
  4. 《30 个自动化任务的运维心得》

本文所有代码已开源。

  • Hermes Agent 官方文档:https://hermes-agent.nousresearch.com/docs
  • 板块轮动看板:https://sector.duckdblab.org
  • DuckDB Lab 博客:https://duckdblab.org

如果你也在用 Agent 做自动化,欢迎在评论区交流心得。

🦆 DuckDB 实战派,每周分享数据工程实战。

📺 Watch video tutorials → DuckDB Lab YouTube

Subscribe for more DuckDB & AI automation tutorials

使用 Hugo 构建
主题 StackJimmy 设计