[{"content":"引言 在真实业务场景中，JSON 半结构化数据无处不在：API 返回、日志记录、用户行为追踪……面对这类数据，传统关系型数据库往往需要复杂的 ETL 流程才能分析。而 DuckDB 凭借内置的 JSON 支持，让你可以直接对 JSON 文件进行 SQL 查询，无需预先定义 Schema。\n本文将通过一个电商订单分析的完整案例，带你掌握 DuckDB 中 JSON 数据处理的核心技能 …","date":"2026-06-24T00:00:00Z","permalink":"/zh/posts/duckdb-json-data-processing/","title":"DuckDB实战：JSON数据处理全攻略"},{"content":"引言 在生产环境中使用 DuckDB 时，数据安全和可迁移性是绕不开的话题。与传统的客户端-服务器型数据库不同，DuckDB 是一个嵌入式分析引擎，其数据以文件形式存储——这既是优势也是挑战。\n图：DuckDB 备份与迁移整体架构\n本文将通过真实业务场景，系统讲解 DuckDB 的三种核心备份与迁移能力：\nEXPORT DATABASE — 将数据库导出为标准化 SQL 脚本 跨版本升级 — 平滑 …","date":"2026-06-19T00:00:00Z","image":"/images/posts/duckdb-backup-migration/architecture.png","permalink":"/zh/posts/duckdb-backup-migration/","title":"DuckDB实战：数据库备份与迁移"},{"content":"引言 图：DuckDB httpfs API 数据接入架构\n在数据分析的日常工作中，我们经常需要从外部 API 获取数据——无论是第三方服务的 RESTful API、内部微服务接口，还是公开的数据源（如 GitHub API、天气 API 等）。传统方案通常需要编写 Python 脚本调用 requests 库，将数据保存到本地文件后再导入数据库。这个过程涉及多个步骤、多个工具，而且容易出错。 …","date":"2026-06-12T00:00:00Z","permalink":"/zh/posts/duckdb-httpfs-api-data-ingestion/","title":"DuckDB实战：HTTPS/API数据接入"},{"content":"引言 图：DuckDB 模糊搜索与文本处理工具链架构\n在真实业务中，文本搜索是最常见的需求之一：用户输入关键词搜索商品、客服匹配相似工单、日志分析中的模式匹配……传统方案往往需要单独搭建 Elasticsearch 或 Solr，但对于中小规模数据或需要与 SQL 查询深度整合的场景，DuckDB 内置的文本处理功能足以胜任。\n本文将通过一个电商客服工单分类的真实场景，逐步展示 DuckDB 在模 …","date":"2026-06-10T00:00:00Z","permalink":"/zh/posts/duckdb-fuzzy-search-text-processing/","title":"DuckDB实战：模糊搜索与文本处理"},{"content":"为什么要让 DuckDB 与 Pandas/Polars 协同工作？ 在 Python 数据科学生态中，Pandas 和 Polars 是两大主流 DataFrame 库。然而，它们在处理大规模数据时各有瓶颈：\n工具 优势 不足 Pandas 生态丰富、文档完善、用户基数大 单线程、内存占用高、\u0026amp;gt;10GB 数据容易 OOM Polars 多核并行、惰性执行、内存高效 生态相对年轻、API 与 …","date":"2026-06-05T00:00:00Z","image":"/images/posts/duckdb-pandas-polars-cooperation/architecture.png","permalink":"/zh/posts/duckdb-pandas-polars-cooperation/","title":"DuckDB实战：与 Pandas / Polars 协同使用 — Python 集成、数据交换与性能对比"},{"content":"为什么时间序列分析如此重要？ 在数据分析领域，时间序列无处不在——电商的每日销售额、服务器的 CPU 监控指标、网站的逐小时访问量……几乎每个业务场景都离不开时间维度的分析。\n传统数据库处理时间序列时往往面临两大痛点：\n时间戳精度不一致 — 原始数据的时间戳粒度太细（毫秒级），需要按分钟/小时/天归整 时间序列存在空洞 — 某些时间段没有数据，导致图表断断续续 DuckDB 提供了三个强大的工具优 …","date":"2026-06-03T00:00:00Z","image":"/images/posts/duckdb-time-series-analysis/cover.png","permalink":"/zh/posts/duckdb-time-series-analysis/","title":"DuckDB实战：时间序列分析 — date_trunc、generate_series 与滚动聚合"}]