介绍 · Introduction

Tapestry 是一套面向 Agent 的多平台内容采集、知识综合与展示技能库,把零散网页转化为可回访、可综合、可发布的知识资产。

Tapestry is an agent-native skill library for multi-source web capture, knowledge synthesis, and publishable outputs.

Tapestry transparent logo

一条命令,快速安装。 A single command for a quick installation.

$npx skills add https://github.com/natsufox/tapestry --skill tapestry

$claude plugin marketplace add https://github.com/NatsuFox/Tapestry $claude plugin install tapestry@tapestry-skills
8+ 原生来源抓取 platform-aware crawlers
4 层 采集、Feed、综合、展示 ingest to display
1 条管线 确定性内容智能流程 reproducible pipeline

概览 · Overview

从 URL 到知识资产,Tapestry 把抓取、规范化、综合与展示串成一条可复用的内容智能管线。

A reusable content-intelligence pipeline connecting capture, normalization, synthesis, and display from a single URL.

来源匹配 Match 内容采集 Capture Feed 整理 Feed 综合成章 Synthesis 知识结构 Structure 展示输出 Display 可重现原始采集层 raw captures and evidence 统一 Feed 与知识组织层 feeds, notes, chapters 可分享的展示输出层 display and portal delivery
Match 来源匹配

按 URL、站点特征与平台规则路由到专用 crawler,优先保留来源语义,而不是用粗糙的通用抓取一把梭。

终端操作 · Terminal Operations

真正的产品力不仅在最终页面,也体现在可执行、可观察、可复现的终端工作流里。

A live workflow replay showing how Tapestry executes source ingestion as a real skill, not just a concept on a slide.

zhihu_fetch.cast

真实操作

录屏直接来自一次真实运行。

这不是为了装饰 landing page,而是为了证明 Tapestry 的 skill 工作流可以从命令入口直接落地执行。

流程入口

从单个知乎链接进入整条管线。

录屏展示了如何读取 ingest 规则、选择 crawler、执行采集并继续进入 Tapestry 的后续知识处理过程。

展示价值

把可执行性变成产品说服力。

访问者看到的不是一张静态效果图,而是一套能从来源到知识资产真正跑通的 AI 原生工作流。

知识库 · Knowledge Base

知识库不是附属展示层,而是 Tapestry 把来源内容转化为长期资产之后的直接产品输出。

The knowledge base is the product output of Tapestry’s pipeline: structured, readable, and ready to be revisited.

Tapestry 知识库总览页面
Tapestry 知识库导航细节
Tapestry 知识库阅读区细节
Tapestry 知识库专题页视图

支持来源 · Knowledge Sources

对社区讨论、社交平台、长文发布与通用网页,Tapestry 提供来源感知的抓取路径与统一 schema,让异构内容进入同一条知识管线。

Source-aware ingestion, unified feed normalization, and one knowledge model across communities, social streams, long-form publishing, and generic web pages.

来源感知抓取

不同平台有不同页面结构、评论模型与上下文语义,Tapestry 先按来源类型匹配专用 crawler,再进入统一流程。

统一 Feed 中间层

无论来自知乎、微博还是通用 HTML,最终都会进入可索引、可去重、可继续综合的标准化 Feed 层。

一致的知识输出

异构来源最终不会散落成一堆文件,而是被组织进同一套笔记、章节、目录与展示结果之中。

知乎 Zhihu

覆盖问题、回答、专栏与评论链,适合沉淀中文知识社区中的长链路问答、推演与观点结构。

问题 回答 专栏
Reddit Threaded communities

适合 thread、评论树与社区追问归档,保留讨论层级对后续综合、聚类与引用关系尤为关键。

Threads 评论树 Subreddit
Hacker News Technical link discussions

适合技术链接、评论串与高信号密度讨论,便于把新闻入口、原始链接和开发者反馈合并保存。

Links 评论串 高信号讨论
X / Twitter Fast public signals

适合短帖、转发链与公共信号快照,用来补足长文来源之外的实时舆论与观点传播层。

Posts 转发链 实时信号
微信公众号 WeChat articles

适合图文长文、栏目内容与公众号资料沉淀,把连续发布的内容组织进统一主题与章节体系。

公众号文章 栏目 长文
微博 Weibo trends

适合热度追踪、短消息扩散与公开反应记录,便于保留舆论变化、时间线与公共反馈上下文。

趋势 公开反应 时间线
小红书 Xiaohongshu

适合图文笔记、评论反馈与视觉导向内容,把视觉表达、生活方式语境与文本说明一起纳入知识库。

图文笔记 视觉内容 评论
通用 HTML Generic HTML pages

作为通用后备入口,覆盖普通网页、文章页与未定制站点,保证来源扩展能力不会被平台边界限制。

Fallback 文章页 通用入口