Go to file

- src/ 存放源代码
- docs/ 存放文档
- scripts/ 存放工具脚本
- 移除临时文件

2025-12-03 17:06:53 +08:00

docs

refactor: 重组目录结构

2025-12-03 17:06:53 +08:00

scripts

refactor: 重组目录结构

2025-12-03 17:06:53 +08:00

src/browser-extension

refactor: 重组目录结构

2025-12-03 17:06:53 +08:00

.gitignore

chore: 添加 .gitignore, LICENSE, README.md

2025-12-03 16:47:13 +08:00

LICENSE

chore: 添加 .gitignore, LICENSE, README.md

2025-12-03 16:47:13 +08:00

README.md

refactor: 重组目录结构

2025-12-03 17:06:53 +08:00

README.md

Web2MCP

将网页内容转换为大模型友好格式的工具集。

项目结构

web2mcp/
├── src/                      # 源代码
│   └── browser-extension/    # Chrome 浏览器扩展
│       ├── manifest.json     # 扩展配置
│       ├── popup.html        # 弹出界面
│       ├── popup.js          # 弹出逻辑
│       ├── content.js        # 内容提取脚本
│       ├── content.css       # 样式
│       └── icons/            # 图标
├── docs/                     # 文档
│   ├── INSTALL.md            # 安装指南
│   └── EXTENSION.md          # 扩展详细说明
├── scripts/                  # 工具脚本
│   ├── mcp.py                # Python 网页抓取脚本
│   └── generate_icons.py     # 图标生成脚本
├── README.md
├── LICENSE
└── .gitignore

功能

浏览器扩展

一个 Chrome 扩展，用于截取网页内容并转换为结构化格式。

特性：

🎯 区域框选提取
📄 整页内容提取
📝 多格式输出（Markdown / JSON / XML）
📋 自动复制到剪贴板

安装：

打开 Chrome，访问 chrome://extensions/
开启右上角 开发者模式
点击 加载已解压的扩展程序
选择 src/browser-extension 文件夹

详细安装说明请参考 docs/INSTALL.md

Python 脚本

用于抓取网页并提取结构化内容。

python mcp.py

输出格式示例

Markdown

# 标题

这是一段文字内容。

- 列表项 1
- 列表项 2

JSON

[
  {
    "type": "heading",
    "level": 1,
    "content": "标题"
  },
  {
    "type": "paragraph",
    "content": "这是一段文字内容。"
  }
]

依赖

Python：

pip install requests beautifulsoup4

License

MIT

README.md Unescape Escape

Web2MCP

项目结构

功能

浏览器扩展

Python 脚本

输出格式示例

Markdown

JSON

依赖

License

README.md