将网页数据抓取到 Excel 最简单的方法

最后更新:May 7, 2025

你是不是也遇到过这种情况:需要从好几个网站上收集产品信息和价格,然后还得手动整理进 Excel 表格?这种重复劳动不仅特别耗时间,还容易出错。别担心,今天就来教你几种最简单高效的办法,让你轻松把网页数据导入 Excel。不管你是刚入门的小白,还是有经验的老手,都能找到适合自己的方法。

用零代码网页爬虫工具一键导出

如果你不想写代码,像 这样的零代码网页爬虫工具绝对是你的好帮手。它们通过可视化操作,让你不用懂编程也能把网站数据一键导出到 Excel。只需要简单设置一下数据提取规则,完全没有技术门槛。

Thunderbit 利用先进的自然语言模型,能智能理解网页结构和内容,不用死磕各种选择器。相比之下,传统工具还得拖拖拽拽、配置模板,学起来费时又费力,自动化抓取也没那么顺畅。

更棒的是,Thunderbit 不光能导出到 Excel,还能一键同步到 Google Sheets、Airtable、Notion 等平台,数据流转特别方便。

三步用 Thunderbit 采集产品数据

第 1 步:打开目标网站,点击侧边栏的“AI 网页爬虫”

装好 Thunderbit 后,打开你想采集数据的网站,在 Thunderbit 侧边栏找到“AI 网页爬虫”入口。

thunderbit_collect_data_step_1

第 2 步:用 AI 智能自定义数据字段

点一下“AI 推荐字段”,系统会自动生成爬虫模板。你可以根据自己的需求,借助 AI 灵活调整模板,选择要提取哪些内容,还能决定数据保存方式——直接复制表格,或者同步到其他平台都行。

thunderbit_collect_data_step_2.gif

第 3 步:一键导出数据到 Excel

确认好所有字段后,运行爬虫。抓取到的数据可以直接复制,也能下载成 Excel 文件,导入表格就是这么简单。

thunderbit_collect_data_step_3.gif

体验 AI 网页数据采集

动手试试!边看边操作,体验全自动的数据采集流程。

利用 Excel 自带的网页查询功能

Excel 自带的网页查询(Web Query)功能,也能直接从网页提取结构化表格数据,还支持定时自动刷新。不过要注意,这个功能只在 Windows 版 Excel 里有。

用 Excel 网页查询采集产品数据的步骤:

  1. 打开 Excel:新建一个工作簿,切换到 数据 选项卡。
  2. 选择“自网页导入”:点“获取外部数据”,再选“自网页”。
  3. 输入网址:把你要采集数据的网站地址填进去,点确定。

excel_web queries_enter_url.png

  1. 选择数据表:Excel 会自动识别网页里的表格,选中你需要的数据表,点“加载”。

excel_web queries_enter_choose_data.png

  1. 检查导入结果:你可以指定数据插入到表格的哪个位置,导入后检查下效果是不是你想要的。

thunderbit_collect_data_step_1.gif

想让数据采集更高效?Thunderbit 不仅能抓取,还能用 AI 自动总结和填充网页内容。

用 Excel VBA 实现自定义采集

如果你有点编程基础,还可以用 VBA(Visual Basic for Applications)实现更复杂的数据采集。VBA 是 Office 自带的编程语言,只能在 Windows 版 Excel 里用。

Excel VBA 采集产品数据的步骤:

  1. 启用开发者工具栏
    • 打开 Excel,点“文件”>“选项”>“自定义功能区”。
    • 勾选“开发工具”。
  2. 添加引用库
    • 在“开发工具”里点“Visual Basic”打开 VBA 编辑器。
    • 依次点“工具”>“引用”,勾选:
      • Microsoft Internet Controls
      • Microsoft HTML Object Library
  3. 编写 VBA 代码提取数据
    • 点“插入”>“模块”
    • 在编辑器里输入 VBA 代码。

excel_vba_insert.png

下面是一个从亚马逊产品页提取商品标题、价格和评分的基础示例:

    Sub ScrapeAmazonPage()
        Dim IE As Object
        Dim html As Object
        Dim productTitle As String
        Dim productPrice As String
        Dim productRating As String
        
        ' 创建 IE 对象
        Set IE = CreateObject("InternetExplorer.Application")
        
        ' 打开亚马逊产品页面
        IE.Visible = True
        IE.navigate "Put Your URL Here"
        
        ' 等待页面加载完成
        Do While IE.Busy Or IE.readyState <> 4
            DoEvents
        Loop
        
        ' 获取 HTML 文档
        Set html = IE.document
        
        ' 提取商品标题
        On Error Resume Next
        productTitle = html.getElementById("productTitle").innerText
        On Error GoTo 0
        
        ' 提取商品价格
        On Error Resume Next
        productPrice = html.getElementsByClassName("a-price-whole")(0).innerText
        On Error GoTo 0
        
        ' 提取商品评分
        On Error Resume Next
        productRating = html.getElementsByClassName("a-icon-alt")(0).innerText
        On Error GoTo 0
        
        ' 输出到 Excel
        With ThisWorkbook.Sheets(1)
            .Cells(1, 1).Value = "Product Title"
            .Cells(1, 2).Value = "Price"
            .Cells(1, 3).Value = "Rating"
            .Cells(2, 1).Value = productTitle
            .Cells(2, 2).Value = productPrice
            .Cells(2, 3).Value = productRating
        End With
        
        ' 清理对象
        IE.Quit
        Set IE = Nothing
        Set html = Nothing
    End Sub
  1. 运行并测试 VBA 脚本
    • 在 VBA 编辑器里运行脚本,或者把脚本绑定到 Excel 按钮上。
    • 检查 Excel 表格里的数据输出,看看格式是不是对的。

excel_vba_result.png

让 AI 帮你搞定繁琐的数据采集,无需写代码,省下时间做更重要的事。试试 的强大功能!

常见问题解答

  1. 什么是网页爬虫?有什么用?

    网页爬虫就是批量从网站收集数据,并整理成表格等格式的工具。它能帮你从多个网站一次性获取信息,比如产品价格,方便你做对比和分析。

  2. Thunderbit 怎么用?

    Thunderbit 让你不用写代码,只需在可视化界面上选择要采集的数据字段,系统就能自动帮你抓取数据,整个流程非常简单。

  3. Thunderbit 除了 Excel,还能导出到哪些平台?

    没问题,Thunderbit 支持导出到 Google Sheets、Airtable、Notion 等多个平台,数据管理更灵活。

  4. 为什么网页查询的数据没自动刷新?

    请确认在 Excel 的 数据 选项卡里启用了“全部刷新”。你还可以在 查询与连接 里设置自动刷新间隔。

  5. 为什么 VBA 代码运行不了?

    请检查是否启用了开发者工具栏,并且勾选了需要的引用库(Microsoft Internet Controls 和 HTML Object Library)。

延伸阅读:

用 AI 实现零门槛自动化办公
Shuai Guan
Shuai Guan
Co-founder/CEO @ Thunderbit. Passionate about cross section of AI and Automation. He's a big advocate of automation and loves making it more accessible to everyone. Beyond tech, he channels his creativity through a passion for photography, capturing stories one picture at a time.
Topics
ExcelAI 网页爬虫
目录
用 AI 提取数据
一键导出数据到 Google Sheets、Airtable 或 Notion
Chrome Store Rating
PRODUCT HUNT#1 Product of the Week
OSZAR »