整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:

开发者工具怎么导出当前HTML

导出当前HTML页面,可以按照以下步骤操作:

1、打开浏览器:首先,在你的电脑上打开一个支持开发者工具的浏览器(如Chrome、Firefox或Edge)。

2、打开开发者工具:通过按下`F12`键或在浏览器的地址栏输入`chrome://inspect/#devices`(对于Chrome)、`about:debugging`(对于Firefox)或者右键点击页面上的任何元素并选择“检查”(对于所有浏览器),以打开开发者工具。

3、定位到元素面板:在开发者工具的顶部菜单中,找到并点击“Elements”(在Chrome和Edge中)或“Inspector”(在Firefox中),这将打开元素面板,显示当前页面的HTML结构。

4、选择要导出的HTML:在元素面板中,你可以看到页面的HTML代码。你可以通过点击左上角的箭头图标选择页面上的元素,对应的HTML代码将在元素面板中高亮显示。你也可以在元素面板中编辑HTML代码。

5、导出HTML代码:一旦确定要导出的HTML部分,可以使用以下几种方法之一来导出:

在元素面板中,右键点击选择的HTML代码,然后选择“Edit as HTML”或类似选项,这将打开一个新的编辑器窗口,其中包含所选HTML的完整代码。接下来,你可以通过复制这段代码并粘贴到文件中来保存。

使用快捷键`Ctrl+C`或`Cmd+C`来复制选定的HTML代码。

6、保存HTML代码:最后,将复制的HTML代码粘贴到合适的位置,以便将其保存在本地文件系统中。

以上步骤综合了不同开发环境下的开发者工具的使用方式,无论是在Windows、Mac还是Linux操作系统下,都可以根据自己常用的开发工具来进行相应的操作。

器之心报道

项目作者:vinayak mehta参与:一鸣

从 PDF 表格中获取数据是一项痛苦的工作。不久前,一位开发者提供了一个名为 Camelot 的工具,使用三行代码就能从 PDF 文件中提取表格数据。

PDF 文件是一种非常常用的文件格式,通常用于正式的电子版文件。它能够很好的将不同的排版格式固定下来,形成版面清晰且美观的展示效果。然而,对于想要从 PDF 中提取信息的人们来说,PDF 是个噩梦,尤其是表格。

大量的学术报告、论文、分析文章都使用 PDF 展示其中的表格数据,但是对于如果想要直接从表格中复制数据则会非常麻烦。不久前,有一位开发者提供了一个可从文字 PDF 中提取表格信息的工具——Camelot,能够直接将大部分表格转换为 Pandas 的 Dataframe。

  • 项目地址:https://github.com/camelot-dev/camelot

Camelot 是什么

据项目介绍称,Camelot 是一个 Python 工具,用于将 PDF 文件中的表格数据提取出来。

具体而言,用户可以像使用 Pandas 那样打开 PDF 文件,然后利用这个工具提取表格数据,最后再指定输出的形式(如 csv 文件)。

代码示例

项目提供的 PDF 文件如图所示,假设用户需要提取这些文字之间的表格 2-1 中的信息。

PDF 文件。我们需要提取表格 2-1。

使用 Camelot 提取表格数据的代码如下:

>>> import camelot
>>> tables = camelot.read_pdf('foo.pdf') #类似于Pandas打开CSV文件的形式
>>> tables[0].df # get a pandas DataFrame!
>>> tables.export('foo.csv', f='csv', compress=True) # json, excel, html, sqlite,可指定输出格式
>>> tables[0].to_csv('foo.csv') # to_json, to_excel, to_html, to_sqlite, 导出数据为文件
>>> tables
<TableList n=1>
>>> tables[0]
<Table shape=(7, 7)> # 获得输出的格式
>>> tables[0].parsing_report
{
 'accuracy': 99.02,
 'whitespace': 12.24,
 'order': 1,
 'page': 1
}

以下为输出的结果,对于合并的单元格,Camelot 在抽取后做了空行处理,这是一个稳妥的方法。

安装方法

项目作者提供了三种安装方法。首先,你可以使用 Conda 进行安装,这是最简单的。

conda install -c conda-forge camelot-py

最流行的安装方法是使用 pip 安装。

pip install camelot-py[cv]

还可以从项目中克隆代码,并使用源码安装。

言 | 问题背景

SpreadJS表格控件有着很强大的纯前端的导入导出功能,可以直接在纯前端导入导出Excel,通过扩展还可以实现服务器端导入导出。是用户最常使用的功能之一。

使用规范

JS文件的引入

导入导出功能需要在引入SpreadJS基本JS文件的基础上额外引入两个文件:

  • gc.spread.excelio.xx.x.x.min.js(必选)
  • FileSaver.js(可选)

1、 gc.spread.excelio.xx.x.x.min.js是导入导出的核心文件,里面包含了导出导出的逻辑,将用户提供的表格序列化ssjson文件转换成Excel类型(前端对应为application/zip)的一个blob二进制对象。这里注意因为Excel本身是一个压缩格式,所以转换的对象类型对应为application/zip,如果需要转换为其他形式,请自行处理,例如将该对象base64编码后转换为字符串或者流等。

2、 FileSaver.js是第三方开源的一个js组件,用户做前端文件下载保存的功能。故而不是必须的,也可以自己处理相关操作或者用其他的类型功能组件进行替换。这里注意的是如果需要导出至服务器端,那么不需要引入此js文件。可以直接将blob对象通过请求发至服务器端并在服务器端保存成Excel格式的文件即可。

浏览器支持

SpreadJS本身使用了html5的canvas技术,所以浏览器支持必须是支持html5的浏览器,例如:chrome,firefox,IE9以上等。

而导入导出功能按照上面所说如果要使用filesaver来做前端下载,那么IE浏览器需要10以上的版本才能支持FileSaver.js,这里跟SpreadJS本身的浏览器支持有些出入。

授权方式

如果是一般的html+js+css这样的web应用开发,导入导出组件不需要授权。只需要对SpreadJS进行授权即可。

如果是typescript开发常见于:angular,react,vue等框架使用,需要对导入导出组件(ExcelIO)进行单独授权,像这样:

GC.Spread.Sheets.LicenseKey = Excel.LicenseKey = "yourkey";

常见问题解决办法

由于我们示例代码中导入导出部分加入了try catch的异常捕获,这样会导致异常很难定位,这里列出常见可能会出问题的情况:

  1. 导入时Excel文件是否为xlsx格式,SpreadJS支持的导入格式必须为xlsx格式
  2. FileSaver.js文件是否引用(这里有个前提,需要做纯前端导出,并且使用的是我们官网例子中的方式)
  3. 如果使用了FileSaver请注意浏览器的支持范围(参考上面第二点浏览器支持)
  4. 如果是框架开发,是否对ExcelIO组件进行授权(参考上面第三点授权方式中的描述)

如果上述仍然没有排查出问题,可以将try catch的异常捕获去掉来定位原因。

点击“了解更多”下载产品最新试用版

↓↓↓