如何免费将PDF转成HTML网页？

TML是网页的标准格式，具有良好的可读性和可访问性以及更强的可编辑性。与PDF相比，HTML文档更容易进行修改和更新。将PDF转换为HTML后，文档内容可以在各种浏览器和设备上自由查看，为用户提供更便捷的访问体验。

另外将PDF转成HTML网页后也有助于提升信息的传播和分享效率，由于HTML文档可以直接在浏览器中打开，用户可以方便地与他人分享和传播文档内容，无需担心格式兼容性问题。

那么如何将PDF转成HTML网页呢？

方法一：

使用在线转换工具是最简单、最快捷的方式之一。一些在线工具例如smallpdf中文版、speedpdf、ilovepdf中文版等都提供了PDF转HTML的功能；

它们的操作方法也非常简单，跟其他在线工具不同的是smallpdf中文版还支持一键批量转换和下载，所以下面用smallpdf中文版操作步骤为例：

1、打开浏览器输入smallpdf中文版搜索并找到官网并进入，在首页找到或直接在右上角的搜索框查找并选择PDF转HTML进入转换；

2、点击“选择文件”添加需要转换的PDF文件；接着勾选“文件名称”前的边框，右上角就会出现“批量转换”按钮，点击即可一键开始转换已添加的所有文档，无需一个一个点击转换。等待转换完成后同样的一键批量下载即可。

方法二：

另外也可以使用转换器来实现，有一个PDF转换器是可以将PDF转成HTML的，例如极速玩转，操作方法如下：

1、打开极速玩转转换器，在“PDF转换”中找到并选择“PDF转HTML”；

2、将所有需要转换的PDF文件拖到转换区域后，点击右下角的开始转换即可一键批量处理。

以上就是将PDF文件转成网页的两种方法，可以根据实际需要选择合适的方法。

DF文件是工作学习中的常客，在使用过程中，常常需要对PDF格式进行转换，包括但不限于PDF转Word、PDF转PPT、PDF转图片等等。

不过WPS虽然应用广泛，但是里面关于PDF的转换工具必需要会员才可以使用，但又不愿意只为了转换一次而花费钱去买会员，本文为大家提供了5款免费在线转换PDF的网站，建议收藏以备不时之需~

1、i love pdf

I LOVE PDF是一款免费的PDF网站，界面设计简洁，首页没有广告，但每个功能的操作界面是有广告的，不会影响使用。

部分功能：合并PDF、拆分PDF、压缩PDF、PDF转换至Word、PDF转换至PowerPoint、PDF转换至Excel、word转换至PDF文件、PowerPoint转换至PDF、Excel转换至PDF、PDF转JPG、JPG转PDF、页码、水印、旋转PDF、HTML转换PDF、PDF解密、PDF加密、排版PDF文件、PDF转换PDF/A、修复PDF

2、迅捷PDF转换器

免费的在线文档格式转换软件，不仅有常见的格式，还有诸多不常见文档格式在这里都有，包括电子书格式转换，一个网站解决各种文档格式转换问题。

部分功能：
文档转换→DF转换至Word、PDF转换至PowerPoint、PDF转换至Excel、word转换至PDF文件、PowerPoint转换至PDF、Excel转换至PDF、PDF转JPG、JPG转PDF

文档处理→PDF台并、PDF分割、PDF解密、PDF增加密码、PDF修改密码、PDF图片获取、PDF删除页、PDF页面提取、PDF旋转、PDF页面编辑、PDF替换文字、PDF添加水印、PDF删除水印、PDF添加文字、PDF删除文字、PDF链接编辑、PDF添加页码、PDF删除图片、PDF背景颜色、PDF签名等

除此之外，还有音视频格式转等功能，网站功能免费，页面没有广告，可以放心使用。

3、PDF Candy

转换为PDF和20多种格式的文件。此外，PDF Candy提供47种在线工具来处理PDF:编辑、拆分、合并、压缩等等。

4、all to all

ALL TO ALL在线格式转换，国内最全类型的在线文件转换平台，免费、快速，无须下载安装任何软件。支持约200多种格式的文件转换，包括：视频、音频、图片、字体等多媒体文件，以及常见的office文件、PDF、电子书等文档。

5、online2pdf

ONLINE2PDF是个完全免费的良心线上PDF编辑网站，需要配合自带翻译功能的浏览器使用，目前国内访问正常，功能丰富，操作简便。

以上就是全部的内容推荐啦，如果有帮助，记得点个赞吖~

两天有个客户需要把网页转为pdf，之前也没开发过类似的工具，就在百度搜索了一波，主要有下面三种

在线转pdf
使用浏览器打印功能转pdf
使用本地软件工具转pdf

在线转pdf

在百度（我一般用必应）搜索“在线网页转pdf”就有很多可以做这个事的网站，免费的如

PDF24Tools

各种pdf的操作都有，免费使用，速度一般。

官网地址https://tools.pdf24.org/zh

PDF24 Tools

doctron

开源免费项目，使用golang写的，提供在线转

官网地址http://doctron.lampnick.com/

doctron在线体验demo

还有挺多其他的，可以自己搜索，但是都不符合我的预期。

使用浏览器打印功能转pdf

在浏览器右键，点击打印或者ctrl+p
在弹出的打印对话框中找到目标打印机选择“另存为PDF”
点击“保存”按钮即可下载pdf了

使用本地软件工具转pdf

Doctron，这是我今天要介绍的重头戏。

Doctron是基于Docker、无状态、简单、快速、高质量的文档转换服务。目前支持将html转为pdf、图片(使用chrome(Chromium)浏览器内核，保证转换质量)。支持PDF添加水印。

使用chrome内核保证高质量将HTML转为pdf/图片。
简易部署(提供docker镜像,Dockerfile以及k8s yaml配置文件)。支持丰富的转换参数。转为pdf和图片支持自定义大小。
无状态服务支持。

管他的，先把代码下载下来再说

git clone https://gitcode.net/mirrors/lampnick/doctron.git

仓库

运行

go build
./doctron --config conf/default.yaml

运行截图

转pdf，访问http://127.0.0.1:8080/convert/html2pdf?u=doctron&p=lampnick&url=<url>，更换链接中的url为你需要转换的url即可。

转换效果

然后就可以写程序去批量转换需要的网页了，但是我需要转换的网页有两个需求

1、网站需要会员登录，不然只能看得到一部分

2、需要把网站的头和尾去掉的

这就为难我了，不会go语言啊，硬着头皮搞了，肯定有个地方打开这个url的，就去代码慢慢找，慢慢调试，功夫不负有心人，终于找到调用的地方了。

第一步：添加网站用户登录cookie

添加cookie之前

添加cookie之后

第二步：去掉网站头尾

chromedp.Evaluate(`$('.header').css("display" , "none");
		$('.btn-group').css("display" , "none");
		$('.container .container:first').css("display" , "none");
		$('.breadcrumb').css("display" , "none");
		$('.footer').css("display" , "none")`, &ins.buf),

打开网页后执行js代码把头尾隐藏掉

第三步：程序化，批量自动生成pdf

public static void createPDF(String folder , String cl ,  String pdfFile, String urlhref) {
        try {
            String fileName = pdfFile.replace("/", ":");
            String filePath = folder + fileName;
            File srcFile = new File(filePath);
            File newFolder = new File("/Volumes/disk2/myproject" + File.separator + cl);
            File destFile = new File(newFolder, fileName);
            if(destFile.exists()){
                return;
            }
            if(srcFile.exists()){
                //移动到对应目录
                if(!newFolder.exists()){
                    newFolder.mkdirs();
                }
                FileUtils.moveFile(srcFile , destFile);
                return;
            }
            if(!newFolder.exists()){
                newFolder.mkdirs();
            }
            String url = "http://127.0.0.1:8888/convert/html2pdf?u=doctron&p=lampnick&url="+urlhref;
            HttpEntity<String> entity = new HttpEntity<String>(null, null);
            RestTemplate restTemplate = new RestTemplate();
            ResponseEntity<byte[]> bytes = restTemplate.exchange(url, HttpMethod.GET, entity, byte[].class);
            if (bytes.getBody().length <= 100) {
                if(urlList.containsKey(urlhref)){
                    Integer failCount = urlList.get(urlhref);
                    if(failCount > 3){
                        System.out.println("下载失败：" + cl + " / " + pdfFile +"  " + urlhref);
                        return;
                    }
                    failCount++;
                    urlList.put(urlhref , failCount);
                }else{
                    urlList.put(urlhref , 1);
                }

                createPDF(folder , cl ,  pdfFile , urlhref);
            }else{
                if (!destFile.exists()) {
                    try {
                        destFile.createNewFile();
                    } catch (Exception e) {
                        e.printStackTrace();
                    }
                }
                try (FileOutputStream out = new FileOutputStream(destFile);) {
                    out.write(bytes.getBody(), 0, bytes.getBody().length);
                    out.flush();
                } catch (Exception e) {
                    e.printStackTrace();
                }
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

最终成果：

文件夹分类存放

pdf文件

在线咨询

上一篇：[编程基础] 常用html标签使用介绍
下一篇：大数据编程入门：JavaScript语句

您的项目需求

*请认真填写需求信息，我们会在24小时内与您取得联系。

整合营销服务商