整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:

如何免费将PDF转成HTML网页?

TML是网页的标准格式,具有良好的可读性和可访问性以及更强的可编辑性。与PDF相比,HTML文档更容易进行修改和更新。将PDF转换为HTML后,文档内容可以在各种浏览器和设备上自由查看,为用户提供更便捷的访问体验。

另外将PDF转成HTML网页后也有助于提升信息的传播和分享效率,由于HTML文档可以直接在浏览器中打开,用户可以方便地与他人分享和传播文档内容,无需担心格式兼容性问题。

那么如何将PDF转成HTML网页呢?

方法一:

使用在线转换工具是最简单、最快捷的方式之一。一些在线工具例如smallpdf中文版、speedpdf、ilovepdf中文版等都提供了PDF转HTML的功能;

它们的操作方法也非常简单,跟其他在线工具不同的是smallpdf中文版还支持一键批量转换和下载,所以下面用smallpdf中文版操作步骤为例:

1、打开浏览器输入smallpdf中文版搜索并找到官网并进入,在首页找到或直接在右上角的搜索框查找并选择PDF转HTML进入转换;

2、点击“选择文件”添加需要转换的PDF文件;接着勾选“文件名称”前的边框,右上角就会出现“批量转换”按钮,点击即可一键开始转换已添加的所有文档,无需一个一个点击转换。等待转换完成后同样的一键批量下载即可。

方法二:

另外也可以使用转换器来实现,有一个PDF转换器是可以将PDF转成HTML的,例如极速玩转,操作方法如下:

1、打开极速玩转转换器,在“PDF转换”中找到并选择“PDF转HTML”;

2、将所有需要转换的PDF文件拖到转换区域后,点击右下角的开始转换即可一键批量处理。

以上就是将PDF文件转成网页的两种方法,可以根据实际需要选择合适的方法。

DF文件是工作学习中的常客,在使用过程中,常常需要对PDF格式进行转换,包括但不限于PDF转Word、PDF转PPT、PDF转图片等等。

不过WPS虽然应用广泛,但是里面关于PDF的转换工具必需要会员才可以使用,但又不愿意只为了转换一次而花费钱去买会员,本文为大家提供了5款免费在线转换PDF的网站,建议收藏以备不时之需~

1、i love pdf

I LOVE PDF是一款免费的PDF网站,界面设计简洁,首页没有广告,但每个功能的操作界面是有广告的,不会影响使用。

部分功能:合并PDF、拆分PDF、压缩PDF、PDF转换至Word、PDF转换至PowerPoint、PDF转换至Excel、word转换至PDF文件、PowerPoint转换至PDF、Excel转换至PDF、PDF转JPG、JPG转PDF、页码、水印、旋转PDF、HTML转换PDF、PDF解密、PDF加密、排版PDF文件、PDF转换PDF/A、修复PDF

2、迅捷PDF转换器

免费的在线文档格式转换软件,不仅有常见的格式,还有诸多不常见文档格式在这里都有,包括电子书格式转换,一个网站解决各种文档格式转换问题。

部分功能:
文档转换→DF转换至Word、PDF转换至PowerPoint、PDF转换至Excel、word转换至PDF文件、PowerPoint转换至PDF、Excel转换至PDF、PDF转JPG、JPG转PDF

文档处理→PDF台并、PDF分割、PDF解密、PDF增加密码、PDF修改密码、PDF图片获取、PDF删除页、PDF页面提取、PDF旋转、PDF页面编辑、PDF替换文字、PDF添加水印、PDF删除水印、PDF添加文字、PDF删除文字、PDF链接编辑、PDF添加页码、PDF删除图片、PDF背景颜色、PDF签名等

除此之外,还有音视频格式转等功能,网站功能免费,页面没有广告,可以放心使用。

3、PDF Candy

转换为PDF和20多种格式的文件。此外,PDF Candy提供47种在线工具来处理PDF:编辑、拆分、合并、压缩等等。

4、all to all

ALL TO ALL在线格式转换,国内最全类型的在线文件转换平台,免费、快速,无须下载安装任何软件。支持约200多种格式的文件转换,包括:视频、音频、图片、字体等多媒体文件,以及常见的office文件、PDF、电子书等文档。

5、online2pdf

ONLINE2PDF是个完全免费的良心线上PDF编辑网站,需要配合自带翻译功能的浏览器使用,目前国内访问正常,功能丰富,操作简便。


以上就是全部的内容推荐啦,如果有帮助,记得点个赞吖~

两天有个客户需要把网页转为pdf,之前也没开发过类似的工具,就在百度搜索了一波,主要有下面三种

  1. 在线转pdf
  2. 使用浏览器打印功能转pdf
  3. 使用本地软件工具转pdf

在线转pdf

在百度(我一般用必应)搜索“在线网页转pdf”就有很多可以做这个事的网站,免费的如

  • PDF24Tools

各种pdf的操作都有,免费使用,速度一般。

官网地址https://tools.pdf24.org/zh

PDF24 Tools

  • doctron

开源免费项目,使用golang写的,提供在线转

官网地址http://doctron.lampnick.com/

doctron在线体验demo

还有挺多其他的,可以自己搜索,但是都不符合我的预期。

使用浏览器打印功能转pdf

  1. 在浏览器右键,点击打印或者ctrl+p
  2. 在弹出的打印对话框中找到目标打印机选择“另存为PDF”
  3. 点击“保存”按钮即可下载pdf了

使用本地软件工具转pdf

Doctron,这是我今天要介绍的重头戏。

Doctron是基于Docker、无状态、简单、快速、高质量的文档转换服务。目前支持将html转为pdf、图片(使用chrome(Chromium)浏览器内核,保证转换质量)。支持PDF添加水印。

  • 使用chrome内核保证高质量将HTML转为pdf/图片。
  • 简易部署(提供docker镜像,Dockerfile以及k8s yaml配置文件)。支持丰富的转换参数。转为pdf和图片支持自定义大小。
  • 无状态服务支持。

管他的,先把代码下载下来再说

git clone https://gitcode.net/mirrors/lampnick/doctron.git

仓库

运行

go build
./doctron --config conf/default.yaml

运行截图

转pdf,访问http://127.0.0.1:8080/convert/html2pdf?u=doctron&p=lampnick&url=<url>,更换链接中的url为你需要转换的url即可。

转换效果

然后就可以写程序去批量转换需要的网页了,但是我需要转换的网页有两个需求

1、网站需要会员登录,不然只能看得到一部分

2、需要把网站的头和尾去掉的

这就为难我了,不会go语言啊,硬着头皮搞了,肯定有个地方打开这个url的,就去代码慢慢找,慢慢调试,功夫不负有心人,终于找到调用的地方了。

第一步:添加网站用户登录cookie

添加cookie之前

添加cookie之后

第二步:去掉网站头尾

chromedp.Evaluate(`$('.header').css("display" , "none");
		$('.btn-group').css("display" , "none");
		$('.container .container:first').css("display" , "none");
		$('.breadcrumb').css("display" , "none");
		$('.footer').css("display" , "none")`, &ins.buf),

打开网页后执行js代码把头尾隐藏掉

第三步:程序化,批量自动生成pdf

public static void createPDF(String folder , String cl ,  String pdfFile, String urlhref) {
        try {
            String fileName = pdfFile.replace("/", ":");
            String filePath = folder + fileName;
            File srcFile = new File(filePath);
            File newFolder = new File("/Volumes/disk2/myproject" + File.separator + cl);
            File destFile = new File(newFolder, fileName);
            if(destFile.exists()){
                return;
            }
            if(srcFile.exists()){
                //移动到对应目录
                if(!newFolder.exists()){
                    newFolder.mkdirs();
                }
                FileUtils.moveFile(srcFile , destFile);
                return;
            }
            if(!newFolder.exists()){
                newFolder.mkdirs();
            }
            String url = "http://127.0.0.1:8888/convert/html2pdf?u=doctron&p=lampnick&url="+urlhref;
            HttpEntity<String> entity = new HttpEntity<String>(null, null);
            RestTemplate restTemplate = new RestTemplate();
            ResponseEntity<byte[]> bytes = restTemplate.exchange(url, HttpMethod.GET, entity, byte[].class);
            if (bytes.getBody().length <= 100) {
                if(urlList.containsKey(urlhref)){
                    Integer failCount = urlList.get(urlhref);
                    if(failCount > 3){
                        System.out.println("下载失败:" + cl + " / " + pdfFile +"  " + urlhref);
                        return;
                    }
                    failCount++;
                    urlList.put(urlhref , failCount);
                }else{
                    urlList.put(urlhref , 1);
                }

                createPDF(folder , cl ,  pdfFile , urlhref);
            }else{
                if (!destFile.exists()) {
                    try {
                        destFile.createNewFile();
                    } catch (Exception e) {
                        e.printStackTrace();
                    }
                }
                try (FileOutputStream out = new FileOutputStream(destFile);) {
                    out.write(bytes.getBody(), 0, bytes.getBody().length);
                    out.flush();
                } catch (Exception e) {
                    e.printStackTrace();
                }
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

最终成果:


文件夹分类存放

pdf文件