TML是网页的标准格式,具有良好的可读性和可访问性以及更强的可编辑性。与PDF相比,HTML文档更容易进行修改和更新。将PDF转换为HTML后,文档内容可以在各种浏览器和设备上自由查看,为用户提供更便捷的访问体验。
另外将PDF转成HTML网页后也有助于提升信息的传播和分享效率,由于HTML文档可以直接在浏览器中打开,用户可以方便地与他人分享和传播文档内容,无需担心格式兼容性问题。
那么如何将PDF转成HTML网页呢?
方法一:
使用在线转换工具是最简单、最快捷的方式之一。一些在线工具例如smallpdf中文版、speedpdf、ilovepdf中文版等都提供了PDF转HTML的功能;
它们的操作方法也非常简单,跟其他在线工具不同的是smallpdf中文版还支持一键批量转换和下载,所以下面用smallpdf中文版操作步骤为例:
1、打开浏览器输入smallpdf中文版搜索并找到官网并进入,在首页找到或直接在右上角的搜索框查找并选择PDF转HTML进入转换;
2、点击“选择文件”添加需要转换的PDF文件;接着勾选“文件名称”前的边框,右上角就会出现“批量转换”按钮,点击即可一键开始转换已添加的所有文档,无需一个一个点击转换。等待转换完成后同样的一键批量下载即可。
方法二:
另外也可以使用转换器来实现,有一个PDF转换器是可以将PDF转成HTML的,例如极速玩转,操作方法如下:
1、打开极速玩转转换器,在“PDF转换”中找到并选择“PDF转HTML”;
2、将所有需要转换的PDF文件拖到转换区域后,点击右下角的开始转换即可一键批量处理。
以上就是将PDF文件转成网页的两种方法,可以根据实际需要选择合适的方法。
DF文件是工作学习中的常客,在使用过程中,常常需要对PDF格式进行转换,包括但不限于PDF转Word、PDF转PPT、PDF转图片等等。
不过WPS虽然应用广泛,但是里面关于PDF的转换工具必需要会员才可以使用,但又不愿意只为了转换一次而花费钱去买会员,本文为大家提供了5款免费在线转换PDF的网站,建议收藏以备不时之需~
I LOVE PDF是一款免费的PDF网站,界面设计简洁,首页没有广告,但每个功能的操作界面是有广告的,不会影响使用。
部分功能:合并PDF、拆分PDF、压缩PDF、PDF转换至Word、PDF转换至PowerPoint、PDF转换至Excel、word转换至PDF文件、PowerPoint转换至PDF、Excel转换至PDF、PDF转JPG、JPG转PDF、页码、水印、旋转PDF、HTML转换PDF、PDF解密、PDF加密、排版PDF文件、PDF转换PDF/A、修复PDF
免费的在线文档格式转换软件,不仅有常见的格式,还有诸多不常见文档格式在这里都有,包括电子书格式转换,一个网站解决各种文档格式转换问题。
部分功能:
文档转换→DF转换至Word、PDF转换至PowerPoint、PDF转换至Excel、word转换至PDF文件、PowerPoint转换至PDF、Excel转换至PDF、PDF转JPG、JPG转PDF
文档处理→PDF台并、PDF分割、PDF解密、PDF增加密码、PDF修改密码、PDF图片获取、PDF删除页、PDF页面提取、PDF旋转、PDF页面编辑、PDF替换文字、PDF添加水印、PDF删除水印、PDF添加文字、PDF删除文字、PDF链接编辑、PDF添加页码、PDF删除图片、PDF背景颜色、PDF签名等
除此之外,还有音视频格式转等功能,网站功能免费,页面没有广告,可以放心使用。
转换为PDF和20多种格式的文件。此外,PDF Candy提供47种在线工具来处理PDF:编辑、拆分、合并、压缩等等。
ALL TO ALL在线格式转换,国内最全类型的在线文件转换平台,免费、快速,无须下载安装任何软件。支持约200多种格式的文件转换,包括:视频、音频、图片、字体等多媒体文件,以及常见的office文件、PDF、电子书等文档。
ONLINE2PDF是个完全免费的良心线上PDF编辑网站,需要配合自带翻译功能的浏览器使用,目前国内访问正常,功能丰富,操作简便。
以上就是全部的内容推荐啦,如果有帮助,记得点个赞吖~
两天有个客户需要把网页转为pdf,之前也没开发过类似的工具,就在百度搜索了一波,主要有下面三种
在百度(我一般用必应)搜索“在线网页转pdf”就有很多可以做这个事的网站,免费的如
各种pdf的操作都有,免费使用,速度一般。
官网地址https://tools.pdf24.org/zh
PDF24 Tools
开源免费项目,使用golang写的,提供在线转
官网地址http://doctron.lampnick.com/
doctron在线体验demo
还有挺多其他的,可以自己搜索,但是都不符合我的预期。
Doctron,这是我今天要介绍的重头戏。
Doctron是基于Docker、无状态、简单、快速、高质量的文档转换服务。目前支持将html转为pdf、图片(使用chrome(Chromium)浏览器内核,保证转换质量)。支持PDF添加水印。
管他的,先把代码下载下来再说
git clone https://gitcode.net/mirrors/lampnick/doctron.git
仓库
运行
go build
./doctron --config conf/default.yaml
运行截图
转pdf,访问http://127.0.0.1:8080/convert/html2pdf?u=doctron&p=lampnick&url=<url>,更换链接中的url为你需要转换的url即可。
转换效果
然后就可以写程序去批量转换需要的网页了,但是我需要转换的网页有两个需求
1、网站需要会员登录,不然只能看得到一部分
2、需要把网站的头和尾去掉的
这就为难我了,不会go语言啊,硬着头皮搞了,肯定有个地方打开这个url的,就去代码慢慢找,慢慢调试,功夫不负有心人,终于找到调用的地方了。
第一步:添加网站用户登录cookie
添加cookie之前
添加cookie之后
第二步:去掉网站头尾
chromedp.Evaluate(`$('.header').css("display" , "none");
$('.btn-group').css("display" , "none");
$('.container .container:first').css("display" , "none");
$('.breadcrumb').css("display" , "none");
$('.footer').css("display" , "none")`, &ins.buf),
打开网页后执行js代码把头尾隐藏掉
第三步:程序化,批量自动生成pdf
public static void createPDF(String folder , String cl , String pdfFile, String urlhref) {
try {
String fileName = pdfFile.replace("/", ":");
String filePath = folder + fileName;
File srcFile = new File(filePath);
File newFolder = new File("/Volumes/disk2/myproject" + File.separator + cl);
File destFile = new File(newFolder, fileName);
if(destFile.exists()){
return;
}
if(srcFile.exists()){
//移动到对应目录
if(!newFolder.exists()){
newFolder.mkdirs();
}
FileUtils.moveFile(srcFile , destFile);
return;
}
if(!newFolder.exists()){
newFolder.mkdirs();
}
String url = "http://127.0.0.1:8888/convert/html2pdf?u=doctron&p=lampnick&url="+urlhref;
HttpEntity<String> entity = new HttpEntity<String>(null, null);
RestTemplate restTemplate = new RestTemplate();
ResponseEntity<byte[]> bytes = restTemplate.exchange(url, HttpMethod.GET, entity, byte[].class);
if (bytes.getBody().length <= 100) {
if(urlList.containsKey(urlhref)){
Integer failCount = urlList.get(urlhref);
if(failCount > 3){
System.out.println("下载失败:" + cl + " / " + pdfFile +" " + urlhref);
return;
}
failCount++;
urlList.put(urlhref , failCount);
}else{
urlList.put(urlhref , 1);
}
createPDF(folder , cl , pdfFile , urlhref);
}else{
if (!destFile.exists()) {
try {
destFile.createNewFile();
} catch (Exception e) {
e.printStackTrace();
}
}
try (FileOutputStream out = new FileOutputStream(destFile);) {
out.write(bytes.getBody(), 0, bytes.getBody().length);
out.flush();
} catch (Exception e) {
e.printStackTrace();
}
}
} catch (Exception e) {
e.printStackTrace();
}
}
最终成果:
文件夹分类存放
pdf文件
*请认真填写需求信息,我们会在24小时内与您取得联系。