整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:

Java 将PDF转换为PNG图片、HTML、SVG、XPS及Word文件格式

文将介绍如何使用Java程序来将PDF文档转换为PNG图片、HTML、Word、SVG及XPS格式。

使用工具及环境创建

  • 工具:Free Spire.PDF for Java(免费版)
  • 环境创建:

方法1:首先,通过E-iceblue中文官网下载获取Free Spire.PDF for Java;其次,解压后找到lib文件夹下的Spire.pdf.jar;最后,将jar文件导入Java IEDA中。

方法2:通过maven仓库安装产品及添加相关依赖包。

代码演示

示例1 将PDF 转换为PNG图片格式

import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;
import com.spire.pdf.PdfDocument;
import javax.imageio.ImageIO;

public class ToImage {
    public static void main(String[] args) throws IOException {
        //加载示例PDF文件
        PdfDocument doc = new PdfDocument();
        doc.loadFromFile("C:\\Users\\Test1\\Desktop\\Sample.pdf");

        //保存PDF的每一页到图片
        BufferedImage image;
        for (int i = 0; i < doc.getPages().getCount(); i++) {
            image = doc.saveAsImage(i);
            File file = new File( String.format("output/ToImage-img-%d.png", i));
            ImageIO.write(image, "PNG", file);
        }

        doc.close();
    }
}

转换效果:

示例2 将 PDF 转换为 HTML、SVG、XPS、Word 格式

import com.spire.pdf.FileFormat;
import com.spire.pdf.PdfDocument;

public class ToWord {
    public static void main(String[] args) {
				//加载示例PDF文件
        PdfDocument pdf = new PdfDocument();
        pdf.loadFromFile("C:\\Users\\Test1\\Desktop\\Sample.pdf");
				
      	//保存为HTML格式
        pdf.saveToFile("output/ToHTML.html", FileFormat.HTML);
        //保存为Word格式
        pdf.saveToFile("output/ToWord.docx", FileFormat.DOCX);
        //保存为SVG格式
        pdf.saveToFile("output/ToSVG.svg", FileFormat.SVG);
        //保存为XPS格式
        pdf.saveToFile("output/ToXPS.xps", FileFormat.XPS);
    }
}

转换效果:

(本文完)

spose.HTML for .NET是一种高级HTML操作API,用于在.NET应用程序中创建和操作HTML文档。开发人员可以插入,删除,替换HTML节点,提取CSS样式,通过NodeIterator,遍历规范提供的TreeWalker,XPath或CSS选择器查询来浏览HTML文档。

Aspose.HTML for .NET更新至v19.6,引入了一个新的Markdown转换功能,它是一种易于阅读,易于编写的纯文本格式,可以转换为HTML文档。

具体更新内容

HTMLNET-1854:实现Markdown到HTML转换器 (新功能)

HTMLNET-1931:加载MHTML文件出错 (Bug修复)

HTMLNET-1932:PDF格式中缺少该表(Bug修复)

HTMLNET-1810:HTML到PDF - 图像无法渲染 (Bug修复)

HTMLNET-1920:加载MHT文件时应用程序出错 (Bug修复)

Aspose.Html v19.6中添加的API


使用Markdown文件创建HTML文档的方法扩展了Converter对象。

namespace Aspose.Html.Converters 
{
 public static class Converter 
 {
 ////// Convert Markdown source to html. Result is.
 //////Conversion source.///The base URI of the document.///Conversion result.public static HTMLDocument ConvertMarkdown(Stream stream, string baseUri) {}
 
 ////// Convert Markdown source to html. Result is.
 //////Conversion source.///The base URI of the document.///The environment configuration.///Conversion result.public static HTMLDocument ConvertMarkdown(Stream stream, string baseUri, Configuration configuration) {}
 
 ////// Convert Markdown source to html. Result is html file.
 //////Conversion source.///The base URI of the document.///Output file path.public static void ConvertMarkdown(Stream stream, string baseUri, string outputPath) {}
 
 ////// Convert Markdown source to html. Result is html file.
 //////Conversion source.///The base URI of the document.///The environment configuration.///Output file path.public static void ConvertMarkdown(Stream stream, string baseUri, Configuration configuration, string outputPath) {}
 
 ////// Convert Markdown source to html. Result is.
 //////Path to source Markdown file.///Conversion result.public static HTMLDocument ConvertMarkdown(string sourcePath) {}
 
 ////// Convert Markdown source to html. Result is.
 //////Path to source Markdown file.///The environment configuration.///Conversion result.public static HTMLDocument ConvertMarkdown(string sourcePath, Configuration configuration) {}
 
 ////// Convert Markdown source to html. Result is html file.
 //////Path to source Markdown file.///Output file path.public static void ConvertMarkdown(string sourcePath, string outputPath) {}
 
 ////// Convert Markdown source to html. Result is html file.
 //////Path to source Markdown file.///The environment configuration.///Output file path.public static void ConvertMarkdown(string sourcePath, Configuration configuration, string outputPath) {}
 }
}

添加了ConvertEPUB()和ConvertMHTML()的重写方法,以添加设置用户配置的功能。

namespace Aspose.Html.Converters 
{
 public static class Converter 
 {
 ////// Convert epub source to xps. Result is xps file.
 //////Conversion source.///The environment configuration.///Conversion options.///Output file path.public static void ConvertEPUB(Stream stream, Configuration configuration, XpsSaveOptions options, string outputPath) {}
 
 ////// Convert epub source to xps. Result is xps file.
 //////Conversion source.///The environment configuration.///Conversion options.///implementation.public static void ConvertEPUB(Stream stream, Configuration configuration, XpsSaveOptions options, ICreateStreamProvider provider) {}
 
 ////// Convert epub source to pdf. Result is pdf file.
 //////Conversion source.///The environment configuration.///Conversion options.///Output file path.public static void ConvertEPUB(Stream stream, Configuration configuration, PdfSaveOptions options, string outputPath) {}
 
 ////// Convert epub source to pdf. Result is pdf file.
 //////Conversion source.///The environment configuration.///Conversion options.///implementation.public static void ConvertEPUB(Stream stream, Configuration configuration, PdfSaveOptions options, ICreateStreamProvider provider) {}
 
 ////// Convert epub source to image. Result is image file.
 //////Conversion source.///The environment configuration.///Conversion options.///Output file path.public static void ConvertEPUB(Stream stream, Configuration configuration, ImageSaveOptions options, string outputPath) {}
 
 ////// Convert epub source to image. Result is image file.
 //////Conversion source.///The environment configuration.///Conversion options.///implementation.public static void ConvertEPUB(Stream stream, Configuration configuration, ImageSaveOptions options, ICreateStreamProvider provider) {}
 
 
 ////// Convert mhtml source to xps. Result is xps file.
 //////Conversion source.///The environment configuration.///Conversion options.///Output file path.public static void ConvertMHTML(Stream stream, Configuration configuration, XpsSaveOptions options, string outputPath) {}
 
 ////// Convert mhtml source to xps. Result is xps file.
 //////Conversion source.///The environment configuration.///Conversion options.///implementation.public static void ConvertMHTML(Stream stream, Configuration configuration, XpsSaveOptions options, ICreateStreamProvider provider) {}
 
 ////// Convert mhtml source to pdf. Result is pdf file.
 //////Conversion source.///The environment configuration.///Conversion options.///Output file path.public static void ConvertMHTML(Stream stream, Configuration configuration, PdfSaveOptions options, string outputPath) {}
 
 ////// Convert mhtml source to pdf. Result is pdf file.
 //////Conversion source.///The environment configuration.///Conversion options.///implementation.public static void ConvertMHTML(Stream stream, Configuration configuration, PdfSaveOptions options, ICreateStreamProvider provider) {}
 
 ////// Convert mhtml source to image. Result is image file.
 //////Conversion source.///The environment configuration.///Conversion options.///Output file path.public static void ConvertMHTML(Stream stream, Configuration configuration, ImageSaveOptions options, string outputPath) {}
 
 ////// Convert mhtml source to image. Result is image file.
 //////Conversion source.///The environment configuration.///Conversion options.///implementation.public static void ConvertMHTML(Stream stream, Configuration configuration, ImageSaveOptions options, ICreateStreamProvider provider) {}
 }
}

*ASPOSE技术交流QQ群(642018183)现已开通,各类资源及时分享,欢迎交流讨论!获取Aspose.HTML for .NET下载资源可点击下方“了解更多”。

↓↓↓

前有许多在线转档工具可以解决使用者的格式转换需求,共通性是通过浏览器开启网站即可进行转换,无需额外下载、安装软件或工具,因为这些服务多半将文件上传远程服务器进行处理,即使是移动设备也能正常执行,例如 Convertr 就整合音讯、影片和其他文件格式的在线转档:

本文要介绍的「cdkm」是一个免费在线转档工具,号称次世代转换器、整合许多开放原始码项目建构而成,支持各种常见常用文件类型,包括文件、电子书、图片、影片、音乐或是一些比较少用的格式,不过要注意的是 cdkm 每次转换最多只能上传 10 个文件(如果有开启广告阻挡器就无法使用批次转换功能)。

cdkm 可转档的文件文件最大 40 MB,其他格式文件最大 200 MB,虽然转换速度快,若遇到文件过大就有很大的机会无法成功转换。

cdkm 支持以下格式(完整列表):

  • 文件:PDF、TXT、WORD、DOCX、EXCEL、XLSX、PPT、PPTX、HTML、XPS、ODT、ODS、ODP、CSV、XML、JSON、EML 和 MSG。
  • 电子书:EPUB、MOBI、AZW3 和 DJVU。
  • 图片:JPG、PNG、GIF、SVG、WEBP、DDS、JXR、PSD、TIFF、EPS、BMP、AVIF、AI、CDR、DWG 和 ICO。
  • 影片:MP4、MOV、WEBM、MKV、WMV、FLV、AVI、OGV、VOB 和 MPEG。
  • 音频:MP3、M4A、AAC、OGG、WAV、WMA 和 OPUS。

转换后文件可直接下载或是产生分享链接,提供给其他人下载、使用,有些文件格式还能直接在浏览器进行预览,如果临时需要转档、但手边又没有合适的转档工具就可以试试看。

cdkm

网站链接:https://cdkm.com/

使用教学

开启 cdkm 网站后点选「Choose Files」选择要转换的源文件或选择「remote file URL」以远程文件链接方式输入文件进行转换。

cdkm 不会自动选择可转换的格式,使用者需要从右侧的「Target Format」目标格式选择要转换的文件新格式,依照不同类型分类更容易寻找。

选好后点选最右边的红色按钮「Start Convertsion」开始转换,转换时需要一段时间将文件上传到远程服务器,完成后结果文件就会显示在下方的 Output Files 字段,点选后方「Download」按钮就能将转换后的文件下载保存。

有些文件还可以直接在线预览,如果要复制下载链接可点选「Copy to clipboard」就能将文件网址复制到剪贴簿。

值得一试的三个理由:

  • 免费在线转档工具,整合多种开放源码项目建构而成
  • 可转换文件、电子书、图片、影片、音乐或是一些比较少用的格式
  • 免费转换最多上传 10 个文件,文件最大 40 MB,其他格式文件最大 200 MB