整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:

Word处理控件Aspose.Words如何在 Ja

Word处理控件Aspose.Words如何在 Java 中将 DOC 或 DOCX 转换为 JPG

各种情况下,我们需要以编程方式将 MS Word DOC/DOCX 显示到我们的应用程序中。在这种情况下,最方便的方法之一是从 DOC 或 DOCX 转换为 JPG 格式。为此,在本文中,您将学习如何在 Java中将DOC或DOCX文件转换为JPG。此外,我们将介绍如何使用不同的选项自定义 DOC 到 JPG 的转换。

Aspose-超100种文件格式管理API,涉及条码,CAD,GIS地图,PSD等诸多领域,正版购买,试用下载—慧都网-慧都网

Java API for DOCX DOCX to JPG - 免费下载

Aspose.Words for Java是一个功能丰富的 API,用于在基于 Java 的应用程序中创建、编辑或转换 MS Word 文档。我们将使用此 API 将 DOC/DOCX 转换为 JPG。您可以下载API 的 JAR 或使用以下 Maven 配置安装它:

存储库:

<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>

依赖:

<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>22.4</version>
<classifier>jdk17</classifier>
</dependency>

在 Java 中将 DOC 转换为 JPG

您可以根据需要将 DOC/DOCX 转换为 JPG、PNG、BMP、GIF 或 TIFF 图像。要设置输出图像格式,使用SaveFormat枚举。让我们在 Java 中将 DOCX 文件转换为 JPG。

  • 使用Document类加载 DOCX 文件。
  • 创建ImageSaveOptions类的实例并指定输出图像格式。
  • 循环浏览文档中的页面。
  • 使用Document.save(string, ImageSaveOptions)方法将 DOCX 中的每一页转换为 JPG 。

以下代码示例展示了如何在 Java 中将 DOCX 转换为 JPG。

// load document
Document doc=new Document("calibre.docx");

// set output image format using SaveFormat
var options=new ImageSaveOptions(SaveFormat.JPEG);

// loop through pages and convert them to JPG images
for (int pageNumber=0; pageNumber < doc.getPageCount(); pageNumber++)
{
// Save page as JPG
options.setPageSet(new PageSet(pageNumber));
doc.save(pageNumber + "_page.jpg", options);
}

Java DOCX 到 JPG - 自定义

您还可以使用不同的选项自定义 DOC 到 PNG 的转换。例如,您可以设置水平分辨率、垂直分辨率、整体分辨率、比例、像素格式、亮度、颜色模式、对比度等。以下是在Java中自定义DOC到JPG的步骤。

  • 使用Document类加载 DOC 文件。
  • 创建ImageSaveOptions类的实例并指定输出图像格式。
  • 使用ImageSaveOptions对象设置所需的选项,例如亮度、对比度等。
  • 循环浏览文档中的页面。
  • 使用Document.save(string, ImageSaveOptions)方法将每个页面转换为 JPG 。

以下代码示例显示了如何使用不同的选项自定义 Java DOC 到 JPG 的转换。

// load document
Document doc=new Document("calibre.docx");

// set output image format using SaveFormat
var options=new ImageSaveOptions(SaveFormat.JPEG);

// change the image's brightness and contrast
// both are on a 0-1 scale and are at 0.5 by default
options.setImageBrightness(0.30f);
options.setImageContrast(0.7f);

// change the horizontal resolution
// the default value for these properties is 96.0, for a resolution of 96dpi
options.setHorizontalResolution(72f);

// loop through pages and convert them to JPG images
for (int pageNumber=0; pageNumber < doc.getPageCount(); pageNumber++)
{
// Save page as JPG
options.setPageSet(new PageSet(pageNumber));
doc.save(pageNumber + "_page.jpg", options);
}

结论

在本文中,您学习了如何在 Java 中将 Word DOC/DOCX 转换为 JPG。此外,您还了解了如何使用不同的选项自定义 DOC 到 JPG 的转换。除此之外,您可以使用文档探索 Aspose.Words for Java 的其他功能,或私聊我们获取相关内容。

当今数字时代,多种类型的文档扮演了我们日常工作和沟通的关键角色,其中包括电子邮件、文本文档、演示文稿、电子书籍等等。然而,无论是哪种文档类型,我们必须时刻考虑如何轻松地分享和传送这些信息。问题是,文档格式和文档编辑器的种类各不相同,使传输和处理变得很麻烦。这时,文档转HTML的出现,极大地方便了我们的工作、学习和分享需求,下面小编就围绕这个话题分享下个人看法~

Aspose.Words for .NET官方最新版免费下载试用,历史版本下载,在线文档和帮助文件下载-慧都网

什么是HTML、文档转HTML?

HTML(超文本标记语言)是一种最基本的Web编程语言,其功能是将语言的学术概念转化为计算机可理解的语言,使得用户可以在浏览器中浏览和使用互联网上的信息。而文档转HTML是指将各种文档格式(如Microsoft Word、PDF、Markdown等)转换为HTML(超文本标记语言)格式的过程。HTML是一种用于创建网页内容的标记语言,它可以在各种设备和浏览器上显示,并支持多种富文本样式、链接、图像和多媒体等元素。

文档转HTML的好处

HTML格式在web端应用非常广泛,而且也容易进行二次开发,主要有以下几点原因:

  1. 可在多种设备上显示: HTML内容可以在各种设备上展示,包括计算机、平板电脑、手机等。
  2. 易于分享和发布: HTML是Web上最常见的内容格式,通过将文档转换为HTML,您可以轻松地在网站上发布内容,与他人共享,并通过链接进行传播。
  3. 保留样式和格式: 文档转HTML工具通常会尽量保留原始文档的样式、格式、表格、图像等元素,使转换后的HTML内容看起来与原始文档类似。
  4. 可搜索和可编辑性: 转换为HTML后的内容可以通过搜索引擎进行索引,使其更易于被搜索到。此外,HTML内容可以在支持的编辑器中进行编辑。

文档转HTML的工作原理

文档转HTML的工作原理通常涉及以下步骤:

  1. 解析文档: 工具会解析输入的文档,了解其结构、内容和样式。
  2. 转换内容: 工具会将文档中的文本、图像、表格等内容转换为HTML格式,同时尽可能保留原始样式。
  3. 生成HTML: 转换后的内容会被组合成HTML标记,形成可以在Web浏览器中显示的页面。
  4. 处理链接和媒体: 如果原始文档包含链接、超链接、图像或其他媒体元素,工具会适当地将它们转换为HTML中的链接和媒体标签。
  5. 输出HTML文件: 最终,工具会生成一个包含转换后HTML内容的文件,您可以将其在Web上发布或与他人分享。

开发者如何选择文档转HTML工具?

目前市面上支持将文档转化成HTML的工具非常多,但转换效率还是有明显的差别,而且不同产品直接对于格式支持差异也比较大,因此开发者在选择文档转HTML工具时,可以考虑以下因素:

  1. 支持的文档格式: 确保工具支持您要转换的文档格式,如Word、PDF、Markdown等。
  2. 保留样式和格式: 选择能够尽可能保留原始文档样式和格式的工具,以确保转换后的HTML内容看起来与原始文档相似。
  3. 用户友好性: 选择易于使用且具有直观界面的工具,使您能够轻松进行转换操作。
  4. 批量转换能力: 如果您需要批量转换大量文档,确保工具具有高效的批量转换功能。
  5. 定制选项: 一些工具可能允许您自定义转换设置,如调整样式、布局等。

有哪些不错的控件推荐?

E-iceblue和Aspose都是知名的文件处理组件供应商,提供了多个产品来实现文档转HTML功能, 这些产品在转换上都很不错,大家可以尝试:

  1. Spire.Doc: 用于处理Word文档,可以将Word文档转换为HTML。它支持保留文档样式、图像、表格等。
  2. Aspose.Words: 提供了在多种编程语言中处理Word文档的功能,可以将Word文档转换为HTML。它具有丰富的格式和样式保留选项。
  3. Aspose.PDF: 用于处理PDF文档,也可以将PDF文档转换为HTML。它支持保留文档结构和样式。
  4. Aspose.Slides: 用于处理幻灯片演示文稿,可以将幻灯片转换为HTML,以便在Web上展示。

E-iceblue和Aspose产品都具有广泛的文件格式支持,可以处理多种文档类型。它们在保留文档样式和格式方面都表现良好,可以生成质量较高的HTML内容。

Aspose产品在业界有较长的历史,被广泛使用,拥有强大的技术支持和社区。这些产品提供了编程接口,使开发人员能够将文档转HTML集成到自己的应用程序中。

除此之外,也有一些很不错的例如:Adobe Acrobat、Pandoc等,大家可以根据自己需求尝试和选择~

spose系列的控件,功能都很强大,现在年终打折促销,可以入手了。之前一直在我的Winform开发框架中用Aspose.Cell来做报表输出,可以实现多样化的报表设计及输出,由于一般输出的内容比较正规化或者多数是表格居多,所以一般使用Aspose.Cell来实现我想要的各种Excel报表输出。虽然一直也知道Aspose.Word是用来生成Word文档的,而且深信其也是一个很强大的控件,但一直没用用到,所以就不是很熟悉。

偶然一次机会,一个项目的报表功能指定需要导出为Word文档,因此寻找了很多篇文章,不过多数介绍的比较简单一点,于是也参考了官方的帮助介绍,终于满足了客户的需求。下面我由浅入深来介绍这个控件在实际业务中的使用过程吧。

1、二维表格的Word操作

日常中,常见的内容输出就是二维表格的方式,表头比较固定,内容每行一条,那么在实际的使用控件我们该如何操作呢,其实这个控件这方面介绍的文章很多,参考一下就能做出来了。其实介绍这个就是要说明书签的重要性,这个在Aspose.Cell控件也是如此,书签除了可以用来替换内容,还可以用来标记内容输入的开始位置等等功能。

首先我们在一个空白的Word文档中绘制一个表格头,然后再换行的开始插入一个标签引用,插入书签有两种方式,一种是在Word(2007、2010)的【插入】-【书签】中插入制定位置的书签引用,如下所示。

一种是在Word的自定义快速访问工具栏上添加其他命令,如下步骤所示

前者插入的书签是没有文字或者特别的标记,但是确实存在,后者会插入一个灰色块作为占位符,如下所示,我这这个二维表格的例子里面使用后者进行测试(两者同等效果的)

这样设计好Word模板后,下一步就是如何利用代码生成二维表格了。首先这里提示一下,就是我故意设置了每个表格单元格的宽度不同,所以也就要求生成的行要和头部对应,所以表格生成每行之前,肯定要获得对应列的样式属性的,否则就会对应不上了。下面看代码。

代码如下:

try

{

Aspose.Words.Document doc=new Aspose.Words.Document(templateFile);

Aspose.Words.DocumentBuilder builder=new Aspose.Words.DocumentBuilder(doc);

DataTable nameList=DataTableHelper.CreateTable("编号,姓名,时间");

DataRow row=null;

for (int i=0; i < 50; i++)

{

row=nameList.NewRow;

row["编号"]=i.ToString.PadLeft(4, '0');

row["姓名"]="伍华聪 " + i.ToString;

row["时间"]=DateTime.Now.ToString;

nameList.Rows.Add(row);

}

List widthList=new List;

for (int i=0; i < nameList.Columns.Count; i++)

{

builder.MoveToCell(0, 0, i, 0); //移动单元格

double width=builder.CellFormat.Width;//获取单元格宽度

widthList.Add(width);

}

builder.MoveToBookmark("table"); //开始添加值

for (var i=0; i < nameList.Rows.Count; i++)

{

for (var j=0; j < nameList.Columns.Count; j++)

{

builder.InsertCell;// 添加一个单元格

builder.CellFormat.Borders.LineStyle=LineStyle.Single;

builder.CellFormat.Borders.Color=System.Drawing.Color.Black;

builder.CellFormat.Width=widthList[j];

builder.CellFormat.VerticalMerge=Aspose.Words.Tables.CellMerge.None;

builder.CellFormat.VerticalAlignment=CellVerticalAlignment.Center;//垂直居中对齐

builder.ParagraphFormat.Alignment=ParagraphAlignment.Center;//水平居中对齐

builder.Write(nameList.Rows[i][j].ToString);

}

builder.EndRow;

}

doc.Range.Bookmarks["table"].Text=""; // 清掉标示

doc.Save(saveDocFile);

if (MessageUtil.ShowYesNoAndTips("保存成功,是否打开文件?")==System.Windows.Forms.DialogResult.Yes)

{

System.Diagnostics.Process.Start(saveDocFile);

catch (Exception ex)

{

LogHelper.Error(ex);

MessageUtil.ShowError(ex.Message);

return;

}

以上代码的步骤就是 :

1)创建Aspose.Words.Document 和 Aspose.Words.DocumentBuilder对象,然后生成数据的二维表格内容。

2)遍历模板表格,或者每一列的宽度,以备后用。

3)移动到表格的书签位置,然后开始录入数据,Word表格的每个Cell都要求制定样式和宽度,这样才能和表格头部吻合。

4)保存文件内容到新的文件里面即可。

输出的效果如下所示:

2、单元格合并的操作

常见的Word文件或者Excel文件中,都经常看到合并单元格的内容,因此这个部分也是非常常见的操作,必须掌握。

我们先看一个例子代码及效果。

builder.InsertCell;

builder.CellFormat.VerticalMerge=CellMerge.First;

builder.Write("Text in merged cells.");

builder.CellFormat.VerticalMerge=CellMerge.None;

builder.Write("Text in one cell");

// This cell is vertically merged to the cell above and should be empty.

builder.CellFormat.VerticalMerge=CellMerge.Previous;

builder.Write("Text in another cell");

效果如下:

如果上面的例子还不够明白,OK,我在介绍一个实际的例子,来说明合并单元格的操作模式。

实际文档生成如下所示:

文档的模板如下所示:

其实这个里面的“测试”内容是使用代码写入的,其实就是一行业务数据,用两行来展示,其中有些合并的单元格,这是一个实际项目的表格形式。我们注意到,每行有13个单元格,其中第一、第二、第十三列是合并列。和并列有一个特点,就是它的两个索引都有效,不过只是能使用第一个索引来对它进行操作复制,利用第二个没有用处的。

如第一个列是和并列,它应该有0、13这样的索引,第二列也是和并列,它也有1、14的索引,其他的类推。

了解这样的逻辑关系后,我们看实际操作的代码如下所示。

作者:伍华聪

您可能还对以下文章感兴趣:

本站文章除注明转载外,均为本站原创或翻译