各种情况下,我们需要以编程方式将 MS Word DOC/DOCX 显示到我们的应用程序中。在这种情况下,最方便的方法之一是从 DOC 或 DOCX 转换为 JPG 格式。为此,在本文中,您将学习如何在 Java中将DOC或DOCX文件转换为JPG。此外,我们将介绍如何使用不同的选项自定义 DOC 到 JPG 的转换。
Aspose-超100种文件格式管理API,涉及条码,CAD,GIS地图,PSD等诸多领域,正版购买,试用下载—慧都网-慧都网
Aspose.Words for Java是一个功能丰富的 API,用于在基于 Java 的应用程序中创建、编辑或转换 MS Word 文档。我们将使用此 API 将 DOC/DOCX 转换为 JPG。您可以下载API 的 JAR 或使用以下 Maven 配置安装它:
存储库:
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
依赖:
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>22.4</version>
<classifier>jdk17</classifier>
</dependency>
您可以根据需要将 DOC/DOCX 转换为 JPG、PNG、BMP、GIF 或 TIFF 图像。要设置输出图像格式,使用SaveFormat枚举。让我们在 Java 中将 DOCX 文件转换为 JPG。
以下代码示例展示了如何在 Java 中将 DOCX 转换为 JPG。
// load document
Document doc=new Document("calibre.docx");
// set output image format using SaveFormat
var options=new ImageSaveOptions(SaveFormat.JPEG);
// loop through pages and convert them to JPG images
for (int pageNumber=0; pageNumber < doc.getPageCount(); pageNumber++)
{
// Save page as JPG
options.setPageSet(new PageSet(pageNumber));
doc.save(pageNumber + "_page.jpg", options);
}
您还可以使用不同的选项自定义 DOC 到 PNG 的转换。例如,您可以设置水平分辨率、垂直分辨率、整体分辨率、比例、像素格式、亮度、颜色模式、对比度等。以下是在Java中自定义DOC到JPG的步骤。
以下代码示例显示了如何使用不同的选项自定义 Java DOC 到 JPG 的转换。
// load document
Document doc=new Document("calibre.docx");
// set output image format using SaveFormat
var options=new ImageSaveOptions(SaveFormat.JPEG);
// change the image's brightness and contrast
// both are on a 0-1 scale and are at 0.5 by default
options.setImageBrightness(0.30f);
options.setImageContrast(0.7f);
// change the horizontal resolution
// the default value for these properties is 96.0, for a resolution of 96dpi
options.setHorizontalResolution(72f);
// loop through pages and convert them to JPG images
for (int pageNumber=0; pageNumber < doc.getPageCount(); pageNumber++)
{
// Save page as JPG
options.setPageSet(new PageSet(pageNumber));
doc.save(pageNumber + "_page.jpg", options);
}
在本文中,您学习了如何在 Java 中将 Word DOC/DOCX 转换为 JPG。此外,您还了解了如何使用不同的选项自定义 DOC 到 JPG 的转换。除此之外,您可以使用文档探索 Aspose.Words for Java 的其他功能,或私聊我们获取相关内容。
当今数字时代,多种类型的文档扮演了我们日常工作和沟通的关键角色,其中包括电子邮件、文本文档、演示文稿、电子书籍等等。然而,无论是哪种文档类型,我们必须时刻考虑如何轻松地分享和传送这些信息。问题是,文档格式和文档编辑器的种类各不相同,使传输和处理变得很麻烦。这时,文档转HTML的出现,极大地方便了我们的工作、学习和分享需求,下面小编就围绕这个话题分享下个人看法~
Aspose.Words for .NET官方最新版免费下载试用,历史版本下载,在线文档和帮助文件下载-慧都网
HTML(超文本标记语言)是一种最基本的Web编程语言,其功能是将语言的学术概念转化为计算机可理解的语言,使得用户可以在浏览器中浏览和使用互联网上的信息。而文档转HTML是指将各种文档格式(如Microsoft Word、PDF、Markdown等)转换为HTML(超文本标记语言)格式的过程。HTML是一种用于创建网页内容的标记语言,它可以在各种设备和浏览器上显示,并支持多种富文本样式、链接、图像和多媒体等元素。
HTML格式在web端应用非常广泛,而且也容易进行二次开发,主要有以下几点原因:
文档转HTML的工作原理通常涉及以下步骤:
目前市面上支持将文档转化成HTML的工具非常多,但转换效率还是有明显的差别,而且不同产品直接对于格式支持差异也比较大,因此开发者在选择文档转HTML工具时,可以考虑以下因素:
E-iceblue和Aspose都是知名的文件处理组件供应商,提供了多个产品来实现文档转HTML功能, 这些产品在转换上都很不错,大家可以尝试:
E-iceblue和Aspose产品都具有广泛的文件格式支持,可以处理多种文档类型。它们在保留文档样式和格式方面都表现良好,可以生成质量较高的HTML内容。
Aspose产品在业界有较长的历史,被广泛使用,拥有强大的技术支持和社区。这些产品提供了编程接口,使开发人员能够将文档转HTML集成到自己的应用程序中。
除此之外,也有一些很不错的例如:Adobe Acrobat、Pandoc等,大家可以根据自己需求尝试和选择~
spose系列的控件,功能都很强大,现在年终打折促销,可以入手了。之前一直在我的Winform开发框架中用Aspose.Cell来做报表输出,可以实现多样化的报表设计及输出,由于一般输出的内容比较正规化或者多数是表格居多,所以一般使用Aspose.Cell来实现我想要的各种Excel报表输出。虽然一直也知道Aspose.Word是用来生成Word文档的,而且深信其也是一个很强大的控件,但一直没用用到,所以就不是很熟悉。
偶然一次机会,一个项目的报表功能指定需要导出为Word文档,因此寻找了很多篇文章,不过多数介绍的比较简单一点,于是也参考了官方的帮助介绍,终于满足了客户的需求。下面我由浅入深来介绍这个控件在实际业务中的使用过程吧。
1、二维表格的Word操作
日常中,常见的内容输出就是二维表格的方式,表头比较固定,内容每行一条,那么在实际的使用控件我们该如何操作呢,其实这个控件这方面介绍的文章很多,参考一下就能做出来了。其实介绍这个就是要说明书签的重要性,这个在Aspose.Cell控件也是如此,书签除了可以用来替换内容,还可以用来标记内容输入的开始位置等等功能。
首先我们在一个空白的Word文档中绘制一个表格头,然后再换行的开始插入一个标签引用,插入书签有两种方式,一种是在Word(2007、2010)的【插入】-【书签】中插入制定位置的书签引用,如下所示。
一种是在Word的自定义快速访问工具栏上添加其他命令,如下步骤所示
前者插入的书签是没有文字或者特别的标记,但是确实存在,后者会插入一个灰色块作为占位符,如下所示,我这这个二维表格的例子里面使用后者进行测试(两者同等效果的)
这样设计好Word模板后,下一步就是如何利用代码生成二维表格了。首先这里提示一下,就是我故意设置了每个表格单元格的宽度不同,所以也就要求生成的行要和头部对应,所以表格生成每行之前,肯定要获得对应列的样式属性的,否则就会对应不上了。下面看代码。
代码如下:
try
{
Aspose.Words.Document doc=new Aspose.Words.Document(templateFile);
Aspose.Words.DocumentBuilder builder=new Aspose.Words.DocumentBuilder(doc);
DataTable nameList=DataTableHelper.CreateTable("编号,姓名,时间");
DataRow row=null;
for (int i=0; i < 50; i++)
{
row=nameList.NewRow;
row["编号"]=i.ToString.PadLeft(4, '0');
row["姓名"]="伍华聪 " + i.ToString;
row["时间"]=DateTime.Now.ToString;
nameList.Rows.Add(row);
}
List widthList=new List;
for (int i=0; i < nameList.Columns.Count; i++)
{
builder.MoveToCell(0, 0, i, 0); //移动单元格
double width=builder.CellFormat.Width;//获取单元格宽度
widthList.Add(width);
}
builder.MoveToBookmark("table"); //开始添加值
for (var i=0; i < nameList.Rows.Count; i++)
{
for (var j=0; j < nameList.Columns.Count; j++)
{
builder.InsertCell;// 添加一个单元格
builder.CellFormat.Borders.LineStyle=LineStyle.Single;
builder.CellFormat.Borders.Color=System.Drawing.Color.Black;
builder.CellFormat.Width=widthList[j];
builder.CellFormat.VerticalMerge=Aspose.Words.Tables.CellMerge.None;
builder.CellFormat.VerticalAlignment=CellVerticalAlignment.Center;//垂直居中对齐
builder.ParagraphFormat.Alignment=ParagraphAlignment.Center;//水平居中对齐
builder.Write(nameList.Rows[i][j].ToString);
}
builder.EndRow;
}
doc.Range.Bookmarks["table"].Text=""; // 清掉标示
doc.Save(saveDocFile);
if (MessageUtil.ShowYesNoAndTips("保存成功,是否打开文件?")==System.Windows.Forms.DialogResult.Yes)
{
System.Diagnostics.Process.Start(saveDocFile);
catch (Exception ex)
{
LogHelper.Error(ex);
MessageUtil.ShowError(ex.Message);
return;
}
以上代码的步骤就是 :
1)创建Aspose.Words.Document 和 Aspose.Words.DocumentBuilder对象,然后生成数据的二维表格内容。
2)遍历模板表格,或者每一列的宽度,以备后用。
3)移动到表格的书签位置,然后开始录入数据,Word表格的每个Cell都要求制定样式和宽度,这样才能和表格头部吻合。
4)保存文件内容到新的文件里面即可。
输出的效果如下所示:
2、单元格合并的操作
常见的Word文件或者Excel文件中,都经常看到合并单元格的内容,因此这个部分也是非常常见的操作,必须掌握。
我们先看一个例子代码及效果。
builder.InsertCell;
builder.CellFormat.VerticalMerge=CellMerge.First;
builder.Write("Text in merged cells.");
builder.CellFormat.VerticalMerge=CellMerge.None;
builder.Write("Text in one cell");
// This cell is vertically merged to the cell above and should be empty.
builder.CellFormat.VerticalMerge=CellMerge.Previous;
builder.Write("Text in another cell");
效果如下:
如果上面的例子还不够明白,OK,我在介绍一个实际的例子,来说明合并单元格的操作模式。
实际文档生成如下所示:
文档的模板如下所示:
其实这个里面的“测试”内容是使用代码写入的,其实就是一行业务数据,用两行来展示,其中有些合并的单元格,这是一个实际项目的表格形式。我们注意到,每行有13个单元格,其中第一、第二、第十三列是合并列。和并列有一个特点,就是它的两个索引都有效,不过只是能使用第一个索引来对它进行操作复制,利用第二个没有用处的。
如第一个列是和并列,它应该有0、13这样的索引,第二列也是和并列,它也有1、14的索引,其他的类推。
了解这样的逻辑关系后,我们看实际操作的代码如下所示。
作者:伍华聪
本站文章除注明转载外,均为本站原创或翻译
*请认真填写需求信息,我们会在24小时内与您取得联系。