文介绍如何通过Java后端程序代码来展示如何将html转为XML。此功能通过采用Word API- Free Spire.Doc for Java 提供的Document.saveToFile()方法来实现;该方法支持的目标文档格式多达 30余种。另外,该API也提供了多种方法,如Document.saveToEpub()、Document.saveToFile()、Document.saveToImages()、Document.saveToSVG()、Document.saveToTxt()、Document.saveToTiff()等,可用于将源文件转为Epub、图片、文本文件等目标文档格式。
下面,将以html转为xml格式为例,介绍如何实现转换。以下是详细方法及步骤。
通过 Maven仓库 下载导入,如下配置pom.xml:
<repositories>
<repository>
<id>com.e-iceblue</id>
<url>https://repo.e-iceblue.cn/repository/maven-public/</url>
</repository>
</repositories>
<dependencies>
<dependency>
<groupId>e-iceblue</groupId>
<artifactId>spire.doc.free</artifactId>
<version>5.2.0</version>
</dependency>
</dependencies>
如需手动导入,需要下载 jar包 到本地,然后解压,找到lib文件夹下的Spire.Doc.jar文件。在IDEA中打开“Project Structure”界面,执行如图步骤将本地路径下的jar文件手动引入Java程序:
转换时,可参考如下代码步骤:
Java
import com.spire.doc.*;
public class HTMLtoXML {
public static void main(String[] args) {
//创建Document类的对象
Document doc = new Document();
//加载html文件
doc.loadFromFile("sample.html",FileFormat.Html);
//保存为XML格式
doc.saveToFile("HTMLtoXML.xml", FileFormat.Xml);
}
}
转换效果:
—END—
原文出处:https://www.cnblogs.com/Yesi/p/16392430.html
如果本文对你有帮助,别忘记给我个3连 ,点赞,转发,评论,
学习更多JAVA知识与技巧,关注与私信博主(555),即可免费领取
于ASP.NET API的Aspose.PDF广泛支持XML转换功能,因为根据API用户的要求,它包含许多相关的增强功能,可以使用将XML导出为PDF的高效功能来提升.NET应用程序。
在本文中,我们将使用C#将XML文件转换为PDF。考虑以下与使用C#进行XML转换有关的用例:
目前,.NET版Aspose.PDF升级到v20.6版,优化提取的页面丢失问题,修复PDF转换为HTML时的一些问题,感兴趣的朋友可点击下载最新版。(点击文末“了解更多”下载最新版)
要将XML转换为PDF,您需要遵循Aspose.PDF for .NET API的XML Schema,该XML Schema是XSD文件。以下是一个XML文件,我们将其转换为PDF,作为Hello World演示。
<?xml version="1.0" encoding="utf-8" ?> <Document xmlns="Aspose.Pdf"> <Page id="mainSection"> <HtmlFragment> <![CDATA[ <font style="font-family:Tahoma; font-size:40px;">This is Html String.</font> ]]> </HtmlFragment> </Page> </Document>
需要按照以下步骤将XML转换为PDF文件:
以下代码段显示了如何在C#中将XML转换为PDF:
// Instantiate Document object
Document doc = new Document();
// Bind source XML file
doc.BindXml(dataDir + "XML.xml");
// Convert XML to PDF
doc.Save(dataDir + "XMLToPDF.pdf");
有时可能需要先将XML中的HTML转换为HTML。.NET API的Aspose.PDF也支持此功能。但是,HTML和XML标签非常相似。因此,需要指定CDATA标记,以便不将HTML解析为XML标记。下面的示例XML文件包括用CDATA表示的HTML,以避免出现任何异常:
<?xml version="1.0" encoding="utf-8" ?>
<Document xmlns="Aspose.Pdf">
<Page id="mainPage">
<TextFragment>
<TextSegment>Hello</TextSegment>
</TextFragment>
<TextFragment>
<TextSegment>World!</TextSegment>
</TextFragment>
</Page>
</Document>
通过以下步骤将此XML文件转换为PDF:
下面的代码片段显示了如何在C#中将包含HTML的XML文件转换为PDF:
// Instantiate Document object
Document doc = new Document();
// Bind source XML file
doc.BindXml(dataDir + "XML.xml");
// Convert XML to PDF
doc.Save(dataDir + "XMLToPDF.pdf");
有时,可能已有一个包含重要应用程序数据的XML文件,并且想使用该XML文件生成PDF报告。在这种情况下,可以创建XSLT文件,以将现有XML文档转换为Aspose.PDF的兼容XML文档。然后,可以继续将XML转换为PDF。让我们通过简单而基本的示例来学习这一点:
<?xml version="1.0" encoding="utf-8" ?>
<Contents>
<Content>Hello World!</Content>
</Contents>
<?xml version="1.0" encoding="utf-8" ?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:template match="text()"/>
<xsl:template match="/Contents">
<html>
<Document xmlns="Aspose.Pdf" IsAutoHyphenated="false">
<PageInfo>
<DefaultTextState
Font = "Helvetica" FontSize="8" LineSpacing="4"/>
<Margin Left="5cm" Right="5cm" Top="3cm" Bottom="15cm" />
</PageInfo>
<Page id="mainSection">
<TextFragment>
<TextSegment>
<xsl:value-of select="Content"/>
</TextSegment>
</TextFragment>
</Page>
</Document>
</html>
</xsl:template>
</xsl:stylesheet>
我们会注意到,该XML文件不遵循Aspose.PDF for .NET API的XML模式。但是,XSLT文件将其转换为所需的兼容性。现在,可以按照以下步骤使用XSLT将此类XML转换为PDF:
下面的代码段基于以下步骤,这些步骤显示了如何在C#中将XML转换为PDF:
//Create pdf document
Aspose.Pdf.Document pdf = new Aspose.Pdf.Document();
//Bind XML and XSLT files to the document
try
{
pdf.BindXml(dataDir + "\\HelloWorld.xml", dataDir + "\\HelloWorld.xslt");
}
catch (System.Exception)
{
throw;
}
//Save the document
pdf.Save(dataDir + "HelloWorldUsingXmlAndXslt.pdf");
如果您有任何疑问或需求,请随时加入Aspose技术交流群(642018183),我们很高兴为您提供查询和咨询。
文以C#及VB.NET后端程序代码示例展示如何将HTML转为XML文件。转换时,调用Word API -Free Spire.Doc for .NET 提供的文档加载方法及文档保存的方法来实现。转换的代码步骤很简单,具体可参考以下内容。
1.通过NuGet安装dll(2种方法)
1.1可以在Visual Studio中打开“解决方案资源管理器”,鼠标右键点击“引用”,“管理NuGet包”,然后搜索“Free Spire.Doc”,点击“安装”。等待程序安装完成。
1.2将以下内容复制到PM控制台安装:
Install-Package FreeSpire.Doc -Version 10.2
2.手动添加dll引用
可通过手动下载包到本地,然后解压,找到BIN文件夹下的Spire.Doc.dll。然后在Visual Studio中打开“解决方案资源管理器”,鼠标右键点击“引用”,“添加引用”,将本地路径BIN文件夹下的dll文件添加引用至程序。
转换时,可参考如下代码来进行:
C#
using Spire.Doc;
namespace HTMLtoXML
{
class Program
{
static void Main(string[] args)
{
//创建Document类的对象
Document doc = new Document();
//加载html文件
doc.LoadFromFile("sample.html",FileFormat.Html);
//保存为XML格式
doc.SaveToFile("HTMLtoXML.xml", FileFormat.Xml);
System.Diagnostics.Process.Start("HTMLtoXML.xml");
}
}
}
vb.net
Imports Spire.Doc
Namespace HTMLtoXML
Class Program
Private Shared Sub Main(args As String())
'创建Document类的对象
Dim doc As New Document()
'加载html文件
doc.LoadFromFile("sample.html", FileFormat.Html)
'保存为XML格式
doc.SaveToFile("HTMLtoXML.xml", FileFormat.Xml)
System.Diagnostics.Process.Start("HTMLtoXML.xml")
End Sub
End Class
End Namespace
转换效果:
—End—
*请认真填写需求信息,我们会在24小时内与您取得联系。