整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:

在 Python 中将 HTML 转换为 PNG、JPEG、BMP、GIF 或 TIFF 图像

TML (超文本标记语言)是所有浏览器都支持的主要网页文件格式。它经常用于将数据和信息显示为网页。在某些情况下,我们可能需要将 HTML 文档转换为JPG、PNG、TIFF、BMP、GIF等图像格式。在本文中,我们将学习如何将 HTML 转换为 PNG、JPEG、BMP、GIF、或 Python 中的 TIFF 图像。

Aspose.Words for .NET官方最新版免费下载试用,历史版本下载,在线文档和帮助文件下载-慧都网

将 HTML 转换为图像的 Python API

为了将 HTML 转换为图像格式,我们将使用Aspose.Words for Python API。它是在 Python 应用程序中以编程方式读取和操作各种类型文档的完整解决方案。它使我们能够生成、修改、转换、渲染和打印 Microsoft Word(DOC、DOCX、ODT)、PDF和 Web(HTML、Markdown)文档。

请在控制台中使用以下 pip 命令从PyPI安装 API :

> pip install aspose-words

在 Python 中将 HTML 转换为 JPG 图像

我们可以按照以下步骤轻松地将 HTML 文档转换为 JPG 图像:

  1. 首先,使用Document类加载 HTML 文件。
  2. 或者,使用ImageSaveOptions类对象指定图像保存选项。
  3. 接下来,循环浏览文档中的所有页面。
  4. 之后,使用extract_pages()方法提取每个页面。
  5. 最后,使用save()方法将页面保存为 JPG。

以下代码示例展示了如何在 Python 中将 HTML 转换为 JPG 图像

# This code example demonstrates how to convert HTML document to JPG images.
import aspose.words as aw

# Load an existing Word document
doc = aw.Document("C:\\Files\\sample.html")

# Specify image save options
# Set save format as JPEG
imageOptions = aw.saving.ImageSaveOptions(aw.SaveFormat.JPEG)

# Set the "JpegQuality" property to "10" to use stronger compression when rendering the document.
# This will reduce the file size of the document, but the image will display more prominent compression artifacts.
imageOptions.jpeg_quality = 10

# Change the horizontal resolution.
# The default value for these properties is 96.0, for a resolution of 96dpi.
# Similarly, change vertical resolution by setting vertical_resolution
imageOptions.horizontal_resolution = 72

# Save the pages as JPG
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"C:\\Files\\Images\\Page_{page + 1}.jpg", imageOptions)

在 Python 中将 HTML 转换为 PNG 图像

我们可以按照以下步骤将 HTML 文档转换为 PNG 图像:

  1. 首先,使用Document类加载 HTML 文件。
  2. 接下来,创建ImageSaveOptions类的实例。
  3. 然后,指定图像保存选项,例如image_brightnessimage_contrast
  4. 接下来,循环浏览文档中的所有页面。
  5. 之后,使用extract_pages()方法提取每个页面。
  6. 最后,使用save()方法将页面保存为 JPG。

以下代码示例展示了如何在 Python 中将 HTML 转换为 PNG 图像

# This code example demonstrates how to convert HTML document to PNG images.
import aspose.words as aw

# Load an existing Word document
doc = aw.Document("C:\\Files\\sample.html")

# Specify image save options
# Set save format as PNG
imageOptions = aw.saving.ImageSaveOptions(aw.SaveFormat.PNG)

# Change the image's brightness and contrast.
# Both are on a 0-1 scale and are at 0.5 by default.
imageOptions.image_brightness = 0.3
imageOptions.image_contrast = 0.7

# Save the pages as PNG
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"C:\\Files\\Images\\Page_{page + 1}.png", imageOptions)

Python中的HTML到BMP转换

我们可以按照以下步骤将 HTML 文档转换为 BMP 图像:

  1. 首先,使用Document类加载 HTML 文件。
  2. 接下来,循环浏览文档中的所有页面。
  3. 之后,使用extract_pages()方法提取每个页面。
  4. 最后,使用save()方法将页面保存为 JPG。

以下代码示例展示了如何在 Python 中将 HTML 转换为 BMP 图像

# This code example demonstrates how to convert HTML document to BMP images.
import aspose.words as aw

# Load an existing Word document
doc = aw.Document("C:\\Files\\sample.html")

# Save the pages as BMP
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"C:\\Files\\Images\\Page_{page + 1}.bmp")

在 Python 中将 HTML 转换为 GIF 图像

同样,我们也可以按照前面提到的步骤将 HTML 文档转换为 GIF 图像。但是,我们只需要在步骤 4 中将图像保存为带有“.gif”扩展名的 GIF。

以下代码示例展示了如何在 Python 中将 HTML 转换为 GIF 图像。

# This code example demonstrates how to convert HTML document to GIF images.
import aspose.words as aw

# Load an existing Word document
doc = aw.Document("C:\\Files\\sample.html")

# Save the pages as GIF
for page in range(0, doc.page_count):
extractedPage = doc.extract_pages(page, 1)
extractedPage.save(f"C:\\Files\\Images\\Page_{page + 1}.gif")

在 Python 中将 HTML 转换为 TIFF 图像

我们还可以按照以下步骤将 HTML 文档转换为 TIFF 图像:

我们还可以按照以下步骤将 HTML 文档转换为 TIFF 图像:

  1. 使用Document类加载 HTML 文件。
  2. 使用save()方法将文档保存为 TIFF 。

以下代码示例展示了如何在 Python 中将 HTML 文档转换为 TIFF 图像

# This code example demonstrates how to convert HTML document to TIFF images.
import aspose.words as aw

# Load an existing Word document
doc = aw.Document("C:\\Files\\sample.html")

# Save the document as TIFF
doc.save(f"C:\\Files\\Images\\Output.tiff")

Python中的HTML字符串到图像的转换

我们可以按照以下步骤从 HTML 字符串动态生成图像文件:

  1. 首先,创建Document类的实例。
  2. 接下来,创建DocumentBuilder类的实例。
  3. 之后,使用insert_html()方法插入 HTML 字符串。
  4. 最后,使用save()方法将文档保存为 JPG。

以下代码示例展示了如何在 Python 中将 HTML 字符串转换为 JPG 图像

# This code example demonstrates how to convert HTML string to an image.
import aspose.words as aw

# Create document object
doc = aw.Document()

# Create a document builder object
builder = aw.DocumentBuilder(doc)

# Insert HTML
builder.insert_html("<ul>\r\n" +
"<li>Item1</li>\r\n" +
"<li>Item2</li>\r\n" +
"</ul>")

# Save the document as JPG
doc.save(f"C:\\Files\\Output.jpg")

结论

在本文中,我们学习了如何:

  • 以编程方式将 HTML 文档转换为图像;
  • 将 HTML 文件的内容转换为 PNG、JPEG、BMP、GIF 或 TIFF 图像;
  • 生成 HTML 文档并使用 Python 将其转换为图像。

近在IT圈和论坛中发现,很多用户提问怎么去掉Win10老弹出的“无法验证发布者”的提示框,今天IT之家就和朋友们分享一下解决该问题的办法。这个方法要用到注册表操作,因此提示各位最好先用软媒魔方的清理大师对注册表进行备份,以防误操作导致的问题无法解决。

具体操作如下:

1、在Cortana搜索栏输入regedit后回车

2、找到如下位置:

HKEY_CURRENT_USER\Software\Microsoft\Windows\CurrentVersion\Policies\Associations

注意,若没有最后的“Association”项,可在Policies上单击右键,选择新建→项,然后重命名为Associations

3、在右侧空白处单击右键,选择新建→字符串值,命名为LowRiskFileTypes

4、双击LowRiskFileTypes,在数值数据中输入(复制粘贴即可,注意不要丢失任何标点)以下内容后,点击确定:

.zip;.rar;.nfo;.txt;.exe;.bat;.vbs;.com;.cmd;.reg;.msi;.htm;.html;.gif;.bmp;.jpg;.avi;.mpg;.mpeg;.mov;.mp3;.m3u;.wav;

此时重启系统,修改即可生效。今后再遇到第4步中的文件格式,如果来源于“无法验证的发布者”,则不会出现安全提示。不过要提醒各位注意,微软在历代Windows系统中设置该提示的目的就是让用户警惕相关文件风险,因为实际上我们也无法确定某些被提示文件的安全性。去掉提示后,大家多加小心为妙。

TML标签

基本标签

HTML页面中内容是由HTML标签组织起来的,如页面中的文本、图像、Flash视频文件等都是通过HTML标签合理地显示在页面的各个位置。



1 标题标签<h1>~<h6>

标题标签表示一段文字的标题(主题),并且支持多层次的内容结构。HTNL.共提供了6级标题,分别为<h1>~<h6>,并赋予了标题一定的外观,所有标题字体加粗,其中山<h1>字号最大,<h6>字号最小.


2.图像标签<img>

在网页中常用的图像格式有4种,即JPG、GIF、BMP.PNG,其中使用比较多的是JPG、GIF和PNG,大多数浏览器都可以显示这些图像。


显示图像的语法:

< img src="ur1" alt="文本" width="x" height="y"/>


在语法中:

a、SrC属性:表示显示图像的地址。

b、alt属性:指定图像的替代文本,当图像无法显示时(如图片路径错误或网速太慢等)替代显示的文本,这样,即使图像无法显示,用户还可以看到网页丢失的信息,所以为页面上的图像都加上替换文本属性是个好习惯,这样有助于更好地显示信息,并且对于那些使用纯文本浏览器的人来说是非常有帮助的。

c、width属性:表示图像宽度.

d、height属性:表示图像高度。


3.段落标签<p>

顾名思义,段落标签表示将一段文字组成一系列段落内容,这样做的目的是内容应用某些格式和布局,使各个段落的逻辑更清晰明了。在HTML文档中,段落通过<p>标签定义。段落标签<p>表示段落的开始,</p >表示段落的结束。


4.换行标签<br/>

在希望不产生一个新段落的情况下进行换行,则使用<br>标签。<br>是一个空的HTML标签,由于关闭标签没有任何意义,因此它没有结束标签。


注意:

使用<b>和<br>的结果一样,在XHTML以及未来的HTML版本中,根据W3C规范,不允许使用没有结束标签的HTML元素,因此使用<br>页面更规范,有更长远的保障。


5.水平线标签<hr/>

水平线标签表示一条水平线,注意该标签与<br>标签一样,没有结束标签,直接使用<hr/>表示标签的开始和结束。

使用以上讲解的基本标签,就可以进行网页内容排版了。