整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:

Javascript - 3种 HTML 转换为纯文本的方法

几天,我手里的一个项目需要将富文本的所有 html 标签全部删除,得到纯文本后再存储到数据库中。在一系列得搜索操作之后,我找到了实现这个目的的几种方法,在这里我分享给大家,当你遇到同样的情况兴许也能用的上。

1. 使用 .replace(/<[^>]*>/g, '')

这个方法是从文本中去除 html 标签最简单的方法。它使用字符串的方法 .replace(待替换的字符串,替换后的字符串) 将 HTML 标签替换成空值。 /g 是表示替换字符串所有匹配的值,即字符串中所有符合条件的字符都将被替换。

这个方法的缺点是有些 HTML 标签不能被剔除,不过它依然很好用。

2. 创建临时DOM元素并获取其中的文本

这种方法是完成该问题的最有效的方法。创建一个临时 DOM 并给他赋值,然后我们使用 DOM 对象方法提取文本。

3. 使用 html-to-text npm 包

html-to-text 这个包的功能很全了,转换也有许多的选项比如:wordwrap, tags, whitespaceCharacters , formatters 等等。

安装:

npm install html-to-text

使用:

最后感谢阅读,如果此文对您有帮助,请点赞或添加关注。

们经常会在网上查找资料,而大多文档下载都需要付费,有哪些方法能免费将网页转换成Word文档呢?下面一起来看一看吧。

1、直接复制

最简单的方法就是直接将网页中所需段落或文字选中后,然后右击并选择“复制”,再新建一个Word文档粘贴进去就可以了。

2、另存为

有一些资料网站做了限制,文字无法选择,或者选择之后也复制不了,那么我们可以先将其以网页进行保存。在网页任意处右击并选择“网页另存为”;

接着将网页以HTML文件形式保存到电脑桌面后,双击打开这个网页,就可以随意进行复制并且粘贴到Word中了,只是这个网页加载会比较慢,不太建议使用。

3、截图转文字

如果有些网页资料限制多,以上两种方式都无法操作,那我们可以将需要的页面内容进行截图保存,使用一些聊天工具的截图工具或电脑自带的屏幕截取都可以。

然后再使用转换工具将图片识别成文字就可以啦。我们可以使用speedpdf在线转换工具的图片转Word功能,不仅能识别文字,如果有图片,也能以原有格式转换成Word。

首先搜索Speedpdf进入在线转换后,选择列表中转换格式中的“JPG to Word ”;然后将所有保存的图片批量全部上传进行转换,这样就能将内容转到同一个Word文档中。

转换完成之后直接下载就可以打开Word文档了,是不是很方便,而且转换也是免费的哦,强烈推荐这种处理方式呢。

果你有MicrosoftWord文档,并且希望将其放到Web上,则需要将该文档转换为HTML,以便在网页上显示该文档。有几种不同的方法可以做到这一点。你选择的方式将取决于你最终想要的效果。如果你想要一些高级训练,你可以参加学习HTML 5培训课程这将教会你更多的知识。

将Word转换为HTML的简单方法

将 Word 文档转换为 HTML 的最简单方法是使用 Microsoft Word 来完成。 在 Microsoft Word 中打开你的文档,然后转到页面顶部并选择“文件”,然后选择“另存为”。 当另存为窗口打开时,在文件名插槽中输入你想要的文件名称。 接下来,单击另存为类型,将显示一个下拉菜单。 选择网页并点击保存。

使用在线转换器

如果有很多文本格式并且使用 Microsoft Word 并没有按照你想要的方式保存它,你可能需要使用免费的在线 Word 到 HTML 转换器。 这些在线转换器会将你的 Word 文档转换为 HTML 代码。 然后你可以将代码粘贴到空白网页上并上传。

使用 HTML 软件转换 Word 文档

使用许多 HTML 编写软件,你可以选择在 HTML 编写软件中转换你的 Microsoft Word 文档。 Dreamweaver 是最流行的 HTML 编写软件,它有一项功能可以帮你完成这项工作。想要学习HTML5相关技术,HTML5培训学习是一个很快的捷径,专业导师线下面授教学,4-5个月的学习周期,课程系统又全面,紧跟企业需求,轻松就业。

要使用 Dreamweaver 将 Word 文档转换为 HTML,请打开一个新网页。 转到文件>导入>Word文档,将出现一个带有一些选项的弹出框。 选择哪些选项并选择确定。 然后你的文档将出现在网页上。

如何使用记事本转换文档

如果你知道一点 HTML,你可以自己转换你的 Microsoft Word 文档。 首先复制你的 Word Doc,然后打开记事本并将其粘贴到记事本上。 这将从你的 Word 文档中删除所有格式。 现在你只有文本,你可以构建你的 HTML。

使用 Google Docs 转换为 HTML

现在称为 Google Drive 的 GoogleDocs 也将为你执行此操作。 这是许多记者将他们的 word 文档转换为 HTML 以在网络上发布的方式。

首先,单击红色的“创建”按钮并选择“文档”。 复制你的 Microsoft Word 文档,然后将其粘贴到你的新 GoogleDocs 页面上。 接下来,单击文件,然后选择“下载为”。 会弹出一些选项,你选择“网页”。 它会立即将你的文件下载为 zip 文件。

有很多方法可以将你的 Microsoft Word 文档转换为适用于 Web 的 HTML。 你可以使用免费的在线工具来完成,脱离文档并自己制作 HTML,如果你想了解更多HTML 5相关知识,可以报名参加HTML 5培训课程并学习如何将HTML 5编程技能提升到更高的水平,增强自身竞争力,让自己在职场中更有优势。

了解更多