网页下载下来使用,在日常工作中使用频率还是很高的,有时候确实能解一时之急,我自己就有很窘迫的经历。
我开会的时候,都会把准备好的文档存在局域网,到会议室直接打开就能直接用了。有一次到分公司,由于分公司刚刚成立,内网还没有和母公司连通。结果这下子懵逼了,上不去内网,看不到文档。又是叫同事发过来,又是提发送文件的安全申请,让人着急。
如果把网站保存下来,放在自己的电脑中,既不用担心信息泄露问题,又不用为了看不了文档而着急。
遇到问题,记录下来,然后解决问题,程序员的解决思路永远是自己创造轮子的,接下来就是不断的探索解决方案。
其实下载网页的方式有很多种,其中有几种办法使用的比较多,例如:如果你用Chrome,直接按 Ctrl+s 就可实现。使用这种方法,Chrome会把整个网站,按照编译完成的源码目录结构保存下来。像下面这样:
下载完成的文件直接点击 xxx.html 可以直接离线访问,但是这种方式对目录的依赖结构比较高,怎么理解呢?就是 html 文件和对应文件名的文件夹必须在同一个目录中,才能正常使用。拷贝到其他机器的时候必须要两个同时拷贝才可以,否则就会排版错乱。
如果有十个或者更多的网页需要拷贝或者删除,就会很麻烦,例如我想在其中找到其中几个,复制到其他地方,很容易弄错顺序。
HTML 是一种纯文本格式,它用于排版文字。纯文本文档的意思就是,文档中只包含文字内容,不包含二进制内容,举个例子:打印出的A4纸,只有文字没有图片。而 HTML 想要显示照片等二进制信息,通常都会链接到其他文件,也就是上面文件夹里面的内容。
不过 Chrome 下载文件这种方式也有优点,下载下来的文件可以保持独立性,比如说,我需要这个网页中的一张图片,那么就可以直接到文件夹里面寻找了。
另外还有一种办法,也有很多人再使用。Chrome 在打印网页的时候,会把网页转成 PDF ,然后在进行打印。那么就给我们提供了很明确的思路,把网页直接保存为 PDF ,这样保存下来的网页就只有一个文件。
使用Chrome,直接按下Ctrl+p就可以。然后目标打印机选择 另存为 PDF 。
这个功能很多浏览器都支持
但是这种办法也有很明显的缺点,由于 PDF 是静态文档,网页上的一些动画可能不会正常显示,而且排版也有可能会错乱,这完全靠运气。个人觉得这不是一种很靠谱的方法。
这时候主角来了!有一个工具既可以把网页保存为 html 又可以保持是单文件。他就是 monolith ,你可以在 github 上面找到它,但是源码并没有编译为可执行文件,我把它编译了一下,下面会放上来链接,https://github.com/leconio/Repos/raw/master/monolith.7z。
那么下面就简单说说使用方法:如果你下载我的链接,那么里面有三个文件:
第一个是Mac平台编译出来的,使用方式为:
./monolith 网站地址 > xxx.html
默认情况下 monolith 会把生成的 html 输出到标准输出流,也就是当前终端。使用 > 我们把输出的内容重定向并覆盖到文件。
执行完成之后,在这个目录下面就会有一个对应的文件:xxx.html 。
另外两个是 Windows 平台使用的。为了简化使用,我写了一个 CMD 脚本。直接点击 monolith.cmd ,然后粘贴地址就可以完成下载。
下载完成之后,在本地你会发现只有一个 html 文件。我们打开之后,发现图片和JS等信息都在,而且排版正常。那么就要思考了,我们之前说过,HTML 是放置纯文本信息的,那么图片在哪里呢?
答案显而易见,就在 HTML 文件里面。为了方便小图片传输,有一种叫 Base64 的东西,它可以把二进制信息变成成纯文本。这在使用 Json 传递数据的今天十分常见,它可以减少一次请求(题外话),这里就是用的这个原理。monolith 把图片等二进制内容转为了纯文本,保存在 HTML 文件中。我们在下载的文件源码可以看到:
对比源代码,src 信息已经变成了 base64 格式的图片,就是那串乱码。复制那串乱码,从网上搜一个 base64 转图片工具,粘贴进去,这时会发现就是我们看到的那张图片。这样一来,无论这个网站上有多少个文件,都会保存到一个 HTML 文件里面,而且还能离线使用。
当然,base64 编码的图片比原生图片略大,这可能也是你现在在担心的问题。不过 monolith 会特殊处理文件体积。我们可以看看 Chrome 直接下载和使用 monolith 下载体积相差多少。我们把两种方式下载的网页都进行了 7-Zip 压缩。
我们可以看到,使用 monolith 下载会比 Chrome 直接下载小一倍还多!
最后要说的是局限性,无论那种方法,都几乎不能把视频网站中的视频下载下来。因为现在的视频地址都是 Token 加密的,同理,使用 Token 加密的其他请求信息也无法下载。
比如你可以试试下载其他网站的首页,Logo 和视频都是下载不了的。但是也有解决办法,那就是另外一个领域的事情了,以后有机会说给大家听。
如果这篇文章对您或者您的朋友有帮助,感谢您关注,转发。
有诗书气自华,最是书香能致远!
脑有所思,技有所长,平凡之中是独自的默默而为。
大家好,最近收集到一些书籍:你不知道的javascropt(上、下卷)、JavaScript高级程序设计第四版。想必大家都听说过,可能有的人已经看过了。本来是想看完再来分享下书中的精华,但是最近看书的效率越来越慢了,于是还是想把书籍直接分享出来,大家自己看吧。毕竟自己体会的才是原装,别人的只是看法!想要书籍的同学可以评论里回复或者私信关注我,我把书籍分享给你。(修改:因头条上不能上传文件,我在评论区提供了下载链接!)
你不知道的JavaScript:这个系列中的每本书专注于语言中一个最容易被误解或者最难理解的核心部分,进行深入、详尽的介绍。在阅读此书时,你应当审视自己对于 JavaScript 的理解,仔细思考书中讲解的理论和那些“你需要知道”的东西。现在你所理解的 JavaScript 很可能是从别人那里学来的不完整版。
本书既适合 JavaScript 语言初学者阅读,又适合经验丰富的 JavaScript 开发人员深入学习。
JavaScript高级程序设计:本书是 JavaScript 经典图书的新版。第 4 版涵盖 ECMAScript 2019,全面、深入地介绍了 JavaScript 开发者必须掌握的前端开发技术,涉及 JavaScript 的基础特性和高级特性。书中详尽讨论了 JavaScript 的各个方面,从 JavaScript 的起源开始,逐步讲解到新出现的技术,其中重点介绍 ECMAScript 和 DOM 标准。在此基础上,接下来的各章揭示了 JavaScript 的基本概念,包括类、迭代器、代理,等等。另外,书中深入探讨了客户端检测、事件、动画、表单、错误处理及 JSON。本书同时也介绍了近几年来涌现的重要新规范,包括 Fetch API、模块、工作者线程、服务线程以及大量新 API。
最近我在收集学习资料,想要了解更多的同学可以关注我哦,共同学习,共同进步!
天来给大家整点干货,分享8个资源丰富且免费下载电子书的网站,每个都无需登录,免费下载,喜欢看的小说、漫画、古诗集等都能帮你找到,喜欢看电子书的记得收藏起来!
1
Libgen
堪称全网最大的电子图书馆,能够找到大量免费的小说、散文、漫画、励志、传记、文献、期刊等电子书资源。
网站:https://libgen.rocks/
支持通过输入书名、作者、发布时间、出版社等方式查找书籍,每本书籍都提供了多种下载格式,支持PDF、EPUB、电子书等多种格式下载,下载的电子书也可以直接打开阅读。
2
知识库
一个页面简单,资源丰富的电子书下载网站,下载方式也非常简单。在这里我们可以找到最新的书籍,每隔几天就会上新一批书籍,并且还会标注书籍上新时间。
网站:book.zhishikoo.com/
网站内书籍分类详细,目前有着:成功励志、经济管理、艺术摄影、历史考古、计算机、互联网、家居生活类书籍。并且每本书也会给到对应的下载链接,只需要输入提取密码就可以下载PDF格式的书籍。
3
心晴
一个专门提供心理学书籍的网站,提供了大量的初学者入门心理学,网站每天都会不断的上架新书,各种心理学方面的书籍都能在这里找到。
网站:http://www.ixinqing.com/
4
manybooks
这个网站我愿称之为yyds,收集了超50000本免费电子书。并且它的分类也很详细,包括:浪漫小说、动作与冒险、悬疑惊悚、历史小说、文学小说、科幻小说、随笔、商业等等。
网站:https://manybooks.net/
当然我们也可以通过输入书名查找想要的书籍,最重点是全部都支持免费下载PDF格式。
5
书堆阅读
“书堆阅读”是一个汇集了人文社科、计算机编程、经济管理等于一体的网站,首页搜索栏下方呈现人文社科、经济管理、软件编程、成功励志、健康心理、教育学习、人工智能、区块链八大搜索类别。
网站:https://www.werebook.com/
在我看来,这个算是程序员必备的网站了。提供的书籍包括:AI、Android、C#、Html5、Java、Javascript、云计算、数据库、哲学、商业、成长等相关的电子书籍,学习程序编码的朋友可以在这里找到入门书籍以及学习资源。
它的每本书籍都专门提供了下载方式,查看书籍简介的下方就可以看到epub格式下载,点击下载后输入验证码即可获取整本书籍。
6
SoBooks
一个超级丰富的电子书网站,页面也非常干净,而且所有的书籍都进行了详细分类,提供小说、文学、历史、名著、悬疑、科幻、哲学等电子书。
网站:https://sobooks.net/
它的首页每周还会不定期上架新的书籍,可以在页面预览到最新发布的电子书,它还支持强大书籍搜索功能,预览不到的书籍还可以直接输入书名查找,找到后下滑页面就可以看到下载方式。
7
planetebook
一个完全免费的电子书和文献网站,网站提供的所有书籍都是按照书名展示,大多数都是国外的书籍。
这里的每本书籍都为大家提供了3种下载方式,包括:epub、PDF、mobi。
网站:https://www.planetebook.com/
英文不好的同学,可以借着浏览器自带的网页翻译,将页面翻译成中文。
8
熊猫搜书
熊猫搜书不仅本身是一个搜书网站,同时更是一个整合了众多搜书引擎的聚合类搜书网站,可以说是一个电子书搜索引擎导航网站,汇集了鸠摩搜书、书单网等多个网站,使用者通过熊猫搜书一个平台既可以搜索到不同网站的资源,便捷又高效。
网站:https://xmsoushu.com/#/
而且还提供免费下载,下载的格式包括:TXT、PDF、EPUB、AZW3格式。
不知道大家有没有发现这些书籍大多都是PDF格式的文件,如果是涉及到文献资料方面的书籍下载,就需要我们对文本内容进行编辑。这里小小迅推荐这款软件—迅捷PDF转换器
它可以对PDF文件进行进行多种不同格式的转换与处理,处理后的文件清晰度高,排版整齐。它还很多实用的办公功能,比如文字语音转换,CAD转换,图片格式转换,OCR文字识别,PDF翻译等等。
百度搜索【迅捷PDF转换器】即可完成下载→
以上就是这次和大家分享的免费下载的电子书网站,如果你也喜欢用电子设备看电子书的话,大家可一定要收藏好哦,想看书的时候随时都可以打开查找!
*请认真填写需求信息,我们会在24小时内与您取得联系。