要:hi,亲爱的们,为了提高大家对软件的认知能力,我们与报销吧联合推出了100款特色软件栏目。发现100款各有特色的软件,本次是第③期,风格特点“网页应用”,我们通过大脑进行数据扫描了16个网页工具库、500+的网页,收集整理出了6款网页版的应用,涵盖:图片压缩、格式转换、视频下载、词云图制作、文本转语音、平面设计的网页版工具,以及差旅报销神器—报销吧的鼎力支持,更多软件我们会在后续不断扫描网络,通过大数据精准为你推送你喜欢热爱的软件。
图片压缩利器:TinyPNG
如何把网页中要用到的图片压缩到最小,这是前端攻城师们在写网页时都会考虑的一个问题,本着控制空间体积以及图片加载速度的,所以需要用到稍微方便和不太失真的图片压缩工具。当然,如果你经常和图片打交道,你也会用得到。TinyPNG提供在线免费压缩图片,而且可以批量压缩后打包下载,只需要简单的两步就可以把你要压缩的PNG/JPG格式图片压缩到小很多又基本上不会影响图片的质量。它还提供API服务,可以将任何JPEG或PNG图像上传到Tinify API进行压缩,将自动检测图像的类型,并相应地使用TinyPNG或TinyJPG引擎进行优化。Tinify API允许你压缩和优化JPEG和PNG图像。
音频格式转换的工具:Media io
大家平时在用设备听音乐时,经常会遇到因为音源不支持流媒体的格式时往往会把您想对一件美好事物欣赏的乐趣打消掉,今天小编在这里介绍一款如何转换音频格式的工具。Media io 是一个支持在线音频格式转换的工具,支持的输出格式有MP3、WAV、WMA、OGG等150种格式,可选择的音频质量有320kbit/s、192kbit/s、128kbit/s、96kbit/s,让用户无需安装任何工具即可实现在线转换。第一步打开网站后选择想要上传的文件,支持URL链接,第二步选择要输出的格式和质量,最好点击转换按钮,根据文件的大小等待的时间也不同,当然如果下载软件的话也支持Youtube URL转换,完成下载到本地即可。
视频嗅探下载工具:Video Get
在线看视频业已融入了人们的生活当中。但是总还是有些情况下,我们没时间,或者断网的情况下,还是希望能够看到喜欢的视频,这个时候当然只能够祭出视频下载软件把视频下到本地来看了。每个视频巨头其实都已经推出了自家的客户端,也都带了视频下载功能,但我们有些时候还是需要一款通杀的视频下载软件,能够支持多家视频网站,能够少装点软件。Video Get是一个在线视频下载地址解析器,支持1000+ 网站,集合涵盖了所有的视频网站,如Youtube、优酷、Facebook、土豆网、Instagram、推特、Twitch等,用户只需要输入目标视频URL地址即可获取,同类产品还有VideoGrabber、KeepVid、SaveFrom等。
词云图制作生成工具:图悦
词云图,也叫文字云,是对文本中出现频率较高的“关键词”予以视觉化的展现,词云图过滤掉大量的低频低质的文本信息,使得浏览者只要一眼扫过文本就可领略文本的主旨。经常在各个媒体,微信圈,个人博客看到类似于这样的图片。第一感觉就是很漂亮,接着就在想这个东西是怎么做到的,觉得非常有意思。图悦是一款在线词云图制作工具,同类产品还有(WordArt.com、Tagxedo)该系统能根据热词词频、热词权重输出词云图,词云图输出支持四种模式:标准模式、微信模式、地图模式和导出EXCEL模式。
文本实时转换语音:百度广播开放平台
有时候我们需要把文字转换成语音,以方便在播放器中播放,但是大部分软件都是收费的,生成的语音文件无法下载。特别是需要在电台、微信公众号运营的小伙伴能用得到。见多了语音并可转化为文字的工具,但是我们也需要文字转语音呐。这时我们可以考虑使用百度广播开放平台轻松的把文字转换成语音。百度广播开放平台是一款在线的文本实时转换语音工具。采用更为逼真的人声与断句模式,有效的将文本转化为语音,并在云端直接生成语音文件,便于分享和转发。我们也可以点击“输入URL”标签 ,在新页面中输入网址,就可以把该网页的文字生成语音了。
免垫资的差旅报销工具:报销吧
现在基本每一家公司都少不了各种发票报销,公司的行政采购、营销广告花费、差旅出差等,还有公司经常有一些饭补、交通补贴、住房补贴,但是需要搞定各种发票进行报销,粘贴发票比较麻烦,怎么办?报销吧这款神奇的报销软件就可以帮助你有效提高报销效率,只要手机扫描一下,1秒就可自动识别和保存发票信息,不再担心贴票了。当然,平时我们商务、销售、市场、活动、老板人员出差要订票、打车、住酒店,而报销吧整合国内的众多旅游服务商,比如:飞鹤航空、携程与同程网的机票酒店、滴滴出行企业版、京东企业购等,一款软件内可以实现商务出差全过程,从出差到报销,无需再下载多个软件应用,只需一个报销吧,就可以实现应用内一站式预订机票、酒店、火车及打车和出差比价的功能,要说提高效率,出差就能“免垫资、免发票、免报销”。
傻瓜式的平面设计工具:创客贴
工作中需要制作各种海报、淘宝主图、名片、PPT、简历、宣传单、易拉宝、邀请函、信息图表,但是自己不会做,麻烦别人也不行,这款在线工具可以帮你傻瓜式的做设计。选择对应的平面设计素材,无需任何PS基础通过简单的托拉拽就可以设计出自己想要图片。创客贴是一款简单易用的线上图形设计工具,平台上提供了丰富的图片、模板等素材,通过简单的拖拉拽操作就可以轻松设计出精美的海报、PPT、邀请函、信息图和名片等各类图片,提供了图片框架、条幅、线条、形状、箭头、对话气泡、信息图、手绘、装饰等16种组件分类。
100款各有特色的软件:这是一个新栏目,我们通过网络(apple store、软件站、fnd.io等渠道)帮助你挖掘100款各有特色的软件,每天为你奉上6款不同“特色”的主题软件推荐,涵盖工作办公、效率生产、生活常用、商务出行等等,不限于移动端、网页版、电脑版系列软件,以此提高你的效率与软件见识,关注吐槽哥,随时掌握一手软件信息源头。
之前的稍后读专题中,爱范君介绍了一系列的稍后读工具,它们具有的标注功能,能够让用户初步整理网页内容中的有效信息——不过,这些标注都是建立在提取后的正文内容之上,因而只适用于能够提取到有效内容的网页,具有较大的局限性。
对原始网页直接进行标注则显然不需要考虑对各种网页复杂的适配问题。电脑端如 Chrome,Edge 等浏览器拥有各种类型的强大插件。Hypothesis 便是一款能直接在网页上进行标注的强大插件,关于它的具体使用方法可以在我们之前的文章中查看。
▲ Hypothesis 插件
iPad 相较电脑更为轻巧便携,且与 Apple Pencil 搭配使其具有了更好的书写体验以及对图像文档的标注能力。一系列如 Notability,PDF Expert,Procreate 等的优秀软件覆盖了笔记,PDF 阅读,绘画这些常用的领域,从而让 iPad 相较于其它同类产品独特的优势。
然而我们却很难在 iPad 上找到一款和 Hypothesis 类似功能的工具。较为出名的 LINER 和 Diigo 在 iPad 上可以使用,然而解锁其完整版需要高昂的订阅费。
直到最近,爱范君发现了一款具备网页标注功能且完全免费的浏览器 Command Browser,且可以连接 Notion,OneNote 来同步高亮和批注的内容。
▲ Command Browser 官网
接下来,就跟我们一起了解下 Command Browser。
使用 Command Browser 浏览网页的过程中,选中文本段落即会弹出功能菜单,选择「Highlight」便可高亮选中的文本。
▲ 选中文本进行高亮
高亮默认的颜色为黄色,在软件设置里还可以切换为蓝色,绿色,红色和浅黄色。相比在选中文本的弹出菜单里直接进行切换,目前的高亮颜色切换使用步骤较为繁琐。且在设置里切换高亮颜色后所有网页标注都会更改为新颜色,从而用户不能同时使用多种颜色来标记不同内容。
▲ 切换高亮颜色
用户可以对高亮的文本添加标签和笔记,记录的笔记可以选择保存至自己创建的不同分类中,方便之后的查阅和整理。
▲ 选择已高亮文本,可以进一步添加笔记和标签
▲ 对高亮文本添加笔记并保存到建立的不同分类中
▲ 为高亮内容添加标签
除了支持文本的批注,Command Browser 也支持向图片和整个网页添加笔记。添加的笔记同样也可以到不同分类的笔记本中。
▲ 为图片添加笔记
▲ 为整个网页添加笔记
在 Command Browser 中点击右上角的多功能按钮并选择「Highlights」,即可查看到所有高亮的内容,且下方也以标签的形式进行了归类。
▲ 查看高亮过的所有内容
在具体的标签下即可看到所有同一标签的高亮文本,点击高亮文本后会直接跳转至对应的原始网页段落位置。
▲ 从高亮内容跳转到原文位置
点击左上角的书籍图标或选择右上角多功能按钮下的「Journals」子选项都能进入笔记界面。在该界面可以看到之前所有针对文本,图片和网页的批注内容。相似的,用户也能通过点击日记本中保存的笔记内容跳转到笔记在原文中所对应的位置。同时,用户在笔记本中也可以添加独立于网页内容的笔记。
▲ 笔记界面,用户可对自己建立的笔记本进行置顶,默认置顶笔记本为软件操作演示
在包含高亮文本的网站下,选择右上角多功能按钮下的「Share」能够将高亮过的段落以网页链接的形式分享出去,同时也可以导出高亮段落为指定格式以及分享到其它如 Obsidian,Bear 等笔记应用中。
▲ 分享或导出当前网页的高亮内容
▲ 以网页形式分享的高亮文本
▲ 将高亮内容以纯文本,Markdown 的形式导出或发送至其它应用中
在笔记界面,点击笔记本标题下方的「Export」按钮即可将该笔记本中高亮和批注内容导出到 Obsidian, Bear 等应用中。
▲ 导出某个笔记本中的内容
▲ 将笔记导入至 Obsidian 的效果
除了支持将高亮和笔记导出, Command Browser 还支持将高亮和标注实时同步至 Notion,OneNote 等应用中。高亮内容支持同步的应用有 Notion,Readwise 和 RemNote,绑定高亮内容和图片的笔记则支持通过 Notion 和 OneNote 同步。
▲ 笔记内容可同步至 Notion 和 OneNote
值得注意的是,高亮内容的同步和笔记的同步是分离的。以和 Notion 同步为例,同步高亮到 Notion 中会生成一个名为「Command」的主文档,其中的子文档以网页文章标题为文件名,文档内容包括原始链接,高亮文本及与之绑定的标签。
▲ 高亮内容同步至 Notion 中的效果
而同步笔记则会生成名为「Journals」的主文档,其子文档为用户建立的笔记本名称。笔记的同步存在许多问题,例如在同一个网页中的笔记不能合并为一份,而是每一个笔记都被单独的罗列出来,没有按照网址进行归类,且不能显示笔记对应的标签信息。
▲ Notion 中笔记本目录下单个笔记是独立展示的,没有按照网页进行分类
Command Browser 支持将网页和笔记页面划分到不同的自定义工作空间,方便用户根据使用场景快速找到某一类型的网页。点击最右上角的图标可以查看当前工作空间的所有标签页,用户也可以选择将当前工作空间的网页移动至其它工作空间。
▲ 移动当前网页至其它工作空间
Command Browser 支持私密标签页,其中的网页需要经过生物识别解锁之后才可查看。在应用设置里还可以进一步设置私密标签页的锁定时间。
▲ 生物识别解锁私密标签页
Command Browser 也支持阅读模式,在阅读模式下也可进行标注。相比 Safari 的阅读模式,Command Browser 阅读模式下网页图片的宽度不会延伸至屏幕边缘,排版体验较好。
▲ 阅读模式对比,左图为 Safari 阅读模式,右图为 Command Browser 阅读模式
作为 iPad 上一款完全免费且具有网页标注功能的浏览器,Command Browser 基础标注体验已具有较高的可用性,且使用 Apple Pencil 的「随手写」可以方便的为高亮内容添加批注。Command Browser 还提供了丰富的标注导出选项。更进一步地,它还能够通过 Notion 等应用来实时同步高亮内容和笔记。
然后它现阶段并不完美,如高亮颜色的切换步骤较多,且无法实现多种高亮颜色共存;为高亮内容添加标签时会偶尔出现整个应用卡住,需要重新启动才能继续使用;批注笔记在 Notion 中的呈现过于碎片化,没有如同高亮一样依据网页链接进行归类。默认的搜索引擎为谷歌,在国内无法正常使用,需要切换到 Bing 才可进行搜索。
如果你对在 iPad 上对网页内容进行标注有需求或者感兴趣,那么不妨尝试一下这款应用。
*《Command Browser》在 App Store 得 4.4 分。支持 iPhone,iPad,大小为 48.1MB,免费下载,无内购。
这个信息爆炸的时代,我们每天都会接触到大量的网络数据。有时候我们需要获取一些特定的数据来进行分析或者处理。作为一个程序员,我曾经亲身体验了使用JAVA编程语言来抓取网页数据的过程。下面我将分享我在这个过程中遇到的挑战和解决方案。
一、背景概述
首先,让我们来了解一下什么是抓取网页数据。简单来说,抓取网页数据就是通过编程的方式从互联网上获取网页上的内容。这些内容可以是文本、图片、链接等等。而JAVA是一种广泛应用于开发各种类型应用程序的编程语言,也是我选择用来实现网页数据抓取的工具。
二、选择合适的工具
在开始之前,我首先需要选择一个合适的工具来辅助我完成任务。幸运的是,JAVA提供了许多强大的库和框架,可以帮助我们轻松地实现网页数据抓取功能。其中最常用和流行的工具就是Jsoup。Jsoup是一个开源的JAVA HTML解析器,可以方便地从HTML文档中提取所需内容。
三、分析目标网页结构
在开始编写代码之前,我需要先分析目标网页的结构。这是因为不同的网页结构可能需要使用不同的方法来获取数据。通过查看目标网页的源代码,我可以了解到它的HTML结构和标签使用情况。在分析过程中,我发现目标网页中的数据都被包含在特定的HTML标签中,这对我编写代码来提取数据非常有帮助。
四、编写JAVA代码
接下来,我开始编写JAVA代码来实现网页数据抓取功能。首先,我需要导入Jsoup库,并建立与目标网页的连接。然后,通过选择合适的HTML标签和属性,使用Jsoup提供的API来获取所需数据。例如,如果我需要获取所有标题为
Document doc = Jsoup.connect("目标网址").get(); Elements titles = doc.select("h1"); for (Element title : titles){ System.out.println(title.text()); }
通过以上代码,我可以轻松地获取到目标网页中所有
五、处理异常情况
在编写代码的过程中,我也遇到了一些异常情况。例如,有时候目标网页会进行反爬虫处理,限制访问频率或者要求登录验证。为了解决这些问题,我需要添加一些额外的代码来模拟浏览器行为,例如设置User-Agent头和处理Cookie等。此外,还需要注意异常处理,确保代码的稳定性和健壮性。
六、优化性能
为了提高网页数据抓取的效率和性能,我还进行了一些优化工作。首先,我使用多线程技术来并发地抓取多个网页,以减少等待时间。其次,我使用连接池来管理与目标网页的连接,避免频繁地创建和销毁连接。最后,我对代码进行了适当的优化和缓存处理,以减少不必要的资源消耗。
七、总结与展望
通过使用JAVA抓取网页数据的亲身体验,我深刻理解到了编程技术在信息获取和处理中的重要性。通过合理选择工具、分析网页结构、编写代码、处理异常情况和优化性能,我们可以轻松地实现网页数据抓取功能,并为后续的数据分析和应用提供强有力的支持。未来,我将继续探索更多关于JAVA抓取网页数据的技巧和方法,并将其应用到实际项目中。
以上就是我亲身体验使用JAVA抓取网页数据的故事。希望这篇文章能够对想要学习或者应用这方面技术的读者有所帮助。编程的世界充满了无限的可能性,让我们一起努力,不断探索和创新!
*请认真填写需求信息,我们会在24小时内与您取得联系。