Mac 上下载了一个文件,它作为 RAR 存档到达,无法打开它以访问在里面的内容。小编将带大家了解什么是 RAR 文件以及如何在 Mac 上打开和提取 RAR 文件的所有信息。
什么是 RAR 文件?
RAR 文件类似于 ZIP 文件。两者都是“归档”文件格式,用于将许多单独的文件压缩成一个文件。这样,您只需下载一个文件(或将一个文件附加到电子邮件中),接收者只需下载一个文件,而不是许多单独的文件。
RAR 代表R oshal AR chive ,以创建该格式的俄罗斯软件工程师 Eugene Roshal 的名字命名。RAR 格式的创建是为了解决 ZIP 格式中的一些缺陷,并带来了几个好处:较小的文件大小、将 RAR 拆分为多个块的能力以及错误恢复。
也就是说,自 ZIP 和 RAR 时代以来,我们已经走了很长一段路,现在我们有了更好的方法来压缩、加密和传输文件。7-Zip 格式是一种流行的选择,但它与标准相去甚远。因此,了解如何处理 RAR 文件仍然很重要。
如何在 Mac 上打开和提取 RAR 文件?
RAR 格式是专有的,因此 Mac 系统没有内置实用程序来处理它也就不足为奇了。但是,该解决方案就像安装可以在 Mac 上打开 RAR 文件的免费第三方工具一样简单。
以下是您可以选择的三个 RAR 提取选项。
1.用 Keka 打开 RAR 文件
Keka 是一种压缩和提取工具,可作为独立安装使用。安装后,您所要做的就是双击 RAR 文件以将其解压缩,或者按住 Control 键单击一个文件并选择Open。
至少对某些用户而言,使用 Keka 的不利之处在于,如果不先解压缩 RAR 文件,就无法浏览它的内容。您可能永远不需要此功能,在这种情况下,这是完成工作的绝佳工具。但是,如果您喜欢能够查看档案内容并只提取您需要的文件,那么 Keka 不是适合您的应用程序。
请注意,Keka 可以创建自己的压缩档案,但它不支持 RAR 格式。您只能使用 ZIP、7-Zip、TAR、GZIP 和 BZIP2 格式。
2.使用 Unarchiver 解压 RAR 文件
Unarchiver 是您在 Mac 上打开 RAR 所需的唯一应用程序。它比原生 macOS 实用程序强大数倍,并支持无限多的存档格式。该工具仍有许多可自定义的选项,可以按照您想要的方式提取档案。
它的一个方便的功能是它支持存档文件名的非拉丁字符。这样,您可以提取名称中包含外来字符的 RAR 文件。
Unarchiver 还支持许多其他存档格式,包括 ZIP、7Z、GZIP、CAB 等。
3.使用 Unarchiver 和“自动操作”解压 RAR 文件
如果您定期提取 RAR 文件,上述工具可能会感觉效率低下。幸运的是,您可以使用“自动操作”来自动执行 RAR 提取任务。
Unarchiver 将与自动操作协同工作,创建一个文件夹操作,自动解压缩 RAR 档案中的所有文件。
在“自动操作”中创建此操作后,您需要做的就是将 RAR 存档放在指定的文件夹中以提取它们。创建动作的方法如下:
1.在桌面上创建一个新文件夹并将其命名为Unrar。
2.打开Unarchiver,单击“解压”选项卡,然后从“解压归档到”下拉菜单中选择“归档的相同文件夹”。
3.启用“移动归档到废纸篓”,以便您的档案在解压缩后被删除。
4.启动“自动操作”,单击文件 > 新建。
选择“文件夹操作”,然后单击“选取”。
5.单击顶部的下拉菜单,选择“其他”,然后选择您的Unrar文件夹。
6.将“查找查找项目”操作拖到右侧的工作流程中。
7.在新添加的操作中,从“搜索”下拉列表中选择您的Unrar文件夹,然后从以下下拉列表中选择“任何”。接下来,选择文件扩展名,然后选择“包含”,然后在框中输入rar。
8.将“打开查找器项目”操作拖到右侧窗格中。
9.从打开方式下拉菜单中选择Unarchiver。
10.按Cmd + S,输入工作流的名称,然后单击Save。然后关闭 Automator。
11.将您要解压缩的任何 RAR 档案复制到桌面上的Unrar文件夹中。您的存档将立即被提取,所有文件都放在同一个Unrar文件夹中。
遇到 RAR 文件时,不必担心。这些适用于 Mac 的简单 RAR 提取方法将快速处理您遇到的任何问题。
https://www.macz.com/mac/327.html?id=NzY4OTYwJl8mMjcuMTg3LjIyNy4yNDQ%3D
天给大家分享一个超厉害的Vue Uniapp可视化拖拽编程项目dragUI。
drag-ui 基于 vuedraggable.js+vue+uniapp 的可视化拖放布局编程。能自动生成项目,自动生成代码,支持导入第三方组件。
效果图
dragUI演示视频
一个简单创建 hello world 界面的介绍视频,帮助大家更快了解项目。
<script src="https://lf3-cdn-tos.bytescm.com/obj/cdn-static-resource/tt_player/tt.player.js?v=20160723"></script>
# 克隆项目
git clone https://github.com/wozhishilaonanhai/dragUI.git
# 进入dragUI目录
cd dragUI
# 安装依赖包
npm install
# 用HBuilderX打开项目
运行 > 运行到浏览器 > Chrome
项目目录注释
作者已经将该插件上传到了插件市场,大家可以下载使用。
https://ext.dcloud.net.cn/plugin?id=1035
store中 componentsInfo 存贮组件的基本信息。
componentsInfo: { // 组件的基本信息
// id 0- 999 (约定)会根据id来判断是哪个list
list: [
{
name:'按钮',
id: 0,
componentName: 'Ibutton',
iStyle:{},
iClass: [],
propsValue: [
{
label:'值',
key:'text',
value:'按钮',
toDataOrHtml: 'html',
type: 'String'
},
{
label:'类型',
key:'type',
value:'default',
toDataOrHtml: 'html',
type:'select',
select: [
{label: '红色',value: 'warn'},
{label: '蓝色',value: 'primary'},
{label: '白色',value: 'default'}
]
},
...
]
},
...
]
}
项目中用到了 element-ui 组件库及第三方UI库 colorUI。
创建新项目
切换页面模式/组件模式
布局预览效果
查看uniapp页面代码
最后附上demo及项目地址
# demo地址
https://wozhishilaonanhai.github.io/dragUI/unpackage/dist/build/h5/index.html
# 仓库地址
https://github.com/wozhishilaonanhai/dragUI
ok,这次就分享到这里。如果小伙伴们感兴趣的话可以去看下哈。
所周知,python最强大的地方在于,python社区汇总拥有丰富的第三方库,开源的特性,使得有越来越多的技术开发者来完善。
python的完美性。
未来人工智能,大数据方向,区块链的识别和进阶都将以python为中心来展开。
咳咳咳! 好像有点打广告的嫌疑了。
当前互联网信息共享时代,最重要的是什么?是数据。最有价值的是什么?是数据。最能直观体现技术水平的是什么?还是数据。
所以,今天我们要分享的是:如何来获取各个文件格式的文本信息。
普通文件的格式 一般分为: txt普通文本信息,doc word文档,html网页内容,excel表格数据,以及特殊的mht文件。
一、Python处理html网页信息
html类型的文本数据,内容是由前端代码书写的标签+文本数据的格式,可以直接在chrome浏览器打开,清楚 的展示出文本的格式。
python 获取html文件的内容和获取txt文件的方法相同,直接打开文件读取就可以了。
读取代码如下:
with open(html_path, "r", encoding="utf-8") as f: file=f.read()
file 是html文件的文本内容。是一个网页标签的格式内容。
二、Python处理excel表格信息
python拥有直接操作excel表格的第三方库xlwt,xlrd。调用对应的方法就可以读写excel表格数据。
读取excel操作代码如下:
filepath="C:\\Users\Administrator\Desktop\新建文件夹\笨笨 前程6份 武汉.xls" sheet_name="UserList" rb=xlrd.open_workbook(filepath) sheet=rb.sheet_by_name(sheet_name) # clox_list=[0, 9, 14, 15, 17] for row in range(1, sheet.nrows): w=WriteToExcel() # for clox in clox_list: name=sheet.cell(row, 0).value phone=sheet.cell(row, 15).value address=sheet.cell(row, 9).value major=sheet.cell(row, 14).value age=sheet.cell(row, 8).value
其中row是表格数据对应的行数, cell获取具体行数,列数的具体数据。
三、Python读取doc文档数据
python读取doc文档是最麻烦的。处理逻辑复杂。处理的方式也有很多种。
python 没有直接处理doc文档的第三方库,但是有一个处理docx的第三方库。可以通过将doc文件转换为docx文件,再调用第三方python库pydocx来读取doc文档的内容。
这里需要注意的是,不要直接修改doc的后缀来修改成docx文件。直接通过修改后缀获取的docx文件,pydocx无法读取内容。
我们可以使用另外一个库来修改doc为docx。
具体代码如下:
def doSaveAas(self, doc_path): """ 将doc文档转换为docx文档 :rtype: object """ docx_path=doc_path.replace("doc", "docx") word=wc.Dispatch('Word.Application') doc=word.Documents.Open(doc_path) # 目标路径下的文件 doc.SaveAs(docx_path, 12, False, "", True, "", False, False, False, False) # 转化后路径下的文件 doc.Close() word.Quit()
代码所需的包接口:
import os import zipfile from win32com import client as wc import xlrd from bs4 import BeautifulSoup from pydocx import PyDocX from lxml import html from xpath_content import XpathContent from write_to_excel import WriteToExcel
python处理docx文档的方法有很多种,具体使用情况,根据个人需求来决定。
No.1 解压docx文件
docx文件的原理,本质上就是一个压缩的zip文件,通过解压以后,就可以获取原来文件的各个内容。
docx解压后的文件结构如下:
docx文件的文本内容存储结构如下:
文本内容存储于word/document.xml文件中。
第一种方法,我们就可以先将docx还原成zip压缩文件,再解压zip文件,读取word/document.xml文件的内容就ok了。
具体操作代码如下:
def get_content(self): """ 获取docx文档的文本内容 :rtype: object """ os.chdir(r"C:\Users\Administrator\Desktop\新建文件夹") # 改变目录到文件的目录 # os.rename("51 2014.09.12 1份Savannah.docx", "51 2014.09.12 1份Savannah.ZIP") # 重命名为zip文件 f=zipfile.ZipFile('51 2014.09.12 1份Savannah.ZIP', 'r') # 进行解压 xml=f.read("word/document.xml") wordObj=BeautifulSoup(xml.decode("utf-8")) # print(wordObj) texts=wordObj.findAll("w:t") content=[] for text in texts: content.append(text.text) content_str="".join(content) return content_str
最后获取到的就是docx文档的所有文本数据了。
No.2 将docx文档转换成python能够处理的文本格式
第一种方法,是依据docx文档的原理来获取数据,流程有点繁琐,有没有能直接读取docx文档内容的方法呢?答案,肯定是没有的,别想了,洗洗回家睡吧。
直接读取docx文档的方法没有,有没有能够将docx文档转换成python能够轻松处理的文本格式呢?
这个可以有,前面说了,python拥有大量丰富的第三方库(先夸一波我大python),历经千辛万苦终于找到了,一个能转换docx文档格式的第三方库,pydocx,pydocx库中有个方法pydocx.to_html()就可以直接将docx文档转换为html文件,怎么样?意不意外,惊喜不惊喜!
第二种方法,转换文本格式的代码如下:
def docx_to_html(self, docx_path): """ docx文档转换成html响应 :rtype: object """ # docx_path="C:\\Users\Administrator\Desktop\新建文件夹\\51 2014.09.12 1份Savannah.docx" response=PyDocX.to_html(docx_path)
获取到的response是html文件内容。
四、Python处理mht文件
mht文件是一种只能在IE浏览器上展示的文本格式,在chrome浏览器中打开是一堆的乱码。
No.1 伪造IE请求mht文件内容
最基础的读取mht文本的方法就是伪造IE浏览器请求。
调用requests库,发送get请求网页链接,构造IE的请求头信息。
理论上来说,这种方法是可行的。但是呢,不建议用,原因大家都懂得。
No.2 转换文件格式
好了说正经的方法,猜测mht文件能否修改成其他文件格式来直接读取呢?
docx,不行;html,不行;excel,更不用说了。
真相只有一个!!!
直接修改后缀得到的docx,无法读取。
so,我们想到的方法是什么呢。没错,就是修改成doc文档。
方法是匪夷所思的,但也是灵感一现。
mht可以直接通过修改后缀转换成doc文档,doc文档读取文本内容的方法具体参考上面读取doc文档的方法。
如何获取html文本的内容?
html文本的内容是网页结构标签数据,取出文本的方式是:re正则,或者xpath。
后续,小伙伴有需要的话,会再开一章详细了解re,xapth的使用规则。
来源网络,侵权联系删除
*请认真填写需求信息,我们会在24小时内与您取得联系。