列表是一个接一个显示条目的首选方式,而不是使用<br>标记。完整的列表定义包括开始和结束标记,以及表示列表中每个条目的标记。
有三种类型的列表:有序列表、无序列表和定义列表。
无序列表是一个带条目符号的列表,类似于菜单。
无序列表 - <ul> ... </ul>
ul标记定义无序列表的开始和结束,列表项包含在ul标记中。
无序列表项 - <li> ... </li>
li标记添加每个条目的文本,每个列表项必须有自己的li标记。
符号类型 <ul type="disc | circle | square">
默认情况下,浏览器将显示圆形条目符号。这可以通过使用ul标记的type属性来更改,这将更改整个列表的条目符号类型。
条目符号类型 <li type="?">
通过设置li标记的type属性,可以为列表中的某个条目设置不同的符号类型。
以下是无序列表的示例:
浏览器显示内容如下所示:
关工具:
1.PyMuPdf 组件, python组件包,含mupdf的核心功能并与mutool功能兼容
备选: FreePic2Pdf.exe 第三方PDF书签管理工具,可直接提取PDF文档目录
2.Python SDK包及PyCharm开发工具(PyCharm只需下载社区版本即可)
相关操作:
提取pdf的索引目录: 有多种方法,常见的如: 1.直接拷贝目录/OCR识别目录 2.PDF阅读器自带获取目录 3.通过zotero和zotfile的提取功能 4.devonthink来创建TOC 5.通过FreePic2Pdf第三方提取软件 6.通过mutool命令行工具包 都可以实现, 这里放几张展示图:
获取PDF目录(不需要Python):
方法一:mutool工具执行命令行获取TOC方法二:mutool run javascript脚本来获取方法三:FreePic2Pdf等第三方提取软件
如上所示: 我们提供的多种方法都可以不依赖Python实现提取PDF目录,但为了后续的文章技术进阶,以及操作流程自动化,我们在本文开始引入python来实现我们的需求.因此这里我们采用的是PyMuPdf来实现.具体的下载链接已放置于文章开头.
获取PDF目录(使用了Python)
步骤一:配置基础的开发环境
Python的安装比较简单,官网下载安装包双击安装即可,因此本文不再详细讲解,(只是要注意本文我们要下载大于2.7的版本来使用,如果你的python环境有问题,请和我的3.9版本保持一致)
到官网下载后双击安装
上面安装好python环境后,接着我们来安装PyMuPDF Python组件包,相关帮助文档可参考如下:
按python版本二种方式选一种来安装
这里我们选择的是下载whl包安装按自己系统下载,我下载的是macos-cp39
按上面方式2下载whl文件并双击安装Mupdf Python组件后,接着我们开始配置PyCharm开发工具, 用最前面的链接下载PyCharm软件并设置好PyCharm的Python SDK版本,具体如下所示:
确保用的是Python3的SDK
步骤二: 编写Python代码,执行生成HTML:
## 提取章节信息import fitz # = PyMuPDFpdfName = "java2.pdf"doc = fitz.open(pdfName) # open PDFtoc = doc.getToC() # get current table of contentswith open("chapter-t.html", mode="w", encoding="utf-8") as f: for t in toc: t[2] = pdfName + "-" + str(t[2]) # show what we have so far chapterInfo = "{}{}-{}{}".format("<p>", t[1], t[2], "</p> ") print(chapterInfo) f.write(chapterInfo)
用IE浏览器打开上面生成的HTML,用Ctrl+Shift+A导入至SuperMemo进行Split命令分割,如图:
IE浏览器打开展示效果SM中使用自定义符号来分割PDF索引目录导入SM操作最终的索引目录导入效果
步骤三: 开始PDF文档的增量学习
我们对上面的分支添加学习计划并Ctrl+L开始学习,同样左侧排列SM软件,右侧排列PDF阅读器: 提示: 取消SuperMemo软件的窗口背景选项,才能进行如下二个软件的左右布局
当复习到对应的元素时打开PDF(PDF学习)
基于Alfred/AHK/Quicker来编写脚本,实现搜索并打开PDF,接着按页或章节内容跳转到指定章节
按PDF索引数据打开PDF基于PDF索引的增量阅读
添加/检索/及批量管理注释书签(PDF提取)
使用福昕阅读器的注释功能PDF注释添加/删除/管理(PDF提取)
增量提取的子注释同步回SM软件(提取同步)
因为我们的PDF内容提取是在PDF阅读器中实现的,为了能使提取的文章内容也能在SM软件中增量,我们考虑同步回SM软件中,这个操作可按自己的需求或频次来决定,不一定非得同步回SM软件.
同步回SM时唯一要注意的是最好不要覆盖掉原来同步过的子元素内容(确保保留学习进度) 具体如何避免这个问题我在文章末尾会有较详细的概述及相关方法.
用福昕来阅读只能导出文本注释
提示 : 上面导出的福昕阅读器内容注释我们处理如下,接着再导入SuperMemo进行Split分割:
自己手动处理下段落分割符号
上面的注释文本复制进SuperMemo软件,再使用Split命令分割就是按段落内容正确的分割了.
导入SuperMemo来分割处理最终处理结果(PDF提取同步)
如上所述: 整个PDF增量阅读提取流程结束.以后我们只需重复执行这些步骤来阅读即可.你可以参考我之前写的一篇内容来了解基于PDF目录索引来进行增量学习PDF文件的流程(链接如下):
主要讲解的是Mac系统下使用DevonThink及PDFExpert阅读器来实现SuperMemo增量学习的整体思路.如果你用的是Windows系统,那么你可以使用Everything/FileLocator Pro 工具代替DevonThink的功能,使用福昕阅读器或者BookxNote阅读器来代替PDFExpert的功能.
考虑到要支持注释中含有图片的问题,我推荐在Mac操作系统下使用Highlights PDF阅读器,在Windows下使用BookxNote阅读器.如果还不能满足你特定的需求,则建议用本文的PyMuPdf组件编写一些简单的Python代码,来实现更复杂及更自由化的需求.
Mac系统下的Highlights演示:
Mac下的Highlights阅读器灵活丰富的注释导出功能
由于html导出的是base64的图片存储,因此建议导出TextBundle(本地图片|markdown)格式:
导出成markdown再转成html
说明:
如上所示,如果是MAC系统使用Highlight作为PDF阅读器,导出注释时. 第一种可以直接拷贝右侧的注释内容至SuperMemo中,第二种则是导出右侧注释为TextBundle格式(图片本地存储)并把md文件转换成Html(如果直接Highlights导出为Html注释笔记,里面的图片为base64编码,不能在SuperMemo直接导入)再导入SuperMemo.
TextBundle对应为本地图片和md
## MarkDown -> Htmlpandoc text.md -o text1.html
Windows下BookxNote的演示:
下图为BookxNote阅读器的功能演示,可在Windows下作为代替Mac端Highlights软件部分功能:
Windows下BookxNote演示
步骤四: 提取内容同步回SM软件时保留学习进度
通过Python脚本来实现进度同步功能,流程上依赖于时间戳标记(不同于官方默认的按ID同步),即阅读时在PDF文件中通过文本注释的形式添加时间戳标识作为书签,阅读中断后,我们会按上面的方式导出注释,作为书签使用的这个时间戳会在导出的注释(最终的html)中存在,这个html导入SuperMemo分割时,用此时间戳作为分割符号,即生成了每个元素都有了一个时间戳作为唯一ID使用.因此在重复导入的多个不同的集合中(跨集合)我们也可以迁移旧的学习进度至新集合.
PDF阅读加时间戳作书签及分割符脚本使用脚本来实现学习进度同步功能该图所示的网盘下载地址在评论区
完结:
以上进度同步功能的具体操作,后期会考虑直接录制视频来演示.因此本文不再继续对细节进行说明. 说明: 上图的脚本下载链接详见评论区...
我是一只热爱学习的小胖子,如果你也热爱学习,并且对SuperMemo感兴趣,欢迎转发和评论!
inCatalog 2024.7.5 是 WinCatalog 软件的一个特定版本,具体于 2024 年 6 月 12 日发布。WinCatalog 是一款流行且功能强大的文件和磁盘管理工具,旨在帮助用户高效地组织和管理大量的文件、文件夹及各种类型的存储设备。以下是关于该版本的详细信息:
WinCatalog 2024.7.5 带来了几个显著的新功能和改进,包括但不限于:
使用 WinCatalog 2024.7.5 可以带来以下几个关键好处:
WinCatalog 2024.7.5 是一款非常有用的工具,特别适合需要管理大量数据的用户,如图书馆管理员、档案管理人员、收藏家、以及需要频繁进行文件检索和整理的办公室工作人员。通过尝试下载和使用该软件,您可以更好地了解它是否满足您的需求。
WinCatalog 2024.7.5 是一款功能全面的文件和磁盘管理工具,旨在帮助用户高效地组织、管理和搜索大量文件和存储设备。以下是该版本的一些主要功能分类:
通过这些功能,WinCatalog 2024.7.5 使用户能够更高效地组织和管理他们的文件和存储设备,节省时间和精力,并确保数据的完整性和安全性。如果需要进一步了解或试用,可以访问 WinCatalog 的官方网站下载试用版或者查看更多详细说明。
WinCatalog 2024.7.5 是一款基于先进的文件系统索引技术和数据库管理原理的文件和磁盘管理工具。它的底层原理涉及文件扫描、元数据提取、索引构建、搜索算法和数据库管理等关键技术。
当用户启动 WinCatalog 时,程序首先会对指定的存储设备进行扫描,逐个读取文件和文件夹的信息。同时,它会自动提取文件的元数据,包括文件名、大小、日期信息、文件属性以及可能存在的标签、缩略图和描述等。这些元数据可以帮助用户更快速地定位和管理文件。
WinCatalog 使用经过优化的索引构建算法,将扫描得到的文件和元数据信息存储在内部数据库中。这个数据库采用高效的数据结构和索引方式,以便快速响应用户的查询请求,并支持多条件、多字段的高级搜索操作。索引的构建和数据库的管理是保证软件高效性能的关键。
WinCatalog 实现了复杂的搜索算法,能够快速而准确地定位用户所需的文件和目录。它支持多条件搜索、即时报表、行首搜索操作符等功能,通过对索引数据的智能查询来实现高效的搜索操作。
底层原理之外,WinCatalog 还设计了友好的用户界面和交互流程,使得用户可以轻松地使用软件进行文件管理和搜索操作。这包括直观的菜单设计、交互式的搜索界面以及快速的反馈机制,让用户能够高效地完成各项操作。
WinCatalog 通过加密支持和访问控制等技术手段,保护用户的数据安全和隐私。它确保用户的敏感数据得到有效的保护,同时提供备份和恢复功能,以防止数据丢失。
WinCatalog 2024.7.5 的底层原理涉及文件扫描、元数据提取、索引构建、数据库管理、搜索算法和用户界面设计等多个方面,通过这些技术手段,它为用户提供了高效、安全和便捷的文件和磁盘管理服务。
WinCatalog 2024.7.5 的架构设计旨在提高文件和磁盘管理的效率、可扩展性和用户体验。以下是该软件的主要架构组件和它们的功能描述:
Copy Code-------------------------------------------------
| 用户界面层 (UI Layer) |
-------------------------------------------------
| 应用逻辑层 (Application Logic Layer) |
| - 文件扫描与索引模块 |
| - 搜索与查询模块 |
| - 重复文件查找模块 |
| - 元数据管理模块 |
-------------------------------------------------
| 数据访问层 (Data Access Layer) |
| - 数据库管理系统 |
| - 数据备份与恢复模块 |
-------------------------------------------------
| 底层服务层 (Core Services Layer) |
| - 文件系统接口 |
| - 加密与安全模块 |
| - 哈希计算模块 |
-------------------------------------------------
| 系统服务层 (System Services Layer) |
| - 自动更新服务 |
| - 日志与监控模块 |
-------------------------------------------------
| 集成与扩展层 (Integration and Extension Layer) |
| - 插件支持 |
| - API 接口 |
-------------------------------------------------
这种分层架构设计不仅提高了软件的可维护性和可扩展性,还确保了各个功能模块之间的独立性和协作性,从而为用户提供了高效、可靠和灵活的文件和磁盘管理解决方案。
WinCatalog 2024.7.5 是一款功能强大的文件和磁盘管理工具,适用于各种个人和商业场景。以下是它的一些主要应用场景:
总之,WinCatalog 2024.7.5 提供了全面的文件和磁盘管理功能,适用于个人用户、专业人士、企业和机构,帮助他们更高效地管理、搜索和保护文件和数据。
*请认真填写需求信息,我们会在24小时内与您取得联系。