为开发人员,我们依赖于静态分析工具来检查、lint(分析)和转换我们的代码。我们使用这些工具来帮助我们提高生产效率并生成更好的代码。然而,当我们使用markdown编写内容时,可用的工具就很少。
在本文中,我们将介绍如何开发一个Markdown扩展来解决在使用Markdown管理Django站点中的内容时遇到的挑战。
你认为他们有linter吗?
照片来自Pexels,由mali maeder拍摄
像每个网站一样,我们在主页、FAQ部分和“关于”页面等地方都有不同类型的(大部分)静态内容。很长一段时间以来,我们都是在Django模板中直接管理这些内容的。
当我们最终决定是时候将这些内容从模板转移到数据库中时,我们认为最好使用Markdown。从Markdown生成HTML更安全,它提供了一定程度的控制和一致性,并且对于非技术用户来说更容易处理。随着我们转移过程的进展,我们注意到我们遗漏了一些东西:
当URL更改时,链接到内部页面的链接可能会中断。在Django模板和视图中,我们使用了reverseand {% url %},但是这在普通的Markdown中是不可用的。
绝对内部连接不能在不同环境之间进行复制。这可以使用相对链接来解决,不过目前没有开箱即用的增强这一点的方法。
无效链接会损害用户体验,并导致用户质疑整个内容的可靠性。这并不是Markdown独有的东西,只不过HTML模板是由对URL有一定了解的开发人员维护的。另一方面,Markdown文档是为非技术写作人员设计的。
当我研究这个问题时,我搜索了Python linters、Markdown预处理器和扩展来帮助生成更好的Markdown。结果都不是很好。一个引人注目的方法是使用Django模板来生成Markdown文档。
使用Django模板,你可以使用诸如url之类的模板标记来反向查询URL名称,并配合使用条件、变量、日期格式和所有其他Django模板特性。这种方法本质上是使用Django模板作为Markdown文档的预处理程序。
我个人认为这可能不是非技术作家的最佳解决方案。另外,我担心提供对Django模板标记的访问可能是危险的。
对这个问题有了更好的理解之后,我们准备在Python中更深入地研究Markdown。
要在Python中开始使用Markdown,我们先安装markdown包:
接着,创建一个Markdown对象并使用其函数将一些Markdown转换成HTML:
你现在可以在你的模板中使用这个HTML代码片段。
基本的Markdown处理器提供了生成HTML内容的基本要素。对于更“新奇”的选项,Python markdown包包含了一些内置扩展。一个流行的扩展是“extra”扩展,除了其他东西之外,它增加了对隔离代码块的支持:
为了使用我们独特的Django功能扩展Markdown,我们将开发自己的扩展。
如果你查看源代码,你将看到要将markdown转换为HTML, Markdown会使用多种不同的处理器。一种类型的处理器是内联处理器。内联处理器会匹配特定的内联模式,如链接、反引号、粗体文本和带下划线的文本,并将它们转换为HTML。
我们的Markdown扩展的主要目的是验证和转换链接。因此,我们最感兴趣的内联处理器是LinkInlineProcessor。这个处理器以[Haki的网站](https://hakibenito.com)的形式获取markdown ,解析它并返回一个包含链接和文本的元组。
为了扩展该功能,我们扩展了LinkInlineProcessor并创建了一个Markdown.Extension, 我们用它来处理链接:
我们来将这段代码分解一下::
DjangoUrlExtension扩展注册了一个名为DjangoLinkInlineProcessor的内联链接处理器。这个处理器将取代任何其他现有的链接处理器。
内联处理器DjangoLinkInlineProcessor扩展了内置的LinkInlineProcessor,并在它处理的每个链接上调用clean_link函数。
clean_link函数接收一个链接和一个域名,并返回一个转换后的链接。这就是我们要插入我们的实现的地方。
如何获得网站域名
要识别到你自己网站的链接,你必须知道你的网站的域名。如果你正在使用Django的sites框架,那么你可以使用它来获取当前域名。
我没有把它包含在我的实现中,因为我们没有使用sites框架。相反,我们在Django设置中设置了一个变量。
获取当前域名的另一种方法是使用HttpRequest对象。如果内容只在你自己的站点中被编辑,你可以尝试从请求对象中插入站点域名。这可能需要对你的实现进行一些更改。
要使用该扩展,请在初始化一个新的Markdown实例时添加它:
太好了,这个扩展已经被使用了,我们准备进入有趣的部分了!
既然我们得到了在所有链接上调用clean_link的扩展,那我们可以来实现我们的验证和转换逻辑。
要开始工作,我们将从一个简单的验证开始。mailto链接对于使用预定义的收件人地址、主题甚至消息正文打开用户的电子邮件客户端非常有用。
一个常见的mailto链接是这样的:
这个链接将打开你的电子邮件客户端,并设置成撰写一封主题行为“我需要帮助!”的新电子邮件给“support@service.com”。
mailto链接不一定非要包含电子邮件地址。如果你看一看这篇文章底部的“分享”按钮,你会发现像这样的一个mailto链接:
这个mailto链接没有包含收件人,仅包含了主题行和消息正文。
既然我们已经很好地理解了mailto链接是什么样子的,我们就可以向clean_link函数添加第一个验证:
为了验证mailto链接,我们向clean_link中添加了以下代码:
检查链接是否以mailto:开头,以识别相关链接。
使用正则表达式将链接分割到它的组件。
从mailto链接中删除实际的电子邮件地址,并使用Django的EmailValidator验证它。
注意,我们还添加了一种名为InvalidMarkdown的新异常类型。我们定义了自己的自定义异常类型,以将它与markdown本身所引发的其他错误区分开来。
自定义错误类
我曾经写过关于自定义错误类的文章,为什么它们是有用的,以及你什么时候应该使用它们。
在我们继续之前,让我们添加一些测试,看看它的实际效果:
太棒了!按预期的运行了。
既然我们已经了解了mailto链接,我们也可以处理其他类型的链接:
外部链接
我们的Django应用程序外部的链接。
必须包含一个页面跳转协议(scheme):http或https。
理想情况下,我们还希望确保这些链接没有被破坏,但我们现在不会这样做。
内部链接
到我们的Django应用程序中的页面的链接。
链接必须是相对的:这将允许我们在不同环境之间移动内容。
使用Django的URL名称而不是一个URL路径:这将允许我们安全地来回移动视图,而不必担心markdown内容中的失效链接。
链接可能包含查询参数(?)和片段(#)。
SEO
从SEO的角度来看,公共URL不应该改变。当他们这样做的时候,你应该使用重定向正确地处理它,否则你可能会受到搜索引擎的惩罚。
有了这个需求列表,我们就可以开始工作了。
解析URL名称
要链接到内部页面,我们希望编写者提供一个URL名称,而不是URL路径。例如,假设我们有这个视图:
这个页面的URL路径是https://example.com/, URL名称是home。我们想要在我们的markdown链接中使用这个URL名称home,就像这样:
这将渲染到:
我们还想支持查询参数和散列:
这将渲染到以下HTML:
在使用URL名称时,如果我们更改了URL路径,内容中的链接将不会被破坏。要检查作者提供的href是否是一个有效的url_name,我们可以尝试reverse它:
URL名称“home”指向URL路径“/”。当没有匹配项时,将会引发一个异常:
在我们继续之前,当URL名称包含查询参数或散列时,会发生什么:
这是有意义的,因为查询参数和散列不是URL名称的一部分。
要使用reverse并支持查询参数和散列,我们首先需要清除值。然后,检查它是一个有效的URL名称,并返回包含查询参数和散列的URL路径,如果提供了的话:
这个代码段使用一个正则表达式来以?或#的出现对href进行分割,并返回各部分。
请确保它可以工作:
太了不起了!作者们现在可以在Markdown中使用URL名称了。它们还可以包括要添加到该URL的查询参数和片段。
处理外部链接
要正确处理外部链接,我们需要检查两件事:
1.外部链接总是提供一个跳转协议,http:或者https:。
2.阻止到我们自己网站的绝对链接。内部链接应该使用URL名称。
到目前为止,我们已经处理了URL名称和mailto链接。如果我们通过了这两个检查,这意味着href是一个URL。让我们从检查链接是否是链接到我们自己的网站开始:
函数urlparse会返回一个命名元组,该元组包含URL的不同部分。如果netloc属性等于site_domain,那么该链接就确实是一个内部链接。
如果URL实际上是内部的,我们就需要终止。但是,请记住,作者们不一定是技术人员,因此我们希望帮助他们,并提供一个有用的错误消息。我们要求该内部链接使用URL名称而不是URL路径,所以最好让作者们知道他们提供的路径的URL名称。
要获得一个URL路径的URL名称,Django为我们提供了一个名为resolve的函数:
当找到匹配项时,resolve会返回一个ResolverMatch对象,其中包含URL名称和其他信息。当没有找到匹配项时,它就会引发一个错误:
这实际上就是Django在底层所做的工作,用来确定在一个新请求到来时执行哪个视图函数。
为了给作者们提供更好的错误信息,我们可以使用来自ResolverMatch对象的URL名称:
当我们识别出内部链接时,我们要处理两种情况:
我们没有识别出这个URL:这个URL很可能是不正确的。请作者检查该URL是否有错误。
我们识别出了这个URL: 这个URL是正确的,所以就告诉作者应该使用什么URL名称。
我们来实际地看一下它:
漂亮!外部链接被接受,内部链接被拒绝,并带有一个有用的消息。
要求跳转协议
我们要做的最后一件事是确保外部链接包含一个跳转协议,要么是http:,要么是https:。让我们将这最后一部分添加到函数clean_link:
使用解析后的URL,我们可以很容易地检查跳转协议。让我们确保它正在工作:
我们向这个函数提供了一个没有跳转协议的链接,但是它运行失败了,并显示了一条有用的消息。太酷了!
这是clean_link函数的全部代码:
要了解所有这些特性的一个实际用例是什么样子的,请看下面的内容:
这将产生以下HTML:
不错!
我们现在有一个很不错的扩展,它可以验证和转换Markdown文档中的链接!现在,在不同环境之间移动文档和保持内容整洁要容易多了,最重要的是,可以保持正确和最新!
源码
你可以在这个gist中找到全部源代码。(地址:https://gist.github.com/hakib/73fccc340e855bb65f42197e298c0c7d )
本文中所描述的功能对我们很有用,但是你可能需要根据自己的需求对它进行调整。
如果你需要一些想法,那么除了这个扩展之外,我们还创建了一个markdown Preprocessor,它允许作者们在markdown中使用常量。例如,我们定义了一个名为SUPPORT_EMAIL的常量,我们像这样使用它:
该预处理程序将用我们定义的文本替换字符串$SUPPORT_EMAIL,然后才渲染Markdown。
英文原文:https://hakibenita.com/django-markdown
译者:Nothing
长文创作激励计划#
模板不仅仅是静态的HTML,在渲染的过程中经常包含着一部分变量。在Django中,通过一个类似字典的对象context,把所有模板中需要用到的变量从view传递到template。比如搜索结果列表和推荐列表显示样式和显示信息都一样,此种情况下,若模板根据不同变量显示不同数据的方式进行页面的渲染,则需要创建不同的模板进行显示,会做很多重复性的工作,并造成代码的冗余和结构的繁杂。在模板中使用变量的便利远不止此,例如还可以根据传递变量类型或者值得不同显示不同的样式和信息。
[!TIP]
与其它语言不同的是,在Django中,view中的变量不会自动在template中可用,必须通过view准确传递到template中,这样设计的目的是为了避免破坏模板的命名空间。
和其它语言PHP、Vue中的用法一样,Django的模板中的变量也是通过{{ }}进行表示,例如显示变量name:{{ name }}。即使变量中包含一些特殊字符(如:<),也不需要担心会影响显示结果,因为Django的也会自动避免将其以HTML的形式进行显示。
[!NOTE]
如果在模板中用到了没有传递的变量,Django只会在相应位置不做任何显示,而不会抛出异常。
示例:
1、以my_site项目为例,在Django应用myapp中创建templates文件夹,并在文件夹内创建welcome.html文件,其结构和内容如下:
示例结构
2、修改views.py文件,在其中添加welcome方法,其内容如下:
from django.http import HttpResponse
from django.shortcuts import render
# Create your views here.
def welcome(request):
name="World"
return render(request, "welcome.html" ,{"name":name})
3、在myapp中的urls.py进行配置,其内容如下:
from django.contrib import admin
from django.urls import path
from .views import welcome
urlpatterns = [
path('welcome/', welcome, name="welcome"),
]
4、修改my_site项目的urls.py文件,引用myapp中的urls.py,其内容如下:
from django.contrib import admin
from django.urls import path, include
urlpatterns = [
path('admin/', admin.site.urls),
path("", include("myapp.urls")),
]
5、通过python manage.py runserver命令运行项目,其显示如下:
示例效果图
该文章作为学习笔记进行分享和记录,如有错误或其它观点,请多多指教!!!
web开发中,经常需要显示展示层次化的数据,比如文件目录、产品分类目录、组织结构等,这是典型的树形数据结构。Django是web开发中使用非常广泛的框架,那么你知道怎么使用Django模块渲染树形数据结构吗?本文将会给出答案。
我们知道编程语言大多都有递归调用的能力,遍历树形数据结构往往都需要进行递归调用,而Django使用模板引擎进行页面的渲染,而树形结构数据往往都是从数据库动态获取的,嵌套的层级深度并不是确定的,因此Django模板必须能够做到类似递归调用的能力才能做到渲染树形数据结构。幸运地的是,Django模板引擎是支持递归引用的,接下来我们通过一个简单的例子来详细介绍Django模板如何通过include指令递归引用模块文件,最终渲染出树形目录结构。这里不会从头介绍Django如何创建项目,只针对关键文件进行讲解,因此需要读者具备一定的Django基础。
一般情况下,树形结构数据都是从数据库动态生成的,为了突出重点,这里仅给出最终的树形数据结构示例。我们把它写在views.py文件中,tree_list为树形数据,列表中的每一项包含id、name、parent_id、children,其中children为子节点,包含同样的结构,可以一直嵌套下去。
from django.shortcuts import render
# Create your views here.
def index(request):
"""
tree_list数据结构形式:[
{
"id": xx,
"name": xxx,
"parent_id": xxx,
"children": [
{
"id": xx,
"name": xxx,
"parent_id": xxx,
"children": []
}
]
},
...
]
"""
context = {}
context["tree_list"] = [{
"id": 2,
"name": "类别A",
"parentId": None,
"children": [
{
"id": 8,
"name": "类别A1",
"parentId": 2,
"children": [
{
"id": 137,
"name": "类别A11",
"parentId": 8,
}
]
},
{
"id": 221,
"name": "类别A2",
"parentId": 2,
}
]
},
{
"id": 52,
"name": "类别B",
"parentId": None,
"children": [
{
"id": 54,
"name": "类别B1",
"parentId": 52,
"fileCount": 10,
"children": [
{
"id": 55,
"name": "类别B11",
"parentId": 54,
"children": [
{
"id": 56,
"name": "类别B111",
"parentId": 55,
"children": [
{
"id": 57,
"name": "类别B1111",
"parentId": 56,
"children": [
{
"id": 58,
"name": "类别B11111",
"parentId": 57,
}
]
}
]
}
]
}
]
}
]
},
{
"id": 53,
"name": "类别C",
"parentId": None,
"children": [
{
"id": 80,
"name": "类别C1",
"parentId": 53,
},
{
"id": 224,
"name": "类别C2",
"parentId": 53,
}
]
},
{
"id": 69,
"name": "类别D",
"parentId": None,
"children": [
{
"id": 70,
"name": "类别D1",
"parentId": 69,
"children": [
{
"id": 4,
"name": "类别D11",
"parentId": 70,
"children": [
{
"id": 51,
"name": "类别D111",
"parentId": 4,
}
]
}
]
},
{
"id": 91,
"name": "类别D2",
"parentId": 69,
},
{
"id": 102,
"name": "类别D3",
"parentId": 69,
},
{
"id": 113,
"name": "类别D4",
"parentId": 69,
},
{
"id": 121,
"name": "类别D5",
"parentId": 69,
},
{
"id": 136,
"name": "类别D6",
"parentId": 69,
},
{
"id": 140,
"name": "类别D7",
"parentId": 69,
"children": [
{
"id": 142,
"name": "类别D71",
"parentId": 140,
}
]
}
]
}
]
return render(request, 'demo/index.html', context)
templates/demo目录下创建两个模板文件index.html、children.html,index.html文件中关键部分的代码为for循环指令包围的部分,它负责遍历上面提到的tree_list列表的每一项,也就是数据结构的第一级目录,如果列表中的某一项children内容不为空,则执行指令{% include 'demo/children.html' with tree_list=item.children %},它的意思就相当于render(request, 'demo/children.html', item.children),也就是说插入当前项的子节点作为数据源渲染出的页面。
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>django模板</title>
<style>
.flex {
display: flex;
}
.list-unstyled ul {
padding-left: 0;
list-style: none;
}
.tree {
padding: 0.3rem 1rem ;
background-color: #f5f5f5;
color: #333;
}
.tree li li {
padding-left: 0.5rem;
}
.tree li::before {
content: '\0203A';
opacity: 0;
}
.tree .expand::before {
content: '\0203A';
opacity: 1;
}
</style>
</head>
<body>
<h3>Django模板渲染树形目录示例</h3>
<div class="flex">
<div class="tree list-unstyled">
<ul>
{% for item in tree_list %}
{% if item.children %}
<li class="expand">
{{ item.name }}
{% include 'demo/children.html' with tree_list=item.children %}
</li>
{% else %}
<li>
{{ item.name }}
</li>
{% endif %}
{% endfor %}
</ul>
</div>
<div class="right"></div>
</div>
</body>
</html>
接下来看children.html,它看起来和前面是很类似的,只不过这里include指令中使用的模板就是自己本身,传入的数据源逐层剥离出子节点,这就是和编程语言的递归是一样的了,最终所有children节点都完全遍历到并渲染出最终的html页面,这样就实现了渲染树形结构数据。
<ul>
{% for item in tree_list %}
{% if item.children %}
<li class="expand">
{{ item.name }}
{% include 'demo/children.html' with tree_list=item.children %}
</li>
{% else %}
<li>
{{ item.name }}
</li>
{% endif %}
{% endfor %}
</ul>
最后渲染出的树形目录如下, index.html中写了一点css改变了默认的样式,你可以根据自己的需要使用成熟的UI框架来定制树形目录的样式。本文到这里就结束了,希望能帮助到有需要的朋友,也欢迎大家多多关注我的公众号【一点鑫得】,我将持续输出有价值的内容。
*请认真填写需求信息,我们会在24小时内与您取得联系。