css3炫酷动效倾斜翻页效果

ss3炫酷动效倾斜翻页效果

可以自己设置倒计时的数

css:

javascript：

是简易数据分析系列的第 10 篇文章。

原文首发于博客园：简易数据分析 10。

友情提示：这一篇文章的内容较多，信息量比较大，希望大家学习的时候多看几遍。

我们在刷朋友圈刷微博的时候，总会强调一个『刷』字，因为看动态的时候，当把内容拉到屏幕末尾的时候，APP 就会自动加载下一页的数据，从体验上来看，数据会源源不断的加载出来，永远没有尽头。

我们今天就是要讲讲，如何利用 Web Scraper 抓取滚动到底翻页的网页。

今天我们的练手网站是知乎数据分析模块的精华帖，网址为：

https://www.zhihu.com/topic/19559424/top-answers

这次要抓取的内容是精华帖的标题、答题人和赞同数。下面是今天的教程。

1.制作 Sitemap

刚开始我们要先创建一个 container，包含要抓取的三类数据，为了实现滚动到底加载数据的功能，我们把 container 的 Type 选为 Element scroll down，就是滚动到网页底部加载数据的意思。

在这个案例里，选择的元素名字为 div.List-item。

为了复习上一节通过数据编号控制条数的方法，我们在元素名后加个 nth-of-type(-n+100)，暂时只抓取前 100 条数据。

然后我们保存 container 这个节点，并在这个节点下选择要抓取的三个数据类型。

首先是标题，我们取名为 title，选择的元素名为 [itemprop='zhihu:question'] a：

然后是答题人名字 name 与赞同数 like，选择的元素名分别为 #Popover10-toggle a 和 button.VoteButton--up：

2.爬取数据，发现问题

元素都选择好了，我们按 Sitemap zhihu_top_answers -> Scrape -> Start craping 的路径进行数据抓取，等待十几秒结果出来后，内容却让我们傻了眼：

数据呢？我要抓的数据呢？怎么全变成了 null？

在计算机领域里，null 一般表示空值，表示啥都没有，放在 Web Scraper 里，就表示没有抓取到数据。

我们可以回想一下，网页上的的确确存在数据，我们在整个的操作过程中，唯一的变数就是选择元素这个操作上。所以，肯定是我们选择元素时出错了，导致内容匹配上出了问题，无法正常抓取数据。要解决这个问题，我们就要查看一下网页的构成。

3.分析问题

查看一下网页的构成，就要用浏览器的另一个功能了，那就是选择查看元素。

1.我们点击控制面板左上角的箭头，这时候箭头颜色会变蓝。

2.然后我们把鼠标移动到标题上，标题会被一个蓝色的半透明遮罩盖住。

3.我们再点击一下标题，会发现我们会跳转到 Elements 这个子面板，内容是一些花花绿绿看不大懂的代码

做到这里心里别发怵，这些 HTML 代码不涉及什么逻辑，在网页里就是个骨架，提供一些排版的作用。如果你平常用 markdown 写作，就可以把 HTML 理解为功能更复杂的 markdown。

结合 HTML 代码，我们先看看 [itemprop='zhihu:question'] a 这个匹配规则是怎么回事。

首先这是个树形的结构：

先是一个名字为 h2 的标签 <h2>...</h2>，它有个 class='ContentItem-title' 的属性；
里面又有个名为 div 的标签 <div>...</div>，它有个 itemprop='zhihu:question' 的属性；
div 标签里又有一个名字为 a 的标签 <a>...</a>；
a 标签里有一行字，就是我们要抓取的标题：如何快速成为数据分析师？
上句话从可视化的角度分析，其实就是一个嵌套的结构，我把关键内容抽离出来，内容结构是不是清晰了很多？

<h2 class='ContentItem-title'/>
 <div itemprop='zhihu:question'/>
 <a>如何快速成为数据分析师？</a>
 </div>
</h2>

我们再分析一个抓取标题为 null 的标题 HTML 代码。

我们可以很清楚的观察到，在这个标题的代码里，少了名为 div 属性为 itemprop='zhihu:question' 的标签！这样导致我们的匹配规则匹配时找不到对应标签，Web Scraper 就会放弃匹配，认为找不到对应内容，所以就变成 null 了。

找到原因后我们就好解决问题了。

4.解决问题

我们发现，选择标题时，无论标题的嵌套关系怎么变，总有一个标签不变，那就是包裹在最外层的，属性名为 class='ContentItem-title' 的 h2 标签。我们如果能直接选择 h2 标签，不就可以完美匹配标题内容了吗？

逻辑上理清了关系，我们如何用 Web Scraper 操作？这时我们就可以用上一篇文章介绍的内容，利用键盘 P 键选择元素的父节点：

放在今天的课程里，我们点击两次 P 键，就可以匹配到标题的父标签 h2 （或 h2.ContentItem-title）：

以此类推，因为答题人名字也出现了 null，我们分析了 HTML 结构后选择名字的父标签 span.AuthorInfo-name，具体的分析操作和上面差不多，大家可以尝试一下。

我的三个子内容的选择器如下，可以作为一个参考：

最后我们点击 Scrape 爬取数据，检查一下结果，没有出现 null，完美！

5.吐槽时间

爬取知乎数据时，我们会发现滚动加载数据那一块儿很快就做完了，在元素匹配那里却花了很多时间。

这间接的说明，知乎这个网站从代码角度上分析，写的还是比较烂的。

如果你爬取的网站多了，就会发现大部分的网页结构都是比较「随心所欲」的。所以在正式抓取数据前，经常要先做小规模的尝试，比如说先抓取 20 条，看看数据有没有问题。没问题后再加大规模正式抓取，这样做一定程度上可以减少返工时间。

6.下期预告

这期内容比较多，大家可以多看几遍消化一下，下期我们说些简单的内容，讲讲如何抓取表格内容。

7.推荐阅读

简易数据分析 09 | Web Scraper 自动控制抓取数量 & Web Scraper 父子选择器

简易数据分析 08 | Web Scraper 翻页——点击「更多按钮」翻页

019年的你还认为HTML5只是平时在朋友圈刷到的H5链接吗？要知道HTML5可以做的事情远不止如此！

HTML5不仅拥有强大的应用功能和广泛的使用范围，而且它的学习门槛也比Java、C++、Javascript等语言低很多，可以说是非常适合作为零基础小白打开IT世界大门的第一把钥匙！

接下来，小编就和大家一起来了解一下，到底什么是HTML5？它究竟好在哪？

HTML5是什么

从技术层面来说，HTML5就是HTML5+CSS3+JS的合集。HTML5用于实现我们能够看到的所有网站，是包含一定特效的移动端营销网页，简单概括，就是用代码实现一张由设计师设计好的网页图片。HTML5做出的作品也会被称为场景应用，有些作品与移动端PPT类似。经常能见到的形式就是滑动翻页。

HTML5的基本组成

HTML5=HTML+CSS+JavaScript

HTML指的是结构，使整个网页中有标题，有列表，有图片等。

CSS指样式，也就是标题文字的字体大小、颜色、字体；图片的大小；某个块的背景色或背景图等

JS即JavaScript，指的是行为，例如在网页上四处飘动的广告；图片滚动；浏览淘宝时鼠标移动到商品时，放大商品的效果等。

如果说HTML是人体的骨架，CSS就好比人体的血肉架，JavaScript就好比人的各类动作，这些合在一起基本就是前端工程师的基本要求了。

HTML5未来发展前景

HTML5作为移动互联网的行业新贵，它的快速发展撼动着Android和iOS在应用层面的地位。

由于HTML5的富媒体化与富应用化，目前还没有一门前端的开发语言能取代HTML5的主流开发地位，无论做PC端网站还是App应用，前端样式均由HTML5开发，毫无疑问，未来几年，HTML5依然会是Web应用的最佳解决方案，就业前景十分广阔。

HTML5就业薪资水平

目前，北京、上海、广州、深圳等地Web前端工程师的平均薪资已经上涨至13万元左右，可见，市场对于HTML5开发人才需求正在不断增加。据国内权威数据统计，未来五年，我国信息化人才总需求量高达1500万—2000万人。其中“网络工程”“UI设计”“Web前端”等人才的缺口最为突出。

说到HTML5前端的薪资之高，不得不提的就是，九月刚刚到来，我们便收到了振奋人心的好消息！云和数据HTML5全栈精英班的毕业学员由又双叒叕送来了喜报！

云和数据的HTML5全栈精英班，由拥有多年企业真实开发经验的大咖实战授课，实行真实企业项目制分组现场教学，学员可以全程参与实际项目的真实开发，积累丰富的项目经验。来云和数据学HTML5，下一个月薪万元的就是你！

在线咨询

上一篇：jQuery UI 主题
下一篇：Bootstrap轮播图解析全过程

您的项目需求

*请认真填写需求信息，我们会在24小时内与您取得联系。

整合营销服务商