整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:

通过python爬虫下载电影的网址和电影标题信息到excel表格中

代码演示去电影网址上抓取电影网址和电影名称的数据,并保存到本机到excel表格中

操作步骤如下:

一、去百度上搜索查询要爬去的电影网址:

搜索到的电影网址为:http://dianying.2345.com/list/guzhuang------.html,即我们今天要通过python进行get请求的网址

二、开始测试爬取网址:

1、在360极速浏览器输入网址:http://dianying.2345.com/list/guzhuang------.html。

2、按F12查看网址的源代码。

3、按住F5加载网页源代码。

4、找到左下角的Network,点击↖箭头,选择对应的电影,如下图所示:

相当于已经得出了如下结论:

所有的电影网址,标题信息都在<em class="emTit">标签里。

三、去pycharm里编写源代码

1、同时按alt+insert键,新建一个使用find_all匹配电影信息.py的文件。

2、根据以下3个步骤开始编写爬取网页源代码的代码:

①导入相应的库

②定义函数对网页进行get请求,并解析网址,并保存数据到excel中

③调用函数

代码示例如下:

#1、导入相应的库
import re,requests,random,os #导入正则,网页请求,随机,系统库
from bs4 import BeautifulSoup #从bs4中导入网页源代码解析库
import pandas as pd #导入pandas库,并设置为pd
#2、定义函数对网页进行get请求
def gethtml():
 url="http://dianying.2345.com/list/guzhuang------.html"
 agent1 = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.70 Safari/537.36"} # 设定请求头的值agent1
 agent2 = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36"} # 设定请求头的值agent2
 agent3 = {"User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.62 Safari/537.36"} # 设定请求头的值agent3
 list1 = [agent1, agent2, agent3] # 设置3个请求头组成的列表,并赋值给列表list1
 agent = random.choice(list1) # 请求头的值agent从列表list1里随机选择一个
 try:
 response = requests.get(url, headers=agent) # 伪装浏览器对网站进行get请求,并将请求结果赋值给response
 response.encoding = response.apparent_encoding # 根据内容解析出网页的编码格式并赋值给response.encoding
 html = response.text # 将网页的源代码赋值给html
 soup=BeautifulSoup(html,"html.parser") #使用html.parser解析器对网页源代码进行解析,并将解析结果赋值给soup
 info = soup.find_all("em",attrs={"class":"emTit"}) #查找所有的当参数class属性值为emTit时的em标签,并将所有的查找结果赋值给info
 #发现所有电影信息都在<em class="emTit"><a title="黄飞鸿1壮志凌云" target="_blank" href="//dianying.2345.com/detail/59747.html" data-ajax83="ys_dy_list_title_59747">黄飞鸿1:壮志凌云</a></em>标签里,
 #故对上述标签信息进行正则匹配
 print(info)
 list1=[] #设置列表list1为空列表,用来接收电影的网址信息
 list2=[] #设置列表list2为空列表,用来接收电影的标题信息
 for movieinfo in info: #在info里遍历所有的电影信息movieinfo
 print(movieinfo) #打印所有的电影信息
 list1.append("http:"+movieinfo.a.get("href")) #将遍历出来的a标签的href属性值前加上http作为一个完整的网址添加到列表list1
 list2.append(movieinfo.a.string) #将遍历出来的a标签的值添加到列表list2
 print("list1:",list1) #打印列表list1
 print("list2:",list2) #打印列表list2
 dict1={"序号":range(1,len(list1)+1),"网址":list1,"电影标题":list2}
 # 上面这行代码设置dict1字典,字典的三个键分别是序号,网址,电影标题,对应的是存储在excel表格里的三个表头,即3个列标名称,字典的三个值分别是序号值,电影网址,电影标题名称
 df=pd.DataFrame(dict1) #将dict1的数据保存为表格,并赋值给df变量
 df.to_excel("E:\IT\PYthon\电影数据.xlsx") #将df的数据保存到E:\IT\PYthon\电影数据.xlsx的excel文件中,若没有这个文件,则自动新建这个文件并保存数据
 except: #假如接收到错误反馈信息时
 print("爬取失败") #打印爬取失败的提示
#3、调用爬取数据的函数
if __name__ == '__main__':
 gethtml() #调用gethtml函数

在pycharm同时按住ctrl+shift+F10运行代码,代码运行结果如下:

[<em class="emTit"><a data-ajax83="ys_dy_list_title_148874" href="//dianying.2345.com/detail/148874.html" target="_blank" title="王朝的女人杨贵妃">王朝的女人・杨贵妃</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_35077" href="//dianying.2345.com/detail/35077.html" target="_blank" title="龙门飞甲">龙门飞甲</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_201821" href="//dianying.2345.com/detail/201821.html" target="_blank" title="开封降魔记">开封降魔记</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_59747" href="//dianying.2345.com/detail/59747.html" target="_blank" title="黄飞鸿1壮志凌云">黄飞鸿1:壮志凌云</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_199282" href="//dianying.2345.com/detail/199282.html" target="_blank" title="神谕通天">神谕通天</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_39273" href="//dianying.2345.com/detail/39273.html" target="_blank" title="笑傲江湖3东方不败风云再起">笑傲江湖3:东方不败…</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_202433" href="//dianying.2345.com/detail/202433.html" target="_blank" title="封魔传">封魔传</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_30550" href="//dianying.2345.com/detail/30550.html" target="_blank" title="恶虎村">恶虎村</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_190993" href="//dianying.2345.com/detail/190993.html" target="_blank" title="少林与武当">少林与武当</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_19317" href="//dianying.2345.com/detail/19317.html" target="_blank" title="镖行天下前传之决战天涯">镖行天下前传之决战…</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_198268" href="//dianying.2345.com/detail/198268.html" target="_blank" title="大唐狐妖传">大唐狐妖传</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_164786" href="//dianying.2345.com/detail/164786.html" target="_blank" title="轩辕大帝">轩辕大帝</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_141359" href="//dianying.2345.com/detail/141359.html" target="_blank" title="白幽灵传奇之绝命逃亡">白幽灵传奇之绝命逃…</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_21034" href="//dianying.2345.com/detail/21034.html" target="_blank" title="火烧圆明园">火烧圆明园</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_190410" href="//dianying.2345.com/detail/190410.html" target="_blank" title="埋伏1973">埋伏(1973)</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_120632" href="//dianying.2345.com/detail/120632.html" target="_blank" title="绣春刀">绣春刀</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_84172" href="//dianying.2345.com/detail/84172.html" target="_blank" title="止杀令">止杀令</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_21898" href="//dianying.2345.com/detail/21898.html" target="_blank" title="黄飞鸿6西域雄狮">黄飞鸿6:西域雄狮</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_200132" href="//dianying.2345.com/detail/200132.html" target="_blank" title="龙族的反击">龙族的反击</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_197808" href="//dianying.2345.com/detail/197808.html" target="_blank" title="白夜侠">白夜侠</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_323" href="//dianying.2345.com/detail/323.html" target="_blank" title="倚天屠龙记之魔教教主">倚天屠龙记之魔教教…</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_116829" href="//dianying.2345.com/detail/116829.html" target="_blank" title="天将雄师">天将雄师</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_50331" href="//dianying.2345.com/detail/50331.html" target="_blank" title="大罗剑侠">大罗剑侠</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_36044" href="//dianying.2345.com/detail/36044.html" target="_blank" title="杨门女将之军令如山">杨门女将之军令如山…</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_165827" href="//dianying.2345.com/detail/165827.html" target="_blank" title="奇侠">奇侠</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_202024" href="//dianying.2345.com/detail/202024.html" target="_blank" title="等到烟暖雨收">等到烟暖雨收</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_31845" href="//dianying.2345.com/detail/31845.html" target="_blank" title="古墓荒斋">古墓荒斋</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_50332" href="//dianying.2345.com/detail/50332.html" target="_blank" title="黑灵官">黑灵官</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_200206" href="//dianying.2345.com/detail/200206.html" target="_blank" title="铁锅传奇">铁锅传奇</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_65349" href="//dianying.2345.com/detail/65349.html" target="_blank" title="花漾">花漾</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_30492" href="//dianying.2345.com/detail/30492.html" target="_blank" title="鹰王">鹰王</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_198270" href="//dianying.2345.com/detail/198270.html" target="_blank" title="皇上命我来选妃">皇上命我来选妃</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_19263" href="//dianying.2345.com/detail/19263.html" target="_blank" title="镖行天下前传之终极任务">镖行天下前传之终极…</a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_165826" href="//dianying.2345.com/detail/165826.html" target="_blank" title="绣春刀修罗战场">绣春刀・修罗战场 </a></em>, <em class="emTit"><a data-ajax83="ys_dy_list_title_196850" href="//dianying.2345.com/detail/196850.html" target="_blank" title="维京王者之战">维京:王者之战</a></em>]

<em class="emTit"><a data-ajax83="ys_dy_list_title_148874" href="//dianying.2345.com/detail/148874.html" target="_blank" title="王朝的女人杨贵妃">王朝的女人・杨贵妃</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_35077" href="//dianying.2345.com/detail/35077.html" target="_blank" title="龙门飞甲">龙门飞甲</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_201821" href="//dianying.2345.com/detail/201821.html" target="_blank" title="开封降魔记">开封降魔记</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_59747" href="//dianying.2345.com/detail/59747.html" target="_blank" title="黄飞鸿1壮志凌云">黄飞鸿1:壮志凌云</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_199282" href="//dianying.2345.com/detail/199282.html" target="_blank" title="神谕通天">神谕通天</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_39273" href="//dianying.2345.com/detail/39273.html" target="_blank" title="笑傲江湖3东方不败风云再起">笑傲江湖3:东方不败…</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_202433" href="//dianying.2345.com/detail/202433.html" target="_blank" title="封魔传">封魔传</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_30550" href="//dianying.2345.com/detail/30550.html" target="_blank" title="恶虎村">恶虎村</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_190993" href="//dianying.2345.com/detail/190993.html" target="_blank" title="少林与武当">少林与武当</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_19317" href="//dianying.2345.com/detail/19317.html" target="_blank" title="镖行天下前传之决战天涯">镖行天下前传之决战…</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_198268" href="//dianying.2345.com/detail/198268.html" target="_blank" title="大唐狐妖传">大唐狐妖传</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_164786" href="//dianying.2345.com/detail/164786.html" target="_blank" title="轩辕大帝">轩辕大帝</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_141359" href="//dianying.2345.com/detail/141359.html" target="_blank" title="白幽灵传奇之绝命逃亡">白幽灵传奇之绝命逃…</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_21034" href="//dianying.2345.com/detail/21034.html" target="_blank" title="火烧圆明园">火烧圆明园</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_190410" href="//dianying.2345.com/detail/190410.html" target="_blank" title="埋伏1973">埋伏(1973)</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_120632" href="//dianying.2345.com/detail/120632.html" target="_blank" title="绣春刀">绣春刀</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_84172" href="//dianying.2345.com/detail/84172.html" target="_blank" title="止杀令">止杀令</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_21898" href="//dianying.2345.com/detail/21898.html" target="_blank" title="黄飞鸿6西域雄狮">黄飞鸿6:西域雄狮</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_200132" href="//dianying.2345.com/detail/200132.html" target="_blank" title="龙族的反击">龙族的反击</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_197808" href="//dianying.2345.com/detail/197808.html" target="_blank" title="白夜侠">白夜侠</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_323" href="//dianying.2345.com/detail/323.html" target="_blank" title="倚天屠龙记之魔教教主">倚天屠龙记之魔教教…</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_116829" href="//dianying.2345.com/detail/116829.html" target="_blank" title="天将雄师">天将雄师</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_50331" href="//dianying.2345.com/detail/50331.html" target="_blank" title="大罗剑侠">大罗剑侠</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_36044" href="//dianying.2345.com/detail/36044.html" target="_blank" title="杨门女将之军令如山">杨门女将之军令如山…</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_165827" href="//dianying.2345.com/detail/165827.html" target="_blank" title="奇侠">奇侠</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_202024" href="//dianying.2345.com/detail/202024.html" target="_blank" title="等到烟暖雨收">等到烟暖雨收</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_31845" href="//dianying.2345.com/detail/31845.html" target="_blank" title="古墓荒斋">古墓荒斋</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_50332" href="//dianying.2345.com/detail/50332.html" target="_blank" title="黑灵官">黑灵官</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_200206" href="//dianying.2345.com/detail/200206.html" target="_blank" title="铁锅传奇">铁锅传奇</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_65349" href="//dianying.2345.com/detail/65349.html" target="_blank" title="花漾">花漾</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_30492" href="//dianying.2345.com/detail/30492.html" target="_blank" title="鹰王">鹰王</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_198270" href="//dianying.2345.com/detail/198270.html" target="_blank" title="皇上命我来选妃">皇上命我来选妃</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_19263" href="//dianying.2345.com/detail/19263.html" target="_blank" title="镖行天下前传之终极任务">镖行天下前传之终极…</a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_165826" href="//dianying.2345.com/detail/165826.html" target="_blank" title="绣春刀修罗战场">绣春刀・修罗战场 </a></em>

<em class="emTit"><a data-ajax83="ys_dy_list_title_196850" href="//dianying.2345.com/detail/196850.html" target="_blank" title="维京王者之战">维京:王者之战</a></em>

list1: ['http://dianying.2345.com/detail/148874.html', 'http://dianying.2345.com/detail/35077.html', 'http://dianying.2345.com/detail/201821.html', 'http://dianying.2345.com/detail/59747.html', 'http://dianying.2345.com/detail/199282.html', 'http://dianying.2345.com/detail/39273.html', 'http://dianying.2345.com/detail/202433.html', 'http://dianying.2345.com/detail/30550.html', 'http://dianying.2345.com/detail/190993.html', 'http://dianying.2345.com/detail/19317.html', 'http://dianying.2345.com/detail/198268.html', 'http://dianying.2345.com/detail/164786.html', 'http://dianying.2345.com/detail/141359.html', 'http://dianying.2345.com/detail/21034.html', 'http://dianying.2345.com/detail/190410.html', 'http://dianying.2345.com/detail/120632.html', 'http://dianying.2345.com/detail/84172.html', 'http://dianying.2345.com/detail/21898.html', 'http://dianying.2345.com/detail/200132.html', 'http://dianying.2345.com/detail/197808.html', 'http://dianying.2345.com/detail/323.html', 'http://dianying.2345.com/detail/116829.html', 'http://dianying.2345.com/detail/50331.html', 'http://dianying.2345.com/detail/36044.html', 'http://dianying.2345.com/detail/165827.html', 'http://dianying.2345.com/detail/202024.html', 'http://dianying.2345.com/detail/31845.html', 'http://dianying.2345.com/detail/50332.html', 'http://dianying.2345.com/detail/200206.html', 'http://dianying.2345.com/detail/65349.html', 'http://dianying.2345.com/detail/30492.html', 'http://dianying.2345.com/detail/198270.html', 'http://dianying.2345.com/detail/19263.html', 'http://dianying.2345.com/detail/165826.html', 'http://dianying.2345.com/detail/196850.html']

list2: ['王朝的女人・杨贵妃', '龙门飞甲', '开封降魔记', '黄飞鸿1:壮志凌云', '神谕通天', '笑傲江湖3:东方不败…', '封魔传', '恶虎村', '少林与武当', '镖行天下前传之决战…', '大唐狐妖传', '轩辕大帝', '白幽灵传奇之绝命逃…', '火烧圆明园', '埋伏(1973)', '绣春刀', '止杀令', '黄飞鸿6:西域雄狮', '龙族的反击', '白夜侠', '倚天屠龙记之魔教教…', '天将雄师', '大罗剑侠', '杨门女将之军令如山…', '奇侠', '等到烟暖雨收', '古墓荒斋', '黑灵官', '铁锅传奇', '花漾', '鹰王', '皇上命我来选妃', '镖行天下前传之终极…', '绣春刀・修罗战场 ', '维京:王者之战']

pycharm代码图片示例如下:

pycharm代码图

检查网址的电影信息图片

检查网址的电影信息图片

保存到本机的EXCEL表格图片

码如下:

#本代码是爬取豆瓣电影排行榜数据
#1、导入相应的库
import requests #导入爬虫的requests库
from bs4 import BeautifulSoup #从bs4包中导入爬虫解析库BeautifulSoup
import re #导入正则表达式re模块
import pandas as pd #导入数据分析库并设置简称为pd
#2、定义获取源代码的函数
def gethtml(): #定义获取源代码的函数gethtml,无参数
 url="https://movie.douban.com/chart" #定义url为豆瓣电影网址
 headers={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36"} #设置网页请求头headers
 response=requests.get(url,headers=headers) #对网站进行get请求,并伪装成浏览器进行请求
 response.encoding=response.apparent_encoding #根据网页内容解析出编码格式并赋值给response.encoding
 html=response.text #将请求的相应信息赋值给html
 soup=BeautifulSoup(html,"html.parser") #将网页进行标准解析并赋值给soup
 content1=soup.findAll("a") #查找网页的a标签内容并赋值给content1
 list1=[] #定义空列表1
 list2=[] #定义空列表2
 for info in content1: #遍历所有的a标签信息,并赋值给info
 print(info.get("href")) #打印a标签的href属性值,即网页链接
 print(info.text) #打印a标签的text属性值,即a标签内部的内容
 list1.append(info.get("href")) #将a标签的href属性值添加到列表list1
 list2.append(re.sub(" ","",info.text)) #将a标签的内部内容添加到列表list2
 dict1={"序号":range(1,len(list1)+1),"网址":list1,"标题":list2} #设置字典dict1的内容
 df=pd.DataFrame(dict1) #将dict1的键值对转换为数据并赋值给df
 df.to_excel(r"C:\Users\Administrator\Desktop\电影.xlsx") #将df数据写入桌面的电影.xlsx文件
#3、调用函数gethtml
if __name__ == '__main__':
 gethtml() #调用获取源代码的函数gethtml

代码运行结果如下:

https://accounts.douban.com/passport/login?source=movie

登录/注册

https://www.douban.com/doubanapp/app?channel=top-nav

下载豆瓣客户端

https://www.douban.com/doubanapp/app?channel=qipao

豆瓣 6.0 全新发布

javascript: void 0;

×

https://www.douban.com/doubanapp/redirect?channel=top-nav&direct_dl=1&download=iOS

iPhone

https://www.douban.com/doubanapp/redirect?channel=top-nav&direct_dl=1&download=Android

Android

https://www.douban.com

豆瓣

https://book.douban.com

读书

https://movie.douban.com

电影

https://music.douban.com

音乐

https://www.douban.com/location

同城

https://www.douban.com/group

小组

https://read.douban.com/?dcs=top-nav&dcm=douban

阅读

https://douban.fm/?from_=shire_top_nav

FM

https://time.douban.com/?dt_time_source=douban-web_top_nav

时间

https://market.douban.com/?utm_campaign=douban_top_nav&utm_source=douban&utm_medium=pc_web

豆品

#more

更多

https://ypy.douban.com

豆瓣摄影

https://movie.douban.com

豆瓣电影

https://movie.douban.com/cinema/nowplaying/

影讯&购票

https://movie.douban.com/explore

选电影

https://movie.douban.com/tv/

电视剧

https://movie.douban.com/chart

排行榜

https://movie.douban.com/tag/

分类

https://movie.douban.com/review/best/

影评

https://movie.douban.com/annual/2018?source=navigation

2018年度榜单

https://www.douban.com/standbyme/2018?source=navigation

2018书影音报告

https://movie.douban.com/annual/2018?source=movie_navigation

https://movie.douban.com/subject/27119724/

https://movie.douban.com/subject/27119724/

小丑

/ 小丑起源电影:罗密欧 / Romeo

https://movie.douban.com/subject/30282387/

https://movie.douban.com/subject/30282387/

银河补习班

/ Looking Up

https://movie.douban.com/subject/26331839/

https://movie.douban.com/subject/26331839/

保持沉默

/ 黑色曼陀罗 / 无罪辩护

https://movie.douban.com/subject/27166976/

https://movie.douban.com/subject/27166976/

安娜

/ ANИA

https://movie.douban.com/subject/27010768/

https://movie.douban.com/subject/27010768/

寄生虫

/ 寄生上流(台) / 上流寄生族(港)

https://movie.douban.com/subject/30210691/

https://movie.douban.com/subject/30210691/

极限逃生

/ 逃出口 / 出口

https://movie.douban.com/subject/26816090/

https://movie.douban.com/subject/26816090/

沉默的证人

/ Bodies at Rest

https://movie.douban.com/subject/30288638/

https://movie.douban.com/subject/30288638/

仲夏夜惊魂

/ 仲夏魇(台) / 仲夏噩梦

https://movie.douban.com/subject/30225296/

https://movie.douban.com/subject/30225296/

柳烈的音乐专辑

/ 柳烈的音乐簿 / 唯一的音乐簿

https://movie.douban.com/subject/26367602/

https://movie.douban.com/subject/26367602/

龙牌之谜

/ 中国游记:龙牌之谜 / 魔鬼的精神2

/typerank?type_name=剧情&type=11&interval_id=100:90&action=

剧情

/typerank?type_name=喜剧&type=24&interval_id=100:90&action=

喜剧

/typerank?type_name=动作&type=5&interval_id=100:90&action=

动作

/typerank?type_name=爱情&type=13&interval_id=100:90&action=

爱情

/typerank?type_name=科幻&type=17&interval_id=100:90&action=

科幻

/typerank?type_name=动画&type=25&interval_id=100:90&action=

动画

/typerank?type_name=悬疑&type=10&interval_id=100:90&action=

悬疑

/typerank?type_name=惊悚&type=19&interval_id=100:90&action=

惊悚

/typerank?type_name=恐怖&type=20&interval_id=100:90&action=

恐怖

/typerank?type_name=纪录片&type=1&interval_id=100:90&action=

纪录片

/typerank?type_name=短片&type=23&interval_id=100:90&action=

短片

/typerank?type_name=情色&type=6&interval_id=100:90&action=

情色

/typerank?type_name=同性&type=26&interval_id=100:90&action=

同性

/typerank?type_name=音乐&type=14&interval_id=100:90&action=

音乐

/typerank?type_name=歌舞&type=7&interval_id=100:90&action=

歌舞

/typerank?type_name=家庭&type=28&interval_id=100:90&action=

家庭

/typerank?type_name=儿童&type=8&interval_id=100:90&action=

儿童

/typerank?type_name=传记&type=2&interval_id=100:90&action=

传记

/typerank?type_name=历史&type=4&interval_id=100:90&action=

历史

/typerank?type_name=战争&type=22&interval_id=100:90&action=

战争

/typerank?type_name=犯罪&type=3&interval_id=100:90&action=

犯罪

/typerank?type_name=西部&type=27&interval_id=100:90&action=

西部

/typerank?type_name=奇幻&type=16&interval_id=100:90&action=

奇幻

/typerank?type_name=冒险&type=15&interval_id=100:90&action=

冒险

/typerank?type_name=灾难&type=12&interval_id=100:90&action=

灾难

/typerank?type_name=武侠&type=29&interval_id=100:90&action=

武侠

/typerank?type_name=古装&type=30&interval_id=100:90&action=

古装

/typerank?type_name=运动&type=18&interval_id=100:90&action=

运动

/typerank?type_name=黑色电影&type=31&interval_id=100:90&action=

黑色电影

https://movie.douban.com/subject/27119724/

小丑

https://movie.douban.com/subject/30372377/

续命之徒:绝命毒师电影

https://movie.douban.com/subject/32659890/

我和我的祖国

https://movie.douban.com/subject/30329892/

航海王:狂热行动

https://movie.douban.com/subject/30225296/

柳烈的音乐专辑

https://movie.douban.com/subject/30390922/

哈马舍尔德悬案

https://movie.douban.com/subject/27202818/

婚姻故事

https://movie.douban.com/subject/27002635/

唐顿庄园

https://movie.douban.com/subject/32491917/

我的喜马拉雅

https://movie.douban.com/subject/27138615/

自卫的艺术

https://movie.douban.com/subject/27119724/

小丑

https://movie.douban.com/subject/4811807/

亚当斯一家

https://movie.douban.com/subject/3097572/

双子杀手

https://movie.douban.com/subject/26929010/

雪人奇缘

https://movie.douban.com/subject/6870362/

唐顿庄园:2011圣诞特别篇

https://movie.douban.com/subject/30294313/

舞女大盗

https://movie.douban.com/subject/27179039/

朱迪

https://movie.douban.com/subject/27133569/

小丑回魂2

https://movie.douban.com/subject/30432964/

杰克茜

https://movie.douban.com/subject/24716039/

星际探索

https://www.douban.com/doubanapp/frodo

豆瓣

你的移动观影指南

https://movie.douban.com/top250

全部

https://movie.douban.com/subject/1302467/?from=top250

https://movie.douban.com/subject/1302467/?from=top250

黑客帝国3:矩阵革命

https://movie.douban.com/subject/1292528/?from=top250

https://movie.douban.com/subject/1292528/?from=top250

猜火车

https://movie.douban.com/subject/1292659/?from=top250

https://movie.douban.com/subject/1292659/?from=top250

变脸

https://movie.douban.com/subject/1292328/?from=top250

https://movie.douban.com/subject/1292328/?from=top250

东邪西毒

https://movie.douban.com/subject/1401118/?from=top250

https://movie.douban.com/subject/1401118/?from=top250

黄金三镖客

https://movie.douban.com/subject/1291572/?from=top250

https://movie.douban.com/subject/1291572/?from=top250

指环王2:双塔奇兵

https://movie.douban.com/subject/2353023/?from=top250

https://movie.douban.com/subject/2353023/?from=top250

驯龙高手

https://movie.douban.com/subject/1300299/?from=top250

https://movie.douban.com/subject/1300299/?from=top250

杀人回忆

https://movie.douban.com/subject/1397546/?from=top250

https://movie.douban.com/subject/1397546/?from=top250

追随

https://movie.douban.com/subject/1292343/?from=top250

https://movie.douban.com/subject/1292343/?from=top250

蝴蝶效应

https://movie.douban.com/subject/5908478/?from=top250

https://movie.douban.com/subject/5908478/?from=top250

我爱你

https://movie.douban.com/subject/2297265/?from=top250

https://movie.douban.com/subject/2297265/?from=top250

浪潮

https://www.douban.com/hnypt/variformcyst.py

https://www.douban.com/about

关于豆瓣

https://www.douban.com/jobs

在豆瓣工作

https://www.douban.com/about?topic=contactus

联系我们

https://www.douban.com/about/legal

法律声明

https://help.douban.com/?app=movie

帮助中心

https://www.douban.com/doubanapp/

移动应用

https://www.douban.com/partner/

豆瓣广告

图片示例如下:

豆瓣网站信息

代码和代码运行结果

爬取的网页超链接和标题数据存入桌面Excel

到年末了,各大公司的年会也要陆续举办了,小姐姐/小哥哥是不是在为年会视频发愁呢?今天我就分享一下自己使用的比较好的免费无版权的视频素材网站,俗话说的好,素材找的好,下班回家早,希望这些网站能够帮助打工人更早的下班回家!笔芯~

当然这些网站不止适用于年会视频的制作,还很适合Vlog等视频短片的B-roll使用,希望能帮到大家!


Pixabay

首先要说的是网站Pixabay,这个网站之前我介绍免版权图片的时候提到过,它不止有大量免版权的图片,还有很多视频素材资源,这个网站最大的特点是全中文界面,对国内用户很友好,而且搜索支持中文,视频资源覆盖了自然现象、城市、动植物、文化旅游等等,其中也包括了很多4K素材资源,每个素材会标注视频质量/时长/类别标签。

点开每个素材会在页面标注详细的版权介绍和说明,还有下载质量可选,下载也有各种质量可选,非注册用户只能下载中低质量的素材,所以还是建议注册一下账号后期使用免费图库也比较方便。

爱给网

爱给网最早是做设计素材的网站,后续发展了很多种类的素材资源,包括音效/图片/视频等等。视频素材比较接地气,很符合当下中国的大众审美,种类也很丰富,有自然、饮食、文化、背景素材,还有AE和Pr的原素材文件,最早开始用的时候很多资源都是免费的,后来可能迫于网站的长久发展,出现了收费的素材资源,下载的时候可以选择CC0协议的视频资源,都是免费下载使用的,下载的速度也比较快。

Mixkit

Mixkit 是 ENVATO旗下的一个免费视频素材网站,Mixkit 是我比较推荐的一个网站,主要是服务器非常不错,下载速度也非常好,还不用注册。无论商业或非商业用途皆可自由使用,允许下载、复制、修改或公开使用,无须标注来源,不过个人建议还是可以在标注一下,尊重创作者。

Mixkit 网站的视频素材种类也非常丰富,覆盖科技/城市/乐器与音乐/生活/抽象/自然/户外/动画等等,大部分人都能找到适合自己的资源类型。尤其自然场景的素材比较丰富,流水、树叶随风漂浮这些素材很适合做视频的专场使用。

Videezy

Videezy 是一个成立于2006年的平面设计师素材分享站点,平面设计师Shawn发现要想在网络中找一些不错的素材很麻烦,于是就推出了针对平面设计师的素材站点,2010年开始团队运营,现在网站以分享免费的高清视频素材为主,用户可根据许可证免费使用。网站的4K视频资源比较多,中间也穿插了一些收费的资源,边角标注Pro的就是收费素材,下载的时候注意区分。

Life of Vids

Life of vids是一个基于众多摄影师自发分享的视频和图片素材网站,网站的素材主要以生活化、场景化的内容比较多,有城市、街道、山河湖海、天空等等,也就是空镜比较多,很适合作为视频的B-roll使用,无任何限制,可以应用于个人或商业用途。

Pexels

Pexels 也是之前我介绍免版权图库的时候介绍过,它和Pixabay一样,不仅拥有免版权的图片资源,还有很多免费可商用的视频素材资源,主页的文字上也在强调免费,界面比较友好,支持中文显示,Pexels不仅有自己的视频素材资源,还集成了其他站点的内容,资源类型包括生活/风景/人物等等。无需注册即可下载,视频可以运用于个人或者商业目的,并且使用的时候不需要任何的署名。

Videvo

Videvo 是一个综合类的视频网站,视频的分类非常的齐全,包括了动物 、商业、美食、医疗、音乐、人物、音乐等多个分类。Videvo的视频素材质量也非常高,高清类的视频有将近几百兆的大小,对于后期剪辑来说是非常实用的,而且网站的加载和下载速度都比较快。

videvo的版权信息也写得很清楚,只有Usage为All projects and media的情况下,才可以进行商用,但实际上大部分视频都是可以商用的。只是在使用的时候需要进行署名,这个需要大家注意哈。

Distill

Distill 专为设计师提供免费高画质影片素材,可搜寻、下载由其他人提供的影片,这些影片采用 CC0 授权,意味着你可以修改、复制、重制影片,用在个人或商业用途,而且无须取得许可,也不用标示出处。

Footage123

Footage123 的资源内容主要以无人机航拍为主,画质基本上都是4K,场面非常震撼的。很适合一些叙事场景视频或者Vlog做B-roll使用。航拍素材的类别也覆盖的非常完整,不仅可以下载资源,对于初学无人机拍摄的朋友还可以学习专业摄影师的运镜和拍摄手法,所以这也是个不错的航拍视频学习网站。

Coverr

Coverr 是一个提供免费网页背景影片的图库,素材类型包括美食、心情、自然、科技、艺术、人物、城市、动物、动画、鸟瞰航拍等等。素材可以供个人或商业使用无需标注来源。另外需要注意,它的网站搜索结果里会有 Shutterstock 的付费素材,注意区分一下。

网站还提供原始代码范例,包括在 HTML、CSS 和 JavaScript 部分的写法,只要将影片下载后上传到自己的服务器,取得链接、带入程序中,就能在网站使用影片动态背景效果。

NEWCGER

NEWCGER 是国内的一个影视资源分享网站,在视频行业的影响力比较大,网站提供大量的免费AE模板、视频音频素材,还有各种优秀视频作品推荐。AE模板的分类有LOGO演绎、图片/视频展示、文字动画、音频等等…适用于相册、婚礼、片头、节日、商务、转场等场景。因为是国内网站,所以整体的素材非常接地气,并且会根据时间节点推荐相对应的视频素材,比如图中这个非常适合中小型企业的审美水平。

总结

我经常用的大概就是这些,注意使用时尽量用谷歌浏览器打开,我测试过有几个网站用国内浏览器打开速度非常慢。

以上就是本次的分享,希望对你有所帮助,我是哆喵呜,下次见~~~