from selenium import webdriver
import os,time
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.common.by import By
driver_path=os.path.join(os.path.abspath(__file__),'../../driver/chromedriver.exe')
driver=webdriver.Chrome(executable_path=driver_path)
driver.get('https://www.baidu.com')
driver.maximize_window()
#1.通过id定位
driver.find_element(By.ID,"kw").send_keys("selenium id 定位")
#2.通过name定位
driver.find_element(By.NAME,"wd").send_keys("selenium name 定位")
#3.通过class_name 定位
driver.find_element(By.CLASS_NAME,"s_ipt").send_keys("selenium class_name 定位")
#4.通过 tag_name 定位,是最不准的定位,因为一个网上上同一个tag那么重复的可能性很大
driver.find_element(By.TAG_NAME,"input").send_keys("selenium tag_name 定位")
#5.通过link_text 定位
driver.find_element(By.LINK_TEXT,"新闻").click()
#6.通过partial_link_text 定位
driver.find_element(By.PARTIAL_LINK_TEXT,"新").click()
#7.通过css定位
# 7.1 绝对路径是从网页的根节点html开始,逐层去查找需要定位的元素。
# 此方法缺点显而易见,当页面元素位置发生变化时,都需要修改,因此不推荐
driver.find_element(By.CSS_SELECTOR,'html body div#wrapper div#head div.head_wrapper div.s_form div.s_form_wrapper.soutu-env-mac.soutu-env-index form#form span.bg.s_ipt_wr.quickdelete-wrap input#kw').send_keys('selenium css 绝对路径定位')
# 备注:当同一层次有多个相同的元素时,使用id或class区分,遇到id用#号,遇到class用.
# 7.2 通过相对路径,相对路径表示文件中所有符合模式的元素都会被选出来,即使是处于不同的层级也会被选出来。
driver.find_element(By.CSS_SELECTOR,'#kw').send_keys('selenium css 相对定位1')
driver.find_element(By.CSS_SELECTOR,'input#kw').send_keys('selenium css 相对定位2')
# 7.3 使用元素属性爹娘各位
# 元素属性定位要求属性能够定位唯一一个元素,如果存在多个相同标签
# 默认第一个,具体格式 //标签名[属性=‘属性值’],支持使用多个属性一起定位元素
driver.find_element(By.CSS_SELECTOR,'input[name="wd"]').send_keys('selenium css 属性值定位')
driver.find_element(By.CSS_SELECTOR,'input[name="wd"][class="s_ipt"]').send_keys('selenium css 多属性值定位')
# 7.4 使用部分属性值匹配(也称为模糊方法定位)
# 属性值如果太长或网页中的元素属性动态变化,可以使用此方法
# 元素属性值开头包含内同: ^=driver.find_element(By.CSS_SELECTOR,'a[href^="http://news."]').click()
#元素属性值结尾包含内容: $=driver.find_element(By.CSS_SELECTOR,'a[href$="news.baidu.com"]').click()
#圆度属性
driver.find_element(By.CSS_SELECTOR,'a[href*="news"]').click()
# 7.5查询子元素
# 1)子元素 A>B
driver.find_element(By.CSS_SELECTOR,'form>span>input').send_keys('css 子元素定位')
# 2)后代元素 A空格B (类似 >)
driver.find_element(By.CSS_SELECTOR,'form span input').send_keys('后代元素')
# 3)第一个后代元素: first-child
driver.find_element(By.CSS_SELECTOR,'a#s-top-username a:first-child').click()
# 4)最后一个后代元素
a=driver.find_element(By.CSS_SELECTOR,'div#u1 a:last-child')
# 5)第n个元素: nth-child
driver.find_element(By.CSS_SELECTOR,'div#u1 a:nth-child(3)').click()
# 7.6查询兄弟元素
# 1)同层级下一个元素 +
driver.find_element(By.CSS_SELECTOR,'div#u1 a+a')
# 2)选择同层级多个相同标签的元素
driver.find_element(By.CSS_SELECTOR,'div#u1 a ~ a')
#8.通过xpath 定位,xpath 常用有6中定位元素方法
# 8.1 绝对路径,角度路径的开头是一个斜线(/),从网页的根节点html开始,逐层去查找需要定位
#的元素。
driver.find_element(By.XPATH,'/html/body/div[1]/div[1]/div/div[1]/div/form/span[1]/input').send_keys('xpath 绝对路径定位')
#备注:当同一个层次有多个相同的元素时,使用下标区分,下标从1开始。
# 8.2 相对路径的开头是两个斜线(//),表示文件中所有符合模式的元素都会被找到,即使是处于树
# 中不通的层级也会被选出来。
driver.find_element(By.XPATH,'//form/span[1]/input').send_keys('selenium xpath 相对路径定位1')
driver.find_element_(By.XPATH,'//span[1]/input').send_keys('selenium xpath 相对路径定位2')
# 备注:以上都可以定位到百度搜索框,相对路径的长度和开始位置并不受限制,可以采用从后往前逐级定位
#直到定位到即可的方式去定位。
# 8.3 元素索引,遇到同层级相同标签元素时,可以使用索引(下标)表示,缩影的初始值为1
driver.find_element(By.XPATH,'//div/div[3]/a[2]').click()
# 8.4 元素属性,要求属性能够定位到唯一一个元素,如果存在多个相同标签,默认定位第一个,
#具体隔离 //标签名[@属性="属性值"] 支持使用 and 和 or 关键字,多个属性一起定位
driver.find_element(By.XPATH,'//a[@href="http://news.baidu.com"]').click()
driver.find_element(By.XPATH,'//a[@href="http://news.baidu.com" or @class="mnav c-font-normal c-color-t"] ').click()
driver.find_element(By.XPATH,'//a[@href="http://news.baidu.com" and @target="_blank"]').click()
# 8.5 元素部分属性值(也称为模糊方法定位)
#属性值如果太长活网页中的元素属性动态变化,可以使用此方法
# (1)元素属性值开头包含内容: start-with()
driver.find_element(By.XPATH,"//a[start-with(@name,'')]").click()
#(2)元素属性值结尾包含内容substring()
driver.find_element(By.XPATH,"//a[substring(@href,9)='123']").click()
# (3)contains
driver.find_element(By.XPATH,"//a[contains(@href,'hao')]").click()
# 8.6 元素文本在xpath中可以通过text()函数获取,也可以用其来进行元素定位。
driver.find_element(By.XPATH,'//a[text()="新闻"]').click()
driver.find_element(By.XPATH,'//a[contains(text(),"新")]').click()
time.sleep(3)
driver.quit()
① B/S架构:Browser/Server(浏览器/服务器的交互形式。)
② C/S架构:Client/Server(客户端/服务器的交互形式。)
① 什么是HTML?② 怎么开发HTML?③ 怎么运行HTML?
?由大量的标签组成,每一个标签都有开始标签和结束标签。
?超文本:图片、声音、视频等
?编辑器有:HBuilder、vscode等
③ 直接采用浏览器打开HTML文件就能运行
④ HTML是谁制定的?
?W3C制定了HTML的规范:每个浏览器生产厂家都会遵守规范。HTML也会按照规范去写代码
?HTML规范目前最高的版本是:HTML5.0,简称H5
?我们现在主要学的HTML4.0(基本用法)
?w3school:先出现的,和W3C无关
?w3cschool:后出现的,和W3C无关
?W3C制定了很多规范:HTML/XML/http协议/https协议……
页面效果图:
超链接的作用:
通过超链接可以从浏览器向服务器发送请求。
效果图:
地址栏提交的信息:
?username=abc&userpassowrd=1234&sex=1&aihao=study&aihao=dream&myText=我没有value属性;&position=ln&myFile=&myHidden=
14、表单的说明:
服务器软件:Apache、IIS
浏览器是一个翻译官,是一个解释器。浏览器可以翻译有HTML、CSS、JavaScript。
服务器端脚本程序:PHP、 .net、JSP、c#等
.php文件要由PHP脚本引擎来进行处理。
网站前台(客户端) 网站后台(服务器端) 数据库
HTML(结构) PHP MySQL
CSS JSP Oracle
JavaScript .net SqlServer
HTML结构:主要来说明,哪个地方是标题,哪个地方是段落,哪个地方是表格,哪个地方是表单。
CSS表现(格式):主要功能是,给相对应的HTML标记定义各种各样的格式。
JavaScript行为:主要用于与计算机网页进行交互(交流)。
块元素和行内元素
块元素:宽度单独占一个通栏宽,块元素的前台的其它元素,都要另起一行来排。
比如:<p> <pre> <hr> <h1>……<h6> <ul> <ol> <li>
DIV和SPAN就是一个容器,容器中可以存放任何可以存放在<body>中的内容或标记。
行内元素:行内元素没有宽度和高度的概念,也就是说通过CSS无法给行内元素增加宽和高。多个行内元素会放在同一行,不会另起一行来排版。
Direction:滚动的方向,取值:left、right、up、down
Behavior:滚动的方式,取值:scroll(滚动)、 alternate(弹动)、 slide(滚动一次)
Width:滚动的区域宽度,取值:px或%
Height;滚动的区域高度
bgColor:背景颜色,如:bgcolor=“#FF0000” bgcolor=“rgb(255,0,0)”
scrollAmount:滚动步长值,一步走多远,值越大,走的越快
scrollDelay:两次滚动的间隔时间,以毫秒为单位 1秒=1000毫秒
进制,就是一种进位方法。
10进制:有10个基本数,0、1、2、3、4、5、6、7、8、9,运算规则是:逢十进一
例如:9 10 19 20 29 30
2进制:有2个基本数,0、 1,运算规则是:逢二进一。比如:(10)2 11 100 101 110
8进制:有8个基本数,0、1、2、3、4、5、6、7,运算规则是:逢八进一。比如:(17)8 20 21 26 27 30
因为二进制太长,不方便记忆,因此小型机引入了八进制,八进制可以很好的反应二进制。
因此,一个八进制数,用3位二进制数来表示。
基R=2^3
16进制:有16个基本数,0、1、2、3、4、5、6、7、8、9、A、B、C、D、E、F,运算规则是:逢16进一
比如:EF F0 F1 F2 FE FF (100)16
16进制的一位对应4位二进制。基R=2^4
10进制 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 |
2进制 | 1 | 10 | 11 | 100 | 101 | 110 | 111 | 1000 | 1001 | 1010 | 1011 | 1100 | |||||||
8进制 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 20 | |||
16进制 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | 10 | 11 | 12 | 13 |
十进制转成二进制
分为整数部分和小数部分,分别转换。比如:将(10.125)10转成二进制? 1010.001
(1)整数部分转成二进制:除2取余法。每次将整数除以2,取余数,一直除下去,直到整数部分(商)为0。最后读数时,从下往上读取。
第N次 | 整数10 | 商 | 余数 | ||
第1次 | 10/2 | 5 | 0 | ||
第2次 | 5/2 | 2 | 1 | ||
第3次 | 2/2 | 1 | 0 | ||
第4次 | 1/2 | 0 | 1 | 最后结果为:1010 | |
(2)小数部分转成二进制:乘2除整法。每次将小数部分乘以2,取整数,一直乘下去,直到小数部分为0。最后读数时,从上往下读取。
第N次 | 小数0.125 | 积 | 整数 | ||
第1次 | 0.125*2 | 0.25 | 0 | ||
第2次 | 0.25*2 | 0.5 | 0 | ||
第3次 | 0.5*2 | 1.0 | 1 | ||
最后结果为:001 | |||||
二进制转成十进制
不分整数部分和小数部分,按权相加法。换句话说:二进制上的每一位,乘以所在位权(也就是2的几次方),最后将各个位的乘相加,就能得到十进制。
1010.001=1*2^3 + 0*2^2 + 1*2^1 + 0*2^0 + 0*2^-1 + 0*2^-2 + 1*2^-3=8+2+ 1/8=10+0.125=10.125
计算机只能二进制,比如:a-z、A-Z、0-9、标点符号,计算机都不能直接识别。每个人都可以来约定一套字符编码(比如:a用二进制100表示,b用二进制101表示,c用二进制的110表示等)
计算机是由美国人发明的,美国标准化局同样制定了一套统一的编码,叫ASCII码。
ASCII码
ASCII编码用7位或8位(1个字节)二进制来表示,共可以表示128或256个字符。包括:大小写字母、数字、标点符号、图形符号等。
每个国家都想让计算机能显示或处理本国的语言,都对ASCII码进行了扩展。
在中国(简体字),ANSI编码是指GB2312或GBK。
在台湾(繁体字),ANSI编码是指BIG5
在日本,ANSI编码是指JIS。
……
注意:ANSI编码是跟随操作一齐安装的,也就是,安装了中文操作系统后,它的默认编码就是GB2312。
GB2312是中国标准化局,在1980年制定的一套显示简体中文的编码。
GB2312是用2个字节来显示。共可以表示2^16=256*256=65536个字符。
GB2312共保存了6763个常用汉字,一级汉字3700个。
GBK编码
对GB2312进行了扩充,可以显示人名、古汉语中的一些罕见字等。
GBK也是用2个字节来表示。共存储了2.3万个左右的中文字符。
GBK的范围,要比GB2312大的多。
BIG5编码
BIG5用于台湾、香港、澳门地区的繁体中文编码。
Unicode编码
用4个字节表示字符,共可以表示42个亿个字符。
Unicode编码可以显示世界上所有国家的语言。
缺点:文件庞大,效率不高,不利于推广。
UTF-8统一格式转换
它会自动根据不同的字符,来选择不同编码长度。
<meta>标记是设置一些网页文件头方面的信息。主要包括:网页编码或字符集设置、网页关键字、网页描述、网页刷新跳转等。相当于一封信的信封,信封有地址、邮编等重要。
<head>标记中的内容在浏览器中,是不可见的。
主要用两个常用的属性:
http-equiv:主要设置一些控制信息,属性值是固定的。比如:content-type
name:一般用于设置网页描述信息,像关键字、网页描述、网页版权、作者等,属性值是固定的。比如:keywords
content:是具体的参数或内容,与http-equiv和name属性进行对应。
(1)设置网页的字符集或编码
<meta http-equiv=“content-type” content=“text/html;charset=GBK”>
(2)设置网页刷新或跳转
<meta http-equiv=“refresh” content=“5”> 表示每隔5秒钟,刷新网页
<meta http-equiv=“refresh” content=“5;url=http://www.baidu.com”> 表示5秒钟后,跳转到百度网
注意:刷新功能相当于浏览器中的刷新按钮
(3)设置网页关键字(SEO优化),给搜索引擎(搜索机器人)使用
<meta name=“keywords” content=“程序开发,平面设置,空间域名,网站维护”>
(4)设置网页描述信息(SEO优化)
<meta name=“description” content=“广州网站建设思优网络公司,提供专业广州网站制作及网站推广相结合的建站方案,由专业广州网站设计人员结合搜索引擎优化经验为您设计网站;广州网页设计:020-87537332”>
XHTML是可扩展超文本标注语言,XHTML是更纯净的HTML,语法更严格。
XHTML的目的是为了取代HTML4.01。
XHTML是W3C的一个标准或规范。
编写XHTML的规范,与HTML编写有何不同?
1)所有的标记都必须被关闭。比如:<br>转换<br /> <hr>转换后 <hr />
2)XHTML要求所有的标记名称必须小写。比如:<meta><table><img><font>
3)XHTML要求所有的属性名必须小写,属性值必须加引号。
4)XHTML要求所有的属性必须有值。
<hr noshade=“noshade” />
<input type=“radio” checked=“checked” />
5)所有的标记要顺序嵌套,不能交叉嵌套;
6)XHTML文件,必须要有DTD文档类型定义;
DTD(Document Type Define)文档类型定义
(1)严格型Strict
要求HTML代中,不能存在任何的表现,用CSS去代替。比如:<font>、bgcolor、background等
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
(2)过渡型transitional
可以使用任何表现的标记或属性。
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
(3)框架型Frameset
制作框架网页时使用的一种类型,框架主要用于网站的后台管理。
框架技术:是将一个浏览器窗口划分成不同区域,每个区域(窗口)都可以显示一个独立的网页。(HTML第四天单独讲框架,现在作个了解)
W3C是万维网联盟,是一个国际性的非盈利性组织,是WEB领域最具权威性的组织。已经制定多达200多项的标准。
比如:XHTML、CSS、ECMAScript(JavaScript)、DOM、 XML等。
超级链接的功能:就是点击某个链接,可以跳转到目标页面或文件。
超级链接的分类:
(1)按内容分类:文本链接、图片链接、多媒体等
(2)按URL分类:相对URL、绝对URL、锚点
URL,指网址或路径
URL(Uniform Resource Locator,统一资源定位器),也就是指互联网地址。
http://www.sina.com.cn/about/index.html
第一个部分:协议,指访问什么类型的服务器,如:http://、FTP://、news://
第二个部分:主机名或主机的IP地址。如:www.sina.com.cn
第三个部分:文件夹名,如:about
第四个部分:文件名,如:index.html
格式:<a 属性=“属性值”>新浪网</a>
常用的属性:
Href:指链接的目标文件或网址。比如:href=“http://www.toutiao.com”
Target:指目标文件的打开方式。
_blank:在新窗口中,来打开目标文件;
_self:在当前窗口中,来打开目标文件;
_top:在最顶层窗口中,来打开目标文件(在框架中讲);
_parent:在父窗口中,来打开目标文件(在框架中讲)
Name:设置锚点的名称。锚点是指:链接到同一个页面的不同部分
举例:<a href=http://www.toutiao.com target=“_blank”>头条号</a>
绝对URL:它总是以file:///协议开头,去访问目标文件。
如果将当前文件移动到其它地方,这个绝对URL路径不需要修改。
绝对URL,只需要确定目标文件的路径即可,与当前文件位置无关。
例如:<a href=“file:///E:/itcast/20140510/lesson/day2/4.html”>本地绝对路径</a>
相对URL:要确定当前文件与目标文件的关系。
关系分为三种:
平级关系:直接写目标文件的文件名即可。
下级关系:也就是目标文件所在的文件夹与当前文件是平级关系,当前文件与目标文件是上下级关系。
上级关系:目标文件位于上一层级。
../代表上一层文件夹
../../代表上二层文件夹
../../images/01.jpg
提示:在制作网站时,一般使用的都是相对路径。
(3)下载链接:如果链接到的文件,网页不能直接执行的话,都会出现下载提示。
浏览器可以直接执行的文件:.gif、.jpg、.png、html、.htm、.mp3、.swf等
(4)邮箱链接:mailto:beijing2000@126.com
第一步:定义一个锚点或标记 <a name=“top”></a>
第二步:链接到锚点或标记 <a href=“#top”>返回顶部</a>
<a href=“intro.html#bottom”>链接到intro.html的底部</a>
格式:<img 属性=“属性值” />
常用的属性:
Src:指图片的URL,可以是相对路径,也可以是绝对路径。
Width:指图片的宽度,单位px或%
Height:指图片的高度
Align:图片的水平对齐方式,取值:left center right ,left或right可以实现图文混排
Alt:如果图片不存在时,显示的提示信息
Hspace:图片左右的距离
Vspace:图片上下的距离
举例:<img src=“images/01.gif” width=“400” height=“300” alt=“宝宝图片” />
如果保证图片在调整过程中不变形(等比例缩放):只需要设置width和height其中一个即可,另一个会自动缩放。
*请认真填写需求信息,我们会在24小时内与您取得联系。