整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:

34道常见的HTML+CSS面试题(附答案)

众号【传智播客博学谷】回复关键词:前端 PS Java(100G) Python(80G) 大数据 区块链 测试 PPT JS(40g+300教程) HTML 简历 领取相关学习资料!

一、HTML

1、<image>标签上title属性与alt属性的区别是什么?

alt属性是为了给那些不能看到你文档中图像的浏览者提供文字说明的。且长度必须少于100个英文字符或者用户必须保证替换文字尽可能的短。

这包括那些使用本来就不支持图像显示或者图像显示被关闭的浏览器的用户,视觉障碍的用户和使用屏幕阅读器的用户等。

title属性为设置该属性的元素提供建议性的信息。使用title属性提供非本质的额外信息。参考《alt和title属性的区别及应用》

2、分别写出以下几个HTML标签:文字加粗、下标、居中、字体

加粗:<b>、<strong>

下标:<sub>

居中:<center>

字体:<font>、<basefont>、参考《HTML标签列表》

3、请写出至少5个html5新增的标签,并说明其语义和应用场景

section:定义文档中的一个章节

nav:定义只包含导航链接的章节

header:定义页面或章节的头部。它经常包含 logo、页面标题和导航性的目录。

footer:定义页面或章节的尾部。它经常包含版权信息、法律信息链接和反馈建议用的地址。

aside:定义和页面内容关联度较低的内容——如果被删除,剩下的内容仍然很合理。

参考《HTML5 标签列表》

4、请说说你对标签语义化的理解?

a. 去掉或者丢失样式的时候能够让页面呈现出清晰的结构

b. 有利于SEO:和搜索引擎建立良好沟通,有助于爬虫抓取更多的有效信息:爬虫依赖于标签来确定上下文和各个关键字的权重;

c. 方便其他设备解析(如屏幕阅读器、盲人阅读器、移动设备)以意义的方式来渲染网页;

d. 便于团队开发和维护,语义化更具可读性,遵循W3C标准的团队都遵循这个标准,可以减少差异化。

5、Doctype作用? 严格模式与混杂模式如何区分?它们有何意义?

声明位于文档中的最前面,处于 标签之前。告知浏览器以何种模式来渲染文档。

严格模式的排版和 JS 运作模式是,以该浏览器支持的最高标准运行。

在混杂模式中,页面以宽松的向后兼容的方式显示。模拟老式浏览器的行为以防止站点无法工作。

DOCTYPE不存在或格式不正确会导致文档以混杂模式呈现。

6、你知道多少种Doctype文档类型?

标签可声明三种 DTD 类型,分别表示严格版本、过渡版本以及基于框架的 HTML 文档。

HTML 4.01 规定了三种文档类型:Strict、Transitional 以及 Frameset。

XHTML 1.0 规定了三种 XML 文档类型:Strict、Transitional 以及 Frameset。

Standards (标准)模式(也就是严格呈现模式)用于呈现遵循最新标准的网页,

Quirks(包容)模式(也就是松散呈现模式或者兼容模式)用于呈现为传统浏览器而设计的网页。

7、HTML与XHTML——二者有什么区别

a. XHTML 元素必须被正确地嵌套。

b. XHTML 元素必须被关闭。

c. 标签名必须用小写字母。

d. XHTML 文档必须拥有根元素。

参考《XHTML 与 HTML 之间的差异》

8、html5有哪些新特性、移除了那些元素?

a. HTML5 现在已经不是 SGML 的子集,主要是关于图像,位置,存储,多任务等功能的增加。

b. 拖拽释放(Drag and drop) API

c. 语义化更好的内容标签(header,nav,footer,aside,article,section)

d. 音频、视频API(audio,video)

e. 画布(Canvas) API

f. 地理(Geolocation) API

g. 本地离线存储 localStorage 长期存储数据,浏览器关闭后数据不丢失

h. sessionStorage 的数据在页面会话结束时会被清除

i. 表单控件,calendar、date、time、email、url、search

j. 新的技术webworker, websocket等

移除的元素:

a. 纯表现的元素:basefont,big,center, s,strike,tt,u;

b. 对可用性产生负面影响的元素:frame,frameset,noframes;

9、iframe的优缺点?

优点:

a. 解决加载缓慢的第三方内容如图标和广告等的加载问题

b. iframe无刷新文件上传

c. iframe跨域通信

缺点:

a. iframe会阻塞主页面的Onload事件

b. 无法被一些搜索引擎索引到

c. 页面会增加服务器的http请求

d. 会产生很多页面,不容易管理。

参考《iframe的一些记录》

10、Quirks模式是什么?它和Standards模式有什么区别?

在写程序时我们也会经常遇到这样的问题,如何保证原来的接口不变,又提供更强大的功能,尤其是新功能不兼容旧功能时。IE6以前的页面大家都不会去写DTD,所以IE6就假定 如果写了DTD,就意味着这个页面将采用对CSS支持更好的布局,而如果没有,则采用兼容之前的布局方式。这就是Quirks模式(怪癖模式,诡异模式,怪异模式)。

区别:总体会有布局、样式解析和脚本执行三个方面的区别。

a. 盒模型:在W3C标准中,如果设置一个元素的宽度和高度,指的是元素内容的宽度和高度,而在Quirks 模式下,IE的宽度和高度还包含了padding和border。

b. 设置行内元素的高宽:在Standards模式下,给等行内元素设置wdith和height都不会生效,而在quirks模式下,则会生效。

c. 设置百分比的高度:在standards模式下,一个元素的高度是由其包含的内容来决定的,如果父元素没有设置百分比的高度,子元素设置一个百分比的高度是无效的用

d. 设置水平居中:使用margin:0 auto在standards模式下可以使元素水平居中,但在quirks模式下却会失效。

11、请阐述table的缺点

a. 太深的嵌套,比如table>tr>td>h3,会导致搜索引擎读取困难,而且,最直接的损失就是大大增加了冗余代码量。

b. 灵活性差,比如要将tr设置border等属性,是不行的,得通过td

c. 代码臃肿,当在table中套用table的时候,阅读代码会显得异常混乱

d. 混乱的colspan与rowspan,用来布局时,频繁使用他们会造成整个文档顺序混乱。

e. 不够语义

参考《为什么说table表格布局不好?》

12、简述一下src与href的区别

src用于替换当前元素;href用于在当前文档和引用资源之间确立联系。

src是source的缩写,指向外部资源的位置,指向的内容将会嵌入到文档中当前标签所在位置

href是Hypertext Reference的缩写,指向网络资源所在位置,建立和当前元素(锚点)或当前文档(链接)之间的链接

公众号【传智播客博学谷】回复关键词:前端 PS Java Python 大数据 区块链 测试 PPT JS HTML 简历 领取相关学习资料!

数据文摘作品,转载要求见文末

作者 | NSS

编译 | 张伯楠,刘云南

弋心,卫青,宁云州

R语言是数据科学领域最流行的语言之一。如果你真想从事数据科学事业,那你要么已经会用R语言要么正在学习它。R语言同样是一个拥有广泛的统计和数据科学库的生态系统。为了帮助数据科学家测试他们的R语言能力,我们为DataFest 2017设计了一部分技能测试题。

超过1500人注册了这项考试并有接近500人完成了测试。下图是不同测试者的成绩分布:

下面是关于成绩分布的一些统计数据:

平均分:16.69

分数中值:19

众数:0

下面是这四十道题目的问题和答案,如果错过了测验,你还有机会完成这四十道题目,看看自己在R语言上究竟处于什么水平。

友情提示:在使用本文代码之前,请先清除格式,或查看本文原文网址复制使用。

祝你学习愉快!

问题与答案

1

请看下列函数

f <- function(x) {

g <- function(y) {

y + z

}

z <- 4

x + g(x)

}

1)如果我们执行下列命令(写在下一行),输出结果会是什么?

z <- 10

f(4)

A) 12

B) 7

C) 4

D) 16

答案:(A)

R语言的作用域规则(scoping rule)会使z<-4的条件优先于z<-10。因此,g(x)会返回8,所以A选项是正确答案。

2

鸢尾属植物(iris)数据集包括多种具有不同萼片(sepal)长度的花,如多刚毛类(setosa)、杂色类(versicolor)和维尔吉尼卡(virginica)等。现在,我们想分析所有鸢尾属花的萼片长度分布。其中之一的解决方法是通过下面所示的图可视化它们之间的关系。

下列哪个函数能够用于创建上文所示的图?

A) xyplot()

B) stripplot()

C) barchart()

D) bwplot()

答案:(B)

上文所绘是条型图而选项A、C、D会分别产生散点图、柱状图以及箱线图。因此,B选项是正确答案。

3

Alpha125.50
Beta235.61
Beta212.030
Beta211.300
Alpha265.461

文件名:Dataframe.csv

3)下列命令哪一项可以在一个数据框架中正确读取上述csv文件的全部五行内容?

A) csv(‘Dataframe.csv’)

B) csv(‘Dataframe.csv’,header=TRUE)

C) dataframe(‘Dataframe.csv’)

D) csv2(‘Dataframe.csv’,header=FALSE,sep=’,’)

答案:(D)

第一个和第二选项会将数据第一行读取为变量名。第三个命令不存在,因此,选项D是正确答案。

4

Excel文件格式是最常用的储存数据文件格式之一。了解如何将Excel文件转化为R语言格式非常重要。下面是一个Excel文件,其中数据储存在第三个工作表中。

Alpha125.50
Beta235.61
Beta212.030
Beta211.300
Alpha265.461

文件名:Dataframe.xlsx

下列哪行代码可以从Excel工作表3中读取数据?

A) Openxlsx::read.xlsx(“Dataframe.xlsx”,sheet=3,colNames=FALSE)

B) Xlsx::read.xlsx(“Dataframe.xlsx”,sheetIndex=3,header=FALSE)

C)XLConnect::readWorksheetFromFile(“Dataframe.xlsx”,sheet=3,header=FALSE)

D)All of the above

答案:(D)

上述的全部选项都是正确的,它们采用了不同的方法来将Excel文件读取入R语言,且都正确读取了文件。因此,D选项是正确答案。

5

A10Sam
B20Peter
C30Harry
D!?
E50Mark

文件名:Dataframe.csv

5)上述csv文件中缺失的值被感叹号(“!”)和问号(“?”)所代替。下列哪行代表可以正确将上述csv文件读取进R语言?

A) csv(‘Dataframe.csv’)

B) csv(‘Dataframe.csv’,header=FALSE, sep=’,’,na.strings=c(‘?’))

C) csv2(‘Dataframe.csv’,header=FALSE,sep=’,’,na.strings=c(‘?’,’!’))

D) dataframe(‘Dataframe.csv’)

Solution: (C)

选项A不能在R语言中把“?” 和“!”读取为“NA”;选项B只能把“?”读取为“NA”而“!”不能;选项4并不存在。因此,选项C是正确答案。

6

Column 1Column 2Column 3
Row 115.514.1269.5
Row 218.656.2352.4
Row 321.447.0263.21
Row 436.156.6336.12

文件名:Dataframe.csv

上述csv文件既有行名称又有列名称。下面哪行代码能够正确地将该csv文件读入R语言?

A) delim(‘Train.csv’,header=T,sep=’,’,row.names=TRUE)

B) csv2(‘Train.csv’,header=TRUE, row.names=TRUE)

C) dataframe(‘Train.csv’,header=TRUE,sep=’,’)

D) csv(‘Train.csv’,,header=TRUE,sep=’,’)

答案:(D)

A和B选项中的row.names参数仅仅引用有包含实际行名称的矢量本身或者一个指向包含行名称的列值数字,而并非一个有效的逻辑值。选项C并不存在。因此,D选项是正确答案。

7

Column 1Column 2Column 3
Row 115.514.1269.5
Row 218.656.2352.4
Row 321.447.0263.21
Row 436.156.6336.12

文件名:Dataframe.csv

下列哪行代码将只读取csv文件中的前两行?

A) csv(‘Dataframe.csv’,header=TRUE,row.names=1,sep=’,’,nrows=2

B) csv2(‘Dataframe.csv’,row.names=1,nrows=2)

C) delim2(‘Dataframe.csv’,header=T,row.names=1,sep=’,’,nrows=2)

D) dataframe(‘Dataframe.csv’,header=TRUE,row.names=1,sep=’,’,skip.last=2)

答案:(A)

因为在csv2函数中的默认分隔符是“;”,而csv文件是“,”,B选项将不能正确读取csv文件,选项C使用了错误的参数值,选项D不存在。因此,选项A是正确答案。

8

Dataframe1Feature1Feature2Feature3Feature4A100025.510B200035.534C300045.578D400055.53Dataframe2Feature1Feature2Feature3E500065.5F600075.5G700085.5H800095.5

上图为两个数据框,数据1和数据2。

下列哪行代码可以执行出下述结果?

Feature1Feature2Feature3
A100025.5
B200035.5
C300045.5
D400055.5
E500065.5
F600075.5
G700085.5
H800095.5

A) merge(dataframe[,1:3],dataframe2)

B) merge(dataframe1,dataframe2)[,1:3]

C) merge(dataframe1,dataframe2,all=TRUE)

D) Both 1 and 2

E) All of the above

答案:(D)

C选项会导致融合后的数据框中包含feature 4,而这不是我们想要的结果。因此,D选项是正确答案。

9

V1V2
1121.5461
25161351
34516918
4613112
5112.36230
625.231456
712457

dataframe

R语言中已读取了一个数据集并存储在变量“dataframe”中。下列哪行代码可以实现整个数据集的总结(平均数、中位数、众数)?

A) summary(dataframe)

B) stats(dataframe)

C) summarize(dataframe)

D) summarise(dataframe)

E) None of the above

答案:(E)

A选项只会给出平均值和中位数,而不会给出众数。B,C,D选项同样不能提供所需统计信息。因此,E选项是正确答案。

10

R语言读取了一数据集并存储在变量“dataframe”中。缺失值以NA表示。

A10Sam
BNAPeter
C30Harry
D40NA
E50Mark

dataframe

下列哪行代码将不能给出每一列的缺失值?

A) colSums(is.na(dataframe))

B) apply(is.na(dataframe),2,sum)

C) sapply(dataframe,function(x) sum(is.na(x))

D) table(is.na(dataframe))

答案:(D)

D选项将给出缺失值的总数而非每列单独给出。因此,D选项是正确答案。

11

应用单变量分析检查数据中的缺失值及其分布是数据分析流程中的重要步骤之一。下列是一个数据集,我们希望能为“Value”变量绘制柱状图。

ParameterStateValueDependents
AlphaActive502
BetaActive455
BetaPassive250
AlphaPassive210
AlphaPassive261
BetaActive302
BetaPassive180

dataframe

下列哪个命令能够帮助我们完成任务?

A) hist(dataframed$Value)

B) ggplot2::qplot(dataframed$Value,geom=”Histogram”)

C)ggplot2::ggplot(data=dataframed,aes(dataframe$Value))+geom_histogram()

D) All of the above

答案:(D)

所有给出选项都可以绘制柱状图并可以查看数据的偏度。

12

ParameterStateValueUsage
AlphaActive500
BetaActive451
BetaPassive250
AlphaPassive210
AlphaPassive261
BetaActive301
BetaPassive180

诸如XGBOOST等算法只对数值数据有效。在这种情况下,数据集中的分类变量将先被转化为虚拟变量,其可以展示数据集中某个分类是否存在。比如,当对“Parameter”项数据创建虚拟变量后,数据集显示如下。

Parameter_AlphaParameter_BetaStateValueUsage
10Active500
01Active451
01Passive250
10Passive210
10Passive261
01Active301
01Passive180

下面中的哪个命令能实现这个功能?

A) dummies:: dummy.data.frame(dataframe,names=c(‘Parameter’))

B) dataframe$Parameter_Alpha=0

dataframe$Gende_Beta=0

dataframe$Parameter_Alpha[which(dataframe$Parameter==’Alpha’)]=1

dataframe$Parameter_Beta[which(dataframe$Parameter==’Alpha’)]=0

dataframe$Parameter_Alpha[which(dataframe$Parameter==’Beta’]=0

dataframe$Parameter_Beta[which(dataframe$Parameter==’Beta’]=1

C) contrasts(dataframe$Parameter)

D)A和B

答案:D

C选项会将Parameter列的值变成两种类型但不会进行独热编码(one hot encoding)。因此,选项D是正确选择。

13

Column1Column2Column3Column4Column5Column6
Name1Alpha1224540Alpha
Name2Beta1632511Beta
Name3Alpha52104320Gamma
Name4Beta3672841Delta
Name5Beta4590320Phi
Name6Alpha1224120Zeta
Name7Beta3264641Sigma
Name8Alpha4284540Mu
Name9Alpha56112311Eta

以上为名为dataframe的变量。

我们想计算数据表中第二列和第三列之间的相关性,下面代码中的哪个能实现这个目的?

A) corr(dataframe$column2,dataframe$column3)

B) (cov(dataframe$column2,dataframe$column3))/(var(dataframe$column2)*sd(dataframe$column3))

C)

(sum(dataframe$Column2*dataframe$Column3)- (sum(dataframe$Column2)*sum(dataframe$Column3)/nrow(dataframe)))/(sqrt((sum(dataframe$Column2*dataframe$Column2)-(sum(dataframe$Column2)^3)/nrow(dataframe))* (sum(dataframe$Column3*dataframe$Column3)-(sum(dataframe$Column3)^2)/nrow(dataframe))))

D)以上都不是

答案:(D)

在选项A中,corr是错误的函数写法。实际的计算相关性的函数写法是:cor。在选项B中,分母应该是标准差而不是方差。相似地,选项C中的公式是错误的。因此,选项D是正确选择。

14

ParameterStateValueDependents
AlphaActive502
BetaActive455
BetaPassive250
AlphaPassive210
AlphaPassive261
BetaActive302
BetaPassive180

以上为名为dataframe的变量。

上述数据集已经加载进了你的R运行空间中,变量名为“dataframe”,第一行代表列名称。以下哪个代码将仅选择参数为Alpha的行?

A) subset(dataframe, Parameter=’Alpha’)

B) subset(dataframe, Parameter==’Alpha’)

C) filter(dataframe,Parameter==’Alpha’)

D) B和C

E) 上面全部

答案:(D)

A选项中,应该用等值运算符取代赋值运算符,因此选项D正确。

15

以下哪个函数用于以电子表格格式观察数据集?

A) disp()

B) View()

C) seq()

D) 以上全部

答案:(B)

选项B是采用电子表格形式查看数据集的唯一选项。因此选项B是正确答案。

16

下面的数据表存储在一个名字为“data”的变量中。

AB
1Right
2Wrong
3Wrong
4Right
5Right
6Wrong
7Wrong
8Right

data

设定B是一个分类变量,我们需要为每一个分类级别画一个箱线图。以下哪一个命令能帮助我们实现这个功能?

A) boxplot(A,B,data=data)

B) boxplot(A~B,data=data)

C) boxplot(A|B,data=data)

D) 以上都不是

答案(B)

R中画箱线图的函数要求公式中要有分类因素,通过这些分类因素绘制不同的箱线图。因此选项B是正确的答案。

17

下面命令中的哪一个能把绘图窗口分成4×3的窗口?同时绘图逐列输入窗口。

A) par(split=c(4,3))

B) par(mfcol=c(4,3))

C) par(mfrow=c(4,3))

D) par(col=c(4,3))

答案:(B)

mfcol命令参数能保证图像逐列输入绘图窗口。因此,选项B是正确答案。

18

一个数据表变量 “df” 具有如下数据:

Dates

2017-02-28

2017-02-27

2017-02-26

2017-02-25

2017-02-24

2017-02-23

2017-02-22

2017-02-21

我们希望把它读取成如下格式:

28 Tuesday Feb 17

27 Monday Feb 17

26 Sunday Feb 17

25 Saturday Feb 17

24 Friday Feb 17

23 Thursday Feb 17

22 Wednesday Feb 17

21 Tuesday Feb 17

下面命令中的哪些(个)能产生期望的输出?

A) format(df,”%d %A %b %y”)

B) format(df,”%D %A %b %y”)

C) format(df,”%D %a %B %Y”)

D) 以上都不是

答案: (D)

以上的选项都不能产生期望的输出。因此选项D是正确答案。

19

下列哪个命令能将数据表“table”的第二列名称由alpha改成beta

A) colnames(table)[2]=’beta’

B) colnames(table)[which(colnames==’alpha’)]=’beta’

C) setnames(table,’alpha’,’beta’)

D) 以上所有

答案: (D)

上面的选项都是重命名数据表中列名称的不同方法,因此,选项D是正确答案。

20

R运行中的大部分工作都使用系统内存,如果同时采用大的数据集,当R的工作空间不能保证所有的R对象都保持在内存中时问题就出现了。在这样的情况下,移除无用的对象是一种解决方法。

下面命令中的哪个或哪些可以从工作空间中移除R对象或变量“santa”?

A) remove(santa)

B) rm(santa)

C) 上面全部

D) 都不是

答案 : (C)

remove 和 rm,都能用于清理工作空间。因此选项C是正确答案。

21

“dplyr”是R中最流行的工具包之一,它包括5个核心数据处理函数。下面选项中的哪一个不是dplyr中的核心函数?

A) select()

B) filter()

C) arrange()

D) summary()

答案: (D)

summary 是R语言基础工具包中的函数而不是dplyr中的函数。

22

在特征选择过程(feature selection)中使用下面的数据表(名称为table),列1和列2已经证明影响不显著。因此我们不会把这两个特性加入到我们的预测模型中。

Column1Column2Column3Column4Column5Column6
Name1Alpha1224540Alpha
Name2Beta1632511Beta
Name3Alpha52104320Gamma
Name4Beta3672841Delta
Name5Beta4590320Phi
Name6Alpha1224120Zeta
Name7Beta3264641Sigma
Name8Alpha4284540Mu
Name9Alpha56112311Eta

table

下面命令中的哪些(个)能选择“table”中列3到列6中的所有行?

A) dplyr::select(table,Column3:Column6)

B) table[,3:6]

C) subset(table,select=c(‘Column3’,’Column4’,’Column5’,’Column6’))

D) 以上全部

答案: (D)

选项A、B和C都是不同的选取列的方法,所以选项D是正确答案。

23

Column1Column2Column3Column4Column5Column6
Name1Alpha1224540Alpha
Name2Beta1632511Beta
Name3Alpha52104320Gamma
Name4Beta3672841Delta
Name5Beta4590320Phi
Name6Alpha1224120Zeta
Name7Beta3264641Sigma
Name8Alpha4284540Mu
Name9Alpha56112311Eta

以上为变量名为table的数据表。

下面哪个(些)命令会选取列1中带有“alpha”值的行,同时选取列4中数值小于50的项?这个数据表存储在名为“table”的变量中。

A) dplyr::filter(table,Column1==’Alpha’, Column4<50)

B) dplyr::filter(table,Column1==’Alpha’ & Column4<50)

C) 以上全部

D) 以上都不是

答案: (A)

dplyr中的filter函数使用“,”来添加条件,而不是“&”。因此,选项A是正确答案。

24

Column1Column2Column3Column4Column5Column6
Name1Alpha1224540Alpha
Name2Beta1632511Beta
Name3Alpha52104320Gamma
Name4Beta3672841Delta
Name5Beta4590320Phi
Name6Alpha1224120Zeta
Name7Beta3264641Sigma
Name8Alpha4284540Mu
Name9Alpha56112311Eta

以上为变量名为table的数据表。

下面代码中的哪些(个)能把数据表基于列2进行升序排列,同时对列3进行降序排列?

A) dplyr::arrange(table,desc(Column3),Column2)

B) table[order(-Column3,Column2),]

C) 以上全部

D) 以上都不是

答案: (C)

order和arrange函数都能用于在R中对列进行分类。因此选项C是正确答案。

25

处理字符串数据(string)是文本分析的一个重要组成部分,当创建参数符号或其它符号时,分割字符串经常是一项常用任务。下面命令行的输出是什么?

A<-paste("alpha","beta","gamma",sep=" " )

B<-paste("phi","theta","zeta",sep="")

parts<-strsplit(c(A,B),split=” ”)

parts[[1]][2]

A) alpha

B) beta

C) gamma

D) phi

E) theta

F) zeta

答案 : (B)

c(A.B) 将合并 A=”alpha beta gamma” 和 B=”phithetazeta” 并将其通过空格隔开。使用strsplit之后,之前合成的字符串会再次将A,B用空格隔开,分别生成两个list 。parts[[1]][2]命令旨在显示第一个list中的第二个元素,是“beta”。因此选项B是正确答案。

26

以下命令的输出是什么?

grepl(“neeraj”,c(“dheeraj”,”Neeraj”,”neeraj”,”is”,”NEERAJ”))

A) [FALSE TRUE TRUE FALSE TRUE]

B) [FALSE TRUE TRUE FALSE FALSE]

C) [FALSE FALSE TRUE FALSE FALSE]

D) None of the above

答案:(C)

上述命令将检测集合中的元素是否与前面的“neeraj”完全匹配,因此选项C是正确答案。

27

作为从事文本数据工作的数据科学家,我们有时会遇到这样一些情况,即发现某个不需要的单词多次出现。以下就是一个此类的字符串。

A<-c("I can use because thrice in a sentence because because is a special word.")

A) gsub(“because”,”since”,A)

B) sub(“because”,”since”,A)

C) regexec(“because”,”since”,A)

D) None of the above

答案:(A)

sub命令仅替换字符串中第一次出现的单词,而regexec将返回匹配的位置列表,如果没有匹配则返回-1。因此,选项A是正确答案。

28

28)想象一个通过以下代码创建的数据框。

以下哪个命令能够在这两列上帮助我们删除重复行?

A) df[!duplicated(df),]

B) unique(df)

C) dplyr::distinct(df)

D) All of the above

答案:(D)

上述所有答案都是基于这两列删除重复行的不同方法。因此,选项D是正确答案。

29

分组(grouping)是数据分析中的一项重要活动,它可以帮助我们发现一些有趣的趋势,这些趋势在原始数据中可能并不易被发现。

假设你有一个由以下代码行创建的数据集。

table<-data.table(foo=c("A","B","A","A","B","A"),bar=1:6)

以下哪个命令能帮我们计算出由foo变量分组的bar变量的平均值?

A) aggregate(bar~foo,table,mean)

B) table::df[,mean(bar),by=foo]

C) dplyr::table%>%group_by(foo)%>%summarize(mean=mean(bar))

D) All of the above

答案:(D)

所有上述方法都可用于计算列的分组统计值。因此,选项D是正确答案。

30

如果我有两组矢量x < - c(1,3,5)和y <-c(3,2),那么,cbind(x,y)将产生什么?

A)一个两列三行的矩阵

B)一个三列两行的矩阵

C)一个两列三行的数据框

D)一个三列两行的数据框

答案:(D)

上述所有选项定义的都是杂乱数据,因此选项D是正确答案。

31

下列哪一命令可以把以下名为maverick的数据框转换为下方显示的数据框?

输入数据 ——“maverick”

GradeMaleFemale
A1015
B2015
A3035

输出数据

GradeSexCount
AMale10
AFemale15
BMale30
BFemale15
AMale30
AFemale35

A) tidyr::Gather(maverick, Sex,Count,-Grade)

B) tidyr::spread(maverick, Sex,Count,-Grade)

C) tidyr::collect(maverick, Sex,Count,-Grade)

D) None of the above

答案:(A)

Spread命令是将行转换为列,而在tidyr包或基础包中没有collect这一命令。因此,选项A是正确答案。

32

下列哪一命令能帮助我们将下列矢量所有Delhi换成Delhi_NCR ?

C<-c(“Delhi is”,”a great city.”,”Delhi is also”,”the capital of India.”)

A) gsub(“Delhi”,”Delhi_NCR”,C)

B) sub(“Delhi”,”Delhi_NCR”,C)

C) Both of the above

D) None of the above

答案:(C)

虽然sub命令仅能替换第一次出现的模式,但在本情境下,字符串中只出现了一个Delhi。因此,在这种情况下,gsub和sub命令都有效。所以,选项C是正确答案。

33

创建一个表示另一变量是否有缺失值的特征数据,有时对于预测模型来说非常有用。

下方数据框中的某一列有缺失值。

Feature1Feature2
BNA
C30
D40
E50

以下哪个命令将创建一个名为“missing”、值为1的列,其中变量“Feature2”具有缺失值?

Feature1Feature2Missing
BNA1
C300
D400
E500

A)

dataframe$missing<-0

dataframe$Missing[is.na(dataframe$Feature2)]<-1

B)

dataframe$missing<-0

dataframe$Missing[which(is.na(dataframe$Feature2))]<-1

C) Both of the above

D) None of the above

答案:(C)

选项C是正确答案。

34

假设有2个数据框“A”和“B”。A有34行,B有46行。运行以下命令后,所得数据框的行数是多少?

merge(A,B,all.x=TRUE)

A) 46

B) 12

C) 34

D) 80

答案:(C)

all.x表示以A为基础进行合并,因此合并后的数据框将包含与A相同的行数。所以,选项C是正确答案。

35

加载数据集后,数据科学家通常做的第一件事就是明确数据集所包含的行数和列数。更专业地讲,这是了解数据集的维度。这样做是为了明确正在处理的数据规模,然后选择正确的技术和工具。

以下哪个命令不能帮我们查看数据集的维度?

A) dim()

B) str()

C) View()

D) None of the above

答案:(C)

View命令能够以类似电子表格的格式将数据集打印到控制台,但不能帮助我们查看数据集维度。因此,选项C是正确答案。

36

有时候,我们会遇到这样的情况,即一个数据集包含两列,而我们希望知道其中一列的哪些元素不存在于另一列中。这在R中使用setdiff命令很容易实现。

Column1Column2Column3Column4Column5Column6
Name1Alpha1224540Zion
Name2Beta1632511Beta
Name3Alpha52104320Gamma
Name4Beta3672841Delta
Name5Beta4590320Phi
Name6Alpha1224120Zeta
Name7Beta3264641Sigma
Name8Alpha4284540Mu
Name9Alpha56112311Eta

Dataframe

以下命令的输出是什么?

setdiff(dataframe$Column1,dataframe$Column6)==setdiff(dataframe$Column6,dataframe$Column1)

A) TRUE

B) FALSE

C) Can’t Say

答案:(B)

参数的顺序在setdiff函数中很重要。因此,选项B是正确答案。

37

下列数据集存储在一个名为“frame”的变量中。

AB
alpha100
beta120
gamma80
delta110

以下哪个命令可以为上述数据集创建条形图。使用B列中的值来表示条形图的高度。

A) ggplot(frame,aes(A,B))+geom_bar(stat=”identity”)

B) ggplot(frame,aes(A,B))+geom_bar(stat=”bin”)

C) ggplot(frame,aes(A,B))+geom_bar()

D) None of the above

答案:(A)

stat =“identity”将确保B列中的值成为条形图的高度。因此,选项A是正确答案。

38

Ampgcyldisphpdratwtqsecvsamgearcarb
Mazda RX421.061601103.902.62016.460144
Mazda RX4 Wag21.061601103.902.87517.020144
Datsun 71022.84108933.852.32018.611141
Hornet Drive21.462581103.083.21519.441031
Hornet Sportabout18.783601753.153.44017.020032
Valiant18.162251052.763.46020.221031

我们希望为cyl变量创建一个堆叠条形图,堆叠标准为“要素vs数量”。以下哪个命令将帮助我们执行此操作?

A)qplot(factor(cyl),data=mtcars,geom=”bar”,fill=factor(vs)

B) ggplot(mtcars,aes(factor(cyl),fill=factor(vs)))+geom_bar()

C) All of the above

D) None of the above

答案:(C)

选项A和B都将创建一个由“fill”参数引导的堆叠条形图。因此,选项C是正确答案。

39

39)命令paste(1:3,c(“x”,“y”,“z”),sep =“”)的输出是什么?

A) [1 2 3x y z]

B) [1:3x y z]

C) [1x 2y 3z]

D) None of the above

答案:(C)

40

R语言拥有丰富的资源,可以用来绘制非常高端的图表,很多时候你想保存图表以便向他人展示。那么,将你的图表保存为PDF文件便是这一种选择。

如果要将图表保存为PDF文件,下列哪项做法正确?

A) Construct the plot on the screen device and then copy it to a PDF file with dev.copy2pdf().

B) Construct the plot on the PNG device with png(), then copy it to a PDF with dev.copy2pdf().

C) Open the PostScript device with postscript(), construct the plot, then close the device with dev.off().

D) Open the screen device with quartz(), construct the plot, and then close the device with dev.off().

答案:(A)

首先在屏幕设备上创建图表,然后可以轻松地复制到pdf文件中。因此,选项A是正确答案。

结语

用以上的四十道题来检验自己R语言的编程能力吧!祝大家编程愉快,早日脱单!

原文链接:https://www.analyticsvidhya.com/blog/2017/05/40-questions-r-for-data-science/


、查企业查信用

1、信用中国

查询内容:工商注册企业和个人、行政许可和处罚

网址:http://www.creditchina.gov.cn/

2、全国企业信用信息公示

查询内容:全国企业工商登记注册信息

http://gsxt.saic.gov.cn/(导航)

http://gsxt.saic.gov.cn/zjgs/(总局)

3、信用导航

http://www.creditchina.gov.cn/toNavigation

4、企信宝

http://www.qixin.com/

5、企业信用信息查询APP

http://www.ixy360.com/

6、企查查

http://www.qichacha.com/

7、企业云数据征信中心

http://www.xinyong12315.com/

8、天眼查

http://www.tianyancha.com/

9、信用视界

http://www.x315.com/

全球企业信息

10、悉知

http://www.xizhi.com/

国内企业信息含联系方式经营范围

11、发改委信用信息查询

http://credit.ndrc.gov.cn/XYXX/admin_client/form_designer/ttt/index.html

12、重大税收违法案件信息

http://hd.chinatax.gov.cn/xxk/

13、进出口信用信息公示查询

http://credit.customs.gov.cn/

14、网站信用信息查询

http://www.itrust.org.cn/home/index/xy_search.html

15、建筑市场监管与诚信信息发布平台

http://www.mohurd.gov.cn/docmaap/

16、中国裁判文书网

http://wenshu.court.gov.cn/

17、全国法院被执行人信息查询

http://zhixing.court.gov.cn/search/

18、执行信息公开网

http://shixin.court.gov.cn/

19、北大法宝

http://www.pkulaw.cn/Case/

20、建筑企业查询

http://www.mohurd.gov.cn/wbdt/dwzzcx/index.html

工程设计、监理、建筑业企业、项目招标代理、城市规划、造价咨询、房地产开发企业

22、组织机构代码查询

http://www.nacao.org.cn/publish/main/5/index.html

23、工业产品生产许可获证企业查询

http://www.aqsiq.gov.cn/search/gyxkz/

24、域名信息备案管理系统

http://www.miitbeian.gov.cn/publish/query/indexFirst.action

http://whois.chinaz.com/

25、全国民间组织查询

http://www.chinanpo.gov.cn/search/searchOrgList.do?action=searchOrgList

二、政府信息公开查询

26、国务院各部门行政许可事项查询服务

http://spgk.scopsr.gov.cn/pages/sgyj/index1.jsp

27、交通运输部综合查询

http://www.moc.gov.cn/chaxunfuwu/

28、证监会信息公开

http://www.csrc.gov.cn/pub/zjhpublic/index.htm?channel=3300/3619

29、水利部综合查询

http://hd.chinatax.gov.cn/fagui/action/InitCredit.do

30、金农一期互联网应用系统

http://www.moa.gov.cn/jnyy/

31、财政部在线查询

http://www.mof.gov.cn/zaixianfuwu/zxcx/

32、人力资源保障部查询

http://www.mohrss.gov.cn/SYrlzyhshbzb/fwyd/zaixianchaxun/

33、国土资源公开公示

http://www.mlr.gov.cn/zwgk/

34、中国商品信息验证中心

http://www.china3-15.com/

35、国家兽药基础信息查询

http://sysjk.ivdc.org.cn:8081/cx/

36、海关总署综合查询

http://www.customs.gov.cn/publish/portal0/tab9372/

三、身份信息查询

37、国家职业资格证书查询

http://zscx.osta.org.cn/

38、国家职业能力证书查询

http://nlzs.osta.org.cn/

39、会计资格查询

http://60.208.116.167/pas/querycert.jsp

40、注册会计师查询

http://cmispub.cicpa.org.cn/cicpa2_web/public/query0/2/00.shtml

41、全国技工院校毕业证书查询

http://www.jxzs.mohrss.gov.cn/

42、国际证书查询

http://gjzs.osta.org.cn/

43、纳税人查询

http://hd.chinatax.gov.cn/fagui/action/InitCredit.do

44、交通部执业资格证书查询

http://www.jtzyzg.org.cn/common/zszxdt/index.html

45、船员证书查询

http://cyxx.msa.gov.cn/lycx/zslycx!init.action?flag=1

http://www.cnss.com.cn/index.php?m=resource&c=sailor_certificate

46、社保基金监督检查证查询

http://59.252.162.99/

47、人民银行征信中心

http://www.pbccrc.org.cn/

48、特种设备作业人员查询

http://hr.cnse.gov.cn/

49、执业医师查询

http://zgcx.nhfpc.gov.cn/doctorsearch.aspx

50、执业护士查询

http://zgcx.nhfpc.gov.cn/nursesearch.aspx

51、建筑执业查询

http://www.pqrc.org.cn/query.aspx

52、保险执业查询

http://iir.circ.gov.cn/

53、律师执业查询

http://chaxun.lawyercom.cn/

54、教师资格网

http://static.jszg.edu.cn/public/tongzhi.html

55、学历学籍查询

http://www.chsi.com.cn/xlcx/index.jsp

http://www.chsi.com.cn/xlcx/bgcx.jsp#学籍/学历在线验证?cata=2147438794

http://www.chsi.com.cn/xlcx/#高等教育学历证书查询?cata=2147438794

https://account.chsi.com.cn/passport/login?service=http%3A%2F%2Fmy.chsi.com.cn%2Farchive%2Fj_spring_cas_security_check#高等教育学籍查询?cata=2147438794

56、“三支一扶”大学生信息查询

http://szyf.chrm.gov.cn/default.aspx

57、证券从业人员查询

http://person.sac.net.cn/pages/registration/sac-publicity-report.html

58、银行业从业资格查询

http://www.ccbp.org.cn/chaxun/

59、造价员查询

http://zjybm.jianshe99.com/costweb/publichPortalLogin/view.do?op=goPublichPortalLoginInit

60、房地产估价师查询

http://xhzhglxt.cirea.org.cn/website/gjs_Iframe.asp

61、社保公积金医保查询

http://m.12333sb.com/

62、社保查询

http://wsfw.hs12333.gov.cn/

63、活佛查询系统

http://hf.tibet.cn/

四、驾驶员及车辆信息查询

64、驾驶证行驶证身份证查询

http://www.bitauto.com/weizhang/jiashizheng/suining.html

65、交通违章查询

http://www.weizhang8.cn/

http://chaxun.weizhang8.cn/guanfangwang.php

http://www.weizhangwang.com/

http://www.weizhangjilu.com/

http://wz.ieche.com/jtwz.asp

http://wz.ieche.com/

http://cha.chelink.com/

66、车险理赔系统网址

http://www.nia.net.cn/lp_service.asp

67、车险理赔信息查询系统

http://www.bjcxlp.com.cn/

五、查物品查资产

68、土地市场信息查询

http://www.landchina.com/

69、专利检索

http://www.sipo.gov.cn/zljsfl/

70、金马甲资产交易查询

http://www.jinmajia.com/xmjs/

71、淘宝司法拍卖

https://sf.taobao.com/

72、条码信息查询

http://www.ancc.org.cn/Service/queryTools/Barcode.aspx

73、中国物品编码中心

http://www.ancc.org.cn/

74、国际和国内船舶查询

http://www.ccs.org.cn/ccswz/font/fontAction!moudleIndex.do?moudleId=78

75、中国海事船舶查询系统

http://app.cnss.com.cn/sochuan.php

76、房产证查询

http://www.51zzl.com/rcsh/fcz.asp

77、土地证查询

http://www.51zzl.com/jinrong/tudizheng.asp

六、查物流

78、海关电子放行信息查询

http://edi.easipass.com/dataportal/q.do?qn=dp_query_letpas

79、快递物流查询

http://www.56888.net/comm/kuaidi.aspx

http://www.spb.gov.cn/yzbmcx/

http://www.ckd.cn/

七、查发票

80、友商发票查询

http://fapiao.youshang.com/

81、走114

各地查询链接

http://www.zou114.com/invoice/

82、114啦

各地查询链接

http://www.114la.com/other/fapiaozw.htm

83、在线查询网

http://fapiao.supfree.net/

友商数据接口在线查询

84、百度应用

百度搜索中输入:发票真伪查询

可进入查询应用

八、查金融

85、银行卡开户地查询

http://cha.yinhangkadata.com/

86、中国支付网

http://paynews.net/

银行卡bin查询、第三方支付机构查询

87、posp.cn

http://posp.cn/

联行号查询、银行卡归属地查询

88、爆料迷支付网

http://cha.baoliaomi.com/

联行号查询、支付牌照查询、二清pos查询、银行卡bin查询、mcc查询、收单机构号查询、pos代理商查询

89、全民114网

http://www.pplive114.com/

银行网点查询

90、ATM机网点查询网

http://www.atmji.com/

ATM机网点查询

91、中国银联ATM查询

http://www.unionpayintl.com/cn/serviceCenter/atmResult/

92、银行网点通

http://www.yhwdt.com/

行号查询、网点查询

93、爱查网

http://www.2cha.com/

银行卡归属地查询、手机归属地查询、ip查询

94、银行卡归属地批量查询

http://www.yinhangkadata.com/

银行卡归属地数据接口、银行卡归属地批量查询软件下载、银行卡归属地在线查询

95、posmcc

http://www.posmcc.com/

pos机商户代码查询

96、pos商户代码查询app下载

http://www.wandoujia.com/apps/com.uuwee.quickmcc

九、查手机

97、爱查(手机、银行卡归属地)

http://www.2cha.com/

98、虚拟运营商查询

http://17000.net.cn/

99、170手机归属地查询

http://www.im170.com/mobile.html

http://www.100170.net/

100、注册过哪些网站

http://www.zhaohuini.com/

101、基站查询

http://www.cellid.cn/

http://www.haoservice.com/freeLocation/

http://lbs.juhe.cn/cellmap/

http://www.minigps.net/cellsearch.html

http://www.cellmap.cn/page/webgsm2gps.aspx

102、经纬度查询

http://www.gpsspg.com/maps.htm

http://map.yanue.net/

http://www.gzhatu.com/jingweidu.html

103、果粉查询

http://www.guofenchaxun.com/iccid/

104、找果网

http://iccid.zhaoiphone.com/

105、果粉工具箱

http://iccidchaxun.com/

106、卡神查询

http://www.chaiccid.com/

107、手机串号IMEI查询

http://www.numberingplans.com/?page=analysis&sub=imeinr

http://www.imei.info/

http://www.imei8.net/

http://www.imeidb.com/

http://www.chalg.com/

http://www.samsung110.com/

http://www.chahtc.com/

十、查密码查开房查关系

108、查小米

http://mi.ckaifang.com/

109、sgk98

http://www.sgk98.com/

110、守夜人

http://www.shouyeren.org/

111、嗅密码

http://www.xiumima.com/

12、tasec

http://www.tasec.org/

113、华西安全网

http://cha.hx99.net/

114、听云

http://tingyun.org/

115、刑部11司

http://cop163.com/

116、QQ空间查看

http://www.qqxoo.com/

十一、采集搜索

117、搜索引擎大全

http://www.sowang.com/link.htm

117、特百度

http://www.tebaidu.com/

118、虫部落快搜

http://so.chongbuluo.com/

119、八爪鱼

http://www.bazhuayu.com/download

200、数多多

http://www.dataduoduo.com/?bzy=home

201、114搜索

http://www.114.org/

202、微信搜索

http://weixin.sogou.com/

203、伪基站检测软件下载

https://security.tencent.com/index.php/opensource/detail/10