所有题目来自于【读芯术】课后测试
python处理文件
-
以下选项中,不是Python文件处理seek()方法的参数是
A. -1
B. 0
C. 1
D. 2
A -
以下选项中,不是Python对文件的打开模式的是
A. ‘+’
B. ‘w’
C. ‘c’
D. ‘r’
C -
下列不属于文件编码格式的是
A. ASCII码
B. Unicode
C. UTF-8
D. 十进制编码
D -
下列关于round()函数的表述,错误的是
A. round()函数只有一个参数时,返回一个整数,而且是最靠近的整数
B. 在Python版本2和3中round()函数处理结果是一致的
C. round()函数实现四舍五入和小数位保留,结果可能与预期不一样
D. 如果对四舍五入和小数位精度要求高,应避免使用round()函数
B -
下列关于Python输入函数input()表述,错误的是
A. input()函数接收一个标准输入数据,返回为字符串类型
B. input()函数在对纯数字输入时返回所输入的数字的类型(int,float)
C. input()函数接收字符串时无需用引号括起来
D. 使用input()函数时,要返回int型时使用int(input())
C
input() 在对待纯数字输入时具有自己的特性,它返回所输入的数字的类型( int, float )。
python操作excel
-
以下操作中,不属于正确操作Excel的是
A. 不需要获取WorkSheet对象就直接可以操作Cell(单元格)
B. 打开或者创建一个Excel需要创建一个Workbook对象
C. 获取一个表则需要先创建一个Workbook对象,然后使用该对象的方法来得到一个Worksheet对象
D. 如果要获取表中的数据,那么得到Worksheet对象以后再从中获取代表单元格的Cell对象
A -
以下不属于openpyxl库方法的是
A. load_workbook()
B. get_sheet_names()
C. get_shell()
D. create_sheet()
C -
下列关于安装,导入openpyxl扩展库的命令,错误的是
A. conda install openpyxl
B. pip install openpyxl
C. import openpyxl
D. import Workbook from openpyxl
D -
下列关于openpyxl扩展库的表述,错误的是
A. openpyxl可用于读取/写入xlsx/xlsm/xltx/xltm文件
B. 使用getter/setter模式,可以随时读取/修改某个单元格的内容
C. openpyxl读入文件时会忽略掉它所不支持的内容
D. openpyxl支持Excel 2003、2007及2010之后的版本
D -
下列关于Excel文件的表述,错误的是
A. 一个Excel文档称为一个工作簿(workbook),一个工作簿保存在扩展名为.xlsx的文件中
B. 每个工作簿只能包含一个表(worksheet)
C. 每个表都有一些列(地址是从A开始的字母)和一些行(地址是从1开始的数字)
D. 特定行和列确定的方格称为单元格(cell)
B
python自然语言处理
11. 以下关于TF-IDF的表述错误的是
A. TF-IDF是一种用于信息检索与数据挖掘的常用加权技术
B. TF是词频,指关键词在文中出现的次数除以全文总字数
C. IDF是逆文本频率指数,反映关键词的普遍程度
D. 当一个词在文档频率越高并且新鲜度高,其TF-IDF值越低
D
-
以下不属于jieba常用方法的是
A. jieba-cut
B. jieba.cut_for_search
C. jieba.cut_all
D. jieba.lcut
C -
下列关于jieba支持的分词模式的表述正确的是
A. 精确模式、全模式、搜索引擎模式
B. 精确模式、全模式、自定义模式
C. 全模式、自定义模式、繁体分词模式
D. 精确模式、自定义模式、搜索引擎模式
A -
下列不属于jieba分词库实现原理的表述是
A. 基于前缀词典实现高效的词图扫描,生成句子中汉子所有可能成词语情况所构成的有向无环图DAG
B. 在分词的同时进行句法、语义分析,利用句法信息和语义信息来处理歧义现象
C. 采用了动态规划查找最大概率路径,找出基于词频的最大切分组合
D. 对于未登陆词,采用了基于汉子成词能力的隐马尔科夫模型(HMM)模型,使用了Viterbi算法
B -
下列不属于常用中文分词方法的是
A. 基于字典、词库匹配的分词方法
B. 基于词频度统计的分词方法
C. 基于知识理解的分词方法
D. 基于单字语义的分词方法
D
解析:基于知识理解:通常包括三个部分:分词(用来获得有关词)、句法语义(利用句法和语义信息来对分词歧义进行判断)、总控。
python图像处理
以下参考解析Pillow库操作
-
下列不属于Pillow图像处理扩展库常用功能的是
A. 图像处理
B. 图像存储
C. 图像显示
D. 图片美颜
D -
下列不属于Pillow库Image类图像读取方法的是
A. Image.open
B. Image.new
C. Image.getsize
D. Image.frombytes
C -
Pillow库Image类生成图像缩略图的常用方法是
A. Image.thumbnail
B. Image.point
C. Image.verify
D. Image.newthumbnail
A -
以下不属于Pillow库ImageFilter类提供的过滤图像方法的是
A. Image.BLUR
B. Image.POINT
C. Image.CONTOUR
D. Image.SHARPEN
E. Image.SMOOTH
F. Image.EMBOOS
B -
Pillow库Image类处理图片的常用属性不包括
A. Image.color
B. Image.format
C. Image.mode
D. Image.size
E. Image.palette
A
Image.paletter:调色板属性
python之numpy库
-
不是ndarray对象数据统计方法的是
A. sum
B. add,sub
C. mean
D. min,max
E. cumsum.cumprod
B:sub -
以下不属于ndarray对象属性的是
A. size
B. shape
C. type
D. ndim
E. dtype
F. itemsize
C -
下列关于ndarray对象的表述错误的是
A. 不可修改ndarray对象的值
B. ndarray是用于存放同类型元素的多维数组
C. ndarray中的每个元素在内存中都有相同存储大小的区域
D. 可以对ndarray对象进行索引或切片
A -
numpy扩展库不适于的应用的是
A. 机器学习
B. 网站发布
C. 图像处理
D. 数学任务
B -
下列关于numpy扩展库的表述,错误的是
A. 包含一个强大的N维数组对象ndarray,具有矢量运算和复杂广播能力
B. 可用于对整租数据进行快速运算
C. 具有线性代数,随机数生成以及傅里叶变换等功能
D. 可集成由C#,Java语言编写的代码
D
解析:只有集合c++的工具包 -
以下关于numpy.linalg的矩阵运算函数的表述错误的是
A. trace函数计算对角线元素的和
B. solve函数可用来求解线性方程组
C. det函数计算矩阵行列式
D. inv函数计算矩阵的逆矩阵
D -
下列关于numpy库矩阵点积运算的表述错误的是
A. numpy.dot()函数计算两个数组的点集,即元素对应相乘
B. numpy.vdot()计算两个向量的积
C. 对于二维数组,numpy.dot()计算两个数组的矩阵乘积
D. numpy.vdot()计算两个矩阵对应元素乘积之和
B -
下列关于numpy矩阵的常用操作表述错误的是
A. matrix与ndarray可相互转换
B. np.T属性可以完成矩阵的转置
C. matrix矩阵可以通过*计算矩阵的乘法,通过+计算矩阵的加法
D. mean()函数可以求matrix矩阵元素的平均值
C -
下列关于numpy矩阵生成函数的表述,错误的是
A. numpy.matlib.empty()函数返回一个新的矩阵,而不初始化元素
B. numpy.matlib.zeros()函数创建一个以0填充的矩阵
C. numpy.matlib.eye()函数返回一个给定大小的单位矩阵
D. numpy.matlib.ones()函数创建一个以1填充的矩阵
E. numpy.matlib.rand()函数返回一个给定大小、数据随机填充的矩阵
C -
下列关于numpy库matrix与ndarray对象表述错误的是
A. matrix不属于array的分支,array的所有特性与matrix无关
B. np.asmatrix和np.asarray命令轻松的实现ndarray和matrix之间的转换
C. numpy中matrix的主要优势是:相对简单的乘法运算符号
D. matrix必须是2维的,但ndarrays可以是多维的
A -
DataFrame 不可以由以下哪个类型的数据构建
A. 一位数组、列表、字典或者Series字典
B. 一个Panel对象
C. 二位或者结构化的numpy.ndarray
D. 一个Series或者另一个DataFrame
B -
Pandas中使用的标准数据缺失标志是
A. NaN
B. Null
C. False
D. None
A. -
下列关于pandas库Series对象的创建方式表述,错误的是
A. 可使用Python集合创建
B. 可使用Python数组创建
C. 可使用numpy数组创建
D. 可使用python字典创建
A
解析:集合无序 -
下列不属于pandas库常用数据结构的是
A. Series
B. DataFrame
C. Panel
D. Matrix
D -
下列关于pandas扩展库的表述错误的是
A. pandas基于numpy可以解决数据分析任务
B. pandas包含大量库和标准数据模型,可高效的操作大型数据集
C. pandas支持智能语音识别
D. pandas支持时间序列分析
C -
以下不属于pandas常用排序方法是
A. 按元素排序
B. 按索引排序
C. 按数值排序
D. 按行或列排序
A -
下列不属于pandas库缺失数据处理方法的是
A. copy()
B. fillna()
C. dropna()
D. replace()
A -
下列不可以用来遍历pandas库DataFrame的行的函数是
A. iteritems():迭代(key,value)对
B. iterrows():将行迭代为(索引,系列)时
C. iterindex():按索引迭代来遍历行
D. itertuples():以namedtuples的形式迭代行
C -
下列关于pandas库统计方法作用的表述,错误的是
A. count()计算非空数据的数量
B. prod()计算累计乘积
C. mean()计算所有值的平均值
D. abs()计算绝对值
B -
下列关于pandas库数据读取与写入方法中,错误的是
A. read_csv,to_csv
B. read_jason,to_json
C. read_excel,to_excel
D. read_mysql,to_mysql
D
python绘图
-
以下关于plot函数绘图对象属性的说法错误的是
A. xlabel/ylabel:设置X轴/Y轴的文字
B. ylim:设置x轴的范围
C. title:设置图标的标题
D. legend:图例图示
B
B -
以下关于plot函数参数的描述错误的是
A. x:x轴数据,列表或数组,可选
B. y:y轴数据,列表或数据
C. format_string:控制曲线的格式字符串,必选参数,如红色圆点用’ho’表示
D. 当绘制多条曲线时,各条曲线的x可以忽略
C:‘ro’ -
在使用Jupyter Notebook环境绘图时,可用来将matplotlib绘制的图形嵌入当前页面的魔术命令的是
A. %matplotlib inline
B. import matplotlib
C. %use matplotlib
D. %matplotlib.pyplot.show
A -
下列图形中不可能使用matplotlib扩展库绘制的是
A. 散点图
B. 流程图
C. 柱状图
D. 饼状图
B -
下列关于matplotlib扩展库的表述,错误的是
A. 是python最著名的绘图库
B. 提供和matlab相似的命令API,十分适合交互式地进行绘图
C. matplotlib.plot是绘制可视化图形的命令字库
D. Matplotlib库由各种可视化类构成,内部结构复杂
C:matplotlib.pyplot是绘制各类可视化图形的命令子库。
C:matplotlib.pyplot -
下列绘图函数marker参数取值的表述,错误的是
A. ‘v’:下三角
B. ‘>’:右三角
C. ‘s’:正方形
D. ‘5’:五角星
D -
以下关于scatter函数的描述错误的是
A. 绘制散点时,设定散点大小需要用到s参数
B. 绘制散点时,设定散点形状为▲需要设置参数marker=‘r^’
C. 绘制多组数据的散点图时,需要多次调用scatter()函数
D. 图例方法legend()中loc参数可以指定图例的位置
B -
下列有关散点图绘制函数scatter(x,y,s,c,marker,alpha)的参数解释,错误的是
A. x,y表示散点坐标
B, c指散点的面积
C. marker指散点得标记
D. alpha指散点的透明度
B -
下列有关折线图绘制的表述错误的是
A. 多次使用matplotlib库的plot函数绘制出来多条折线
B. 使用plt.legend()函数可以设置图例
C. plt.label()可以设置坐标图标识信息
D. 若图名称,图像等信息中出现中文需要指定中文字体,防止乱码
C
plt.xlabel()或者plt.ylabel() -
折线图要求线段绿色虚线,以下哪种参数设置是正确的
A. ‘g-’
B. ‘g:’
C. ‘g.-’
D. ‘g–’
D
'.-'是虚点图 -
以下关于饼状图的表述错误的是
A. 饼状图显示一个系列中各项的大小与各项总和的比例
B. 绘制数组x的饼图,每个扇区的面积由x/sum(x)决定
C. 若sum(x)<1时,全自动填充1-sum(x)的空扇区
D. 若sum(x)>1,则由x[i]/sum(i)算出每一个扇区占比,饼状图360°区域均被填充
C
不会自动填补,会出现楔形图形 -
下列关于饼状图绘制函数pie(x,explode,labels,colors,autopct,pctdistance,shadow,label,distance,startangle,radius)的表述,错误的是
A. x:绘制饼状图的列表型数据
B. explode:列表型参数,指定某一个或多个扇形离开中心位置的距离
C. labels:列表型数据,每个扇形增加标签
D. colors:必选参数,指定每个扇区的颜色,不可省略
D -
下列表述,错误的是
A. bar()函数color参数值个数不可以小于数据列表大小
B. barh()函数用来绘制横向条形图
C. 绘制堆叠柱状图时,需要设定bar()函数的bottom参数
D. 绘制并列柱状图时,第二组数据开始需要将bar()函数的x参数逐个加上柱状图的宽度数据
A -
下列关于柱状图绘制函数bar(x,height,width,*,align,**kwargs)可选参数的表述,错误的是
A. color:柱子的颜色,可设一个值,也可以是列表
B. tick_label:柱子显示的标签
C. linewidth:柱子边框宽度
D. edgecolor:柱子边框颜色,若未设置该参数,柱子边框颜色为白色
E. x:所有柱子的下标的列表
F. align:柱子对齐方式,默认为edge
G. heigh:柱子高度
H. width:柱子宽度
D,F
默认无颜色、默认为center -
下列函数中,不可以绘制三维图形的是
A. p3d.Axes3D.plot_surface()
B. p3d.Axes3D.scatter()
C. p3d.Axes3D.bar3d()
D. p3d.Axes3D.barh()
D -
以下导入/声明绘制三维图形的语句错误的是
A. from mpl_toolkits.mplot3d import Aex3D
B. import * from matplotlib.3D
C. ax = fig.gca(projection=‘3d’)
D. ax = plt.subplot(111,projection=‘3d’)
B -
以下有关雷达图绘制函数polar(theta,r,**kwargs),错误的是
A. theta:指极角
B. r:极径
C. polar()函数接收theta和r参数的列表或数组大小应该一致
D. polar()绘制闭合曲线时不需要多增加数据对(theta,r)
D -
下列关于极坐标的表述,错误的是
A. 极点:以圆的中心作为极点
B. 极角:以Ox正方向开始计算角度(通常取顺时针方向)
C. 极轴:以0度的方向引一条射线Ox
D. 极径:长度单位r
B
通常取逆时针 -
下列关于雷达图的表述,错误的是
A. 雷达图可很好刻画出某些指标横向或纵向对比关系
B. 雷达图常用于对多项指标的全面分析
C. matplotlib模块中可以通过极坐标方式绘制雷达图
D. 可以直接使用matplotlib库函数来绘制雷达图
D -
以下不属于常用机器学习分类算法的是
A. 多项式回归
B. KNN
C. 决策树
D. 朴素贝叶斯
E. 支持向量机 -
以下不属于分类问题的是
A. 评估贷款是否批准
B. 判定邮件是否为垃圾邮件
C. 判定肿瘤是否为良性
D. 预测未来房价预测 -
以下关于有各种机器学习的描述错误的是
A. 有监督学习:对有标记的训练样本进行学习,以尽可能对训练样本集外的数据进行分类预测
B. 无监督学习:对有标记的样本进行训练学习,比发现这些样本中的结构知识
C. 半监督学习:训练数据有部分被标识,部分没有被标识
D. 强化学习:通过试错来发现最优行为策略
B
无监督学习是对无标记的样本进行训练学习 -
以下关于机器学习分类的表述,正确的是
A. 监督学习,强化学习,深度学习
B. 监督学习,无监督学习,半监督学习,强化学习
C. 强化学习,深度学习
D. 深度学习,监督学习,无监督学习
B -
机器学习主要聚焦的两个问题是
A. 分类、回归
B. 学习、分类
C. 学习、回归
D. 回归、预测
A -
以下关于Scikit-learn库的朴素贝叶斯方法描述错误的是
A. 朴素贝叶斯计算属于每个类的概率并取概率最小的类作为预测类
B. sk库中实现了三个朴素贝叶斯分类器,分别是:GaussianNB,MultinomialNB,BernoulliNB
C. MultinomialNB用于处理多多项离散数据集,可用于文本分类
D. BernoulliNB用于处理根据multivariate Bernoulli离散的训练和分类数据
A
选取概率最大的 -
以下Scikit-learn中最近邻算法模块的描述错误的是
A. 最近邻算法只能用于监督学习
B. 监督的最邻近学习分为最近邻分类和最近邻回归
C. 有两种最近邻分类:KNeighborsClassifier和RadiusNeighborsRegressor
D. 有两种最近邻回归:KNeighborsRegress和RadiusNeighborsRegressor
A -
以下关于Scikit-learn库功能的描述错误的是
A. Scikit-learn实现的分类算法包括:支持向量机(SVM),最近邻,逻辑回归,随机森林,决策树及多层感知器(MLP)神经网络等
B. Scikit-learn已经实现的回归算法包括:支持向量回归(SVR),脊回归,Lasso回归,弹性网络(Elastic Net),最小角回归(LARS),贝叶斯回归等
C. 数据预处理是指数据的特征提取和归一化,该环节在机器学习中随时进行,不必首先进行数据预处理
D. Scikit-learn已经实现的聚类算法包括:k-均值聚类,谱聚类,均值偏移,分层聚类,DBSCAN聚类等
C -
Sckit-learn库提供的数据集的描述错误的是
A. 鸢尾花数据集,调用方式为load_iris(),常用于分类任务
B. 波士顿房价数据集,调用方式为load_boston(),常用于回归任务
C. 乳腺癌数据集,调用方式为load_breast_cancer(),常用于二分类任务
D. 体能训练数据集,调用方式为load_diabetes(),常用于多变量回归任务
D
糖尿病的 -
下列使用Scikit-learn库进行机器学习的流程表述,错误的是
A. 首先检查数据样本量,如果小于50建议收集更多的数据
B. 如果是预测种类且数据带标签,则为无监督机器学习
C. 如果训练数据无根据,则为聚类任务
D. 如果预测数据,则为回归任务,如果为更好地预测数据,则为数据降维任务
B -
进行相关分析时,假定的两个变量
A. 都不是随机变量
B. 都是随机变量
C. 一个是随机变量,一个不是随机变量
D. 随机或非随机都可以
B -
以下回归分析步骤正确的是
A. 建立模型、确定变量、预测、计算误差
B. 建立模型、预测、确定变量、计算误差
C. 确定变量、建立模型、预测、计算误差
D. 确定变量、计算误差、建立模型、预测
C -
下列回归分析中定义的自变量和因变量分析正确的是
A. 自变量和因变量都是随机变量
B. 自变量为非随机模型,因变量是随机变量
C. 自变量和因变量都是非随机变量
D. 自变量为随机变量,因变量是非随机变量
B -
下列关于回归的说法正确的是
A. 回归分析就是研究两个相关时间的独立性
B. 回归模型都是确定性的函数
C. 回归模型都是线性的
D. 回归分析就是通过分析、判断、确定相关变量之间的内在的关系的一种统计方法
D -
下列两个变量的关系中,哪个是函数关系
A. 学生性别与他的数学成绩
B. 人的工作环境与健康状况
C. 儿童身高与父亲身高
D. 正三角形边长与面积
D -
Scikit-learn库中实现的四种贝叶斯分类器分别是
A. 朴素贝叶斯、TAN、BAN、GBN
B. 朴素贝叶斯、HAN、BAN、GBN
C. 朴素贝叶斯、TAN、CAN、GBN
D. 朴素贝叶斯、TAN、BAN、DBN
A -
以下关于朴素贝叶斯分类思想描述错误的是
A. 将所有特征的取值看成已经发生的事件
B. 将因变量属于某个分类也看成所有特征出现条件下的概率时间去判断,将分类问题转换为计算Xi出现的情况
C. 在假设特征变量之间均独立的前提下,根据概率论的知识,计算Yi在Xi发生时的条件概率为Xi和Yi同时发生的概率除以Xi独立概率,即P(Yi|Xi)=P(Xi|Yi)*P(Yi)/P(Xi)
D. 给定的待分类项X{a1,a2,…,an},求解在此项出现条件下各个类别yi出现的概率,哪个P(Yi|X)最小,就把此待分类项归属哪个类别
D -
下列不属于分类算法的是
A. k近邻
B. 朴素贝叶斯
C. 决策树
D. 线性回归
B -
下列分类流程正确的是
A. 特征提取、特征选择、建立分类器、分类
B. 建立分类器、特征选择、特征提取、分类
C. 特征选择、建立分类器、分类、特征提取
D. 特征提取、建立分类器、分类、特征提取
A -
下列关于分类与聚类的描述,错误的是
A. 分类属于监督学习
B. 聚类属于无监督学习
C. 分类数据类别未知
D. 聚类数据类别未知
C