蚂蚁文库
换一换
首页 蚂蚁文库 > 资源分类 > PDF文档下载
 

2022-3 大数据分析师(初级)考前冲刺题A1卷

  • 资源ID:35187424       资源大小:35.55KB        全文页数:11页
  • 资源格式: PDF        下载权限:游客/注册会员    下载费用:5积分 【人民币5元】
快捷注册下载 游客一键下载
会员登录下载
三方登录下载: 微信快捷登录 QQ登录  
下载资源需要5积分 【人民币5元】
邮箱/手机:
温馨提示:
支付成功后,系统会自动生成账号(用户名和密码都是您填写的邮箱或者手机号),方便下次登录下载和查询订单;
支付方式: 微信支付    支付宝   
验证码:   换一换

 
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,既可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰   

2022-3 大数据分析师(初级)考前冲刺题A1卷

信息素养培训平台 2 0 2 2 . 3 大数据分析师(初级)考前冲刺题A 1卷 1. 【单选题】下面关于M a p Re d u c e 任务描述不正确的是()。 A 不同的M a p 任务之间不会进行通信 B 不同的Re d u c e 任务之间也不会发生任何信息交换 C M a p 需要考虑数据全局性 D 用户不能显式地从一台机器向另一台机器发送消息 正确答案C 答案解析在M a p Re d u c e 工作工作中 不同的M a p 任务之间不会进行通信。 不同的Re d u c e 任务之间也不会发生任何信息交换。 M a p 需要考虑数据局部性,Re d u c e 无需考虑数据局部性。 用户不能显式地从一台机器向另一台机器发送消息。 所有的数据交换都是通过M a p Re d u c e 框架自身去实现的。 2 . 【单选题】下列不适用于大数据图计算的产品是()。 A G r a p h X B Pr e g e l C Fl u m e D Po w e r G r a p h 正确答案C 答案解析Fl u m e 是实时采集工具。 3. 【单选题】利用Sq o o p 进行数据同步描述错误的是()。 A 将关系数据库数据导入H D FS B 将关系数据库数据导入H i v e C 将关系数据库数据导入H Ba s e D 将H D FS数据导入H i v e 正确答案D 答案解析Sq o o p 是一款开源的工具,主要用于在H a d o o p 与传统的关系数据库间进行数据的传递 4. 【单选题】散点图用于展示数据的相关性和分布关系,由X轴和Y轴两个变量组成。通过因变量(Y轴数值 随自变量 X轴 数值 变化的呈现数据的大致趋势,同时支持从类别和颜色两个维度观察数据的分布情况。散点图支持()坐标系。 A 一维 B 二维 C 三维 D 四维 正确答案B 答案解析散点图用于描述二维数据之间的关系。 5. 【单选题】下列属于图形数据库的是()。 A H Ba s e B M o n g o D B C Ne o 4J D O r a c l e 正确答案C 答案解析图数据库的相关产品包括Ne o 4J、O r i e n t D B、I n f o G r i d 、G r a p h D B等。 6 . 【单选题】哪种图形用于表示三维数据()。 A 饼图 B 散点图 C 折线图 D 气泡图 正确答案D 答案解析气泡图可以用气泡大小来表示第3维数据。 7 . 【单选题】下面关于虚荣指标和北极星指标的描述正确的是()。 A 注册用户数和活跃用户数都是虚荣指标 B 注册用户数和活跃用户数都是北极星指标 C 注册用户数是虚荣指标,活跃用户数是北极星指标 1 / 11 信息素养培训平台 D 注册用户数是北极星指标,活跃用户数是虚荣指标 正确答案C 答案解析注册用户数不能真实反映平台的使用情况,只有活跃用户数才能反映平台的使用情况。 8 . 【单选题】下列哪项不是M a p Re d u c e 执行过程中必需的()。 A 数据输入,对数据进行分片 B M a p 任务输出中间键值对 C Sh u f f l e 任务对数据进行合并 D Re d u c e 任务对数据进行汇总输出 正确答案C 答案解析M a p Re d u c e 执行过程中,c o m b i n e r 过程是可选的 9. 【单选题】Sp a r k 的部署模式中哪种不是集群部署模式()。 A 本地模式 B s t a n d a l o n e 模式 C s p a r k o n y a r n 模式 D m e s o s 模式 正确答案A 答案解析Sp a r k 应用程序在集群上部署运行时,可以由不同的组件为其提供资源管理调度服务(资源包括CPU 、内存等) 。比如,可以使用自带的独立集群管理器(s t a n d a l o n e ),或者使用YA RN,也可以使用M e s o s 。因此,Sp a r k 除了本地部署 外,包括三种不同类型的集群部署方式,包括s t a n d a l o n e 、Sp a r k o n M e s o s 和Sp a r k o n YA RN。 10 . 【单选题】下列哪项不能是Si n k 组件对应的目的地()。 A H Ba s e B H D FS C H i v e D JSO N 正确答案D 答案解析Si n k 组件对应的目的地可以是H Ba e s 、H D FS、H i v e 11. 【单选题】关于南丁格尔极区图的描述正确的是()。 A 用角度来表示数据量的大小 B 用半径来表示数据量的大小 C 用形状来表示数据量的大小 D 用颜色来表示数据量的大小 正确答案B 答案解析各个角度相同,半径不同,使用半径来表示数值的大小。 12 . 【单选题】“1-2 0 ”、“1-2 2 ”、“2 0 0 0 ”、“30 0 0 ”这些可能是可视化图形中的哪部分()。 A 坐标轴 B 刻度 C 图例 D 标题 正确答案B 答案解析这些都是具体数据,应该是刻度。 13. 【单选题】在数据压缩方法中,有损压缩具有()的特点。 A 压缩比小,可逆 B 压缩比大,可逆 C 压缩比小,不可逆 D 压缩比大,不可逆 正确答案D 答案解析压缩比大,不可逆 14. 【单选题】下列属于D D L语言的是()。 A SELECT B CREA T E C U PD A T E D I NSERT 2 / 11 信息素养培训平台 正确答案B 答案解析数据定义语言(D a t a D e f i n i t i o n La n g u a g e ,D D L)用于定义、修改、删除数据库对象,包括CREA T E,A LT ER ,D RO P,G RA NT ,REVO K E,A U D I T 和NO A U D I T 等 15. 【单选题】()是阿里云提供的一站式的机器学习解决方案平台。 A PA I B A n a l y t i c D B C M a x c o m p u t e D D a t a V 正确答案A 答案解析PA I 是阿里云提供的一站式的机器学习解决方案平台。 16 . 【单选题】下列不属于分布式存储技术的是()。 A H D FS B O r a c l e C G FS D H Ba s e 正确答案B 答案解析分布式存储技术包括H D FS、G FS、H b a s e 。 17 . 【单选题】信息技术的发展使得信息存储问题得以解决,是因为()。 A 存储设备容量大幅增加,价格上升 B 存储设备容量大幅增加,速度下降 C 存储设备容量大幅增加,速度提升,价格不断下降 D 存储设备容量大幅增加,速度不断提升,价格却在也不断上升 正确答案C 答案解析随着科

注意事项

本文(2022-3 大数据分析师(初级)考前冲刺题A1卷)为本站会员(资源共享家)主动上传,蚂蚁文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知蚂蚁文库(发送邮件至2303240369@qq.com或直接QQ联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们


网站客服QQ:2303240369

copyright@ 2017-2027 mayiwenku.com 

网站版权所有  智慧蚂蚁网络

经营许可证号:ICP备2024020385号



收起
展开