┃大数据技术┣ Spark的任务提交流程-物联网技术文章-傲云油气装备网

┃大数据技术┣ Spark的任务提交流程

日期：2020-10-13 浏览：88 评论：0

核心提示：1、通过Spark的脚本spark-submit初始化SparkContext2、初始化SparkContext会初始化两个非常重要的对象DAGScheduler和TaskScheduler3、当DAGScheduler和TaskScheduler创建成功后，会生成一个Application，注册到Master节点。Application中封装的是提交的各种参数（核数、内存等）以及所需要的的jar包。参考：./spark-submit --master xxx --executor-memeory xx

1、通过Spark的脚本spark-submit初始化SparkContext
2、初始化SparkContext会初始化两个非常重要的对象DAGScheduler和TaskScheduler
3、当DAGScheduler和TaskScheduler创建成功后，会生成一个Application，注册到Master节点。Application中封装的是提交的各种参数（核数、内存等）以及所需要的的jar包。参考：./spark-submit --master xxx --executor-memeory xx --total-executor-cores xx
4、Master在接收到Driver端提交过来的Application后，会通过资源调度计算Application需要的资源，并将任务发送到Worker节点
5、Worker收到Master发来的任务请求，会启动Executor，里面封装的是各种资源
6、当Worker内的Executor启动完成，并且成功床架线程池后，集群的准备工作完成。会向Driver端反向注册，准确的说是想TaskScheduler注册。至此，SparkContext的初始化完成
7、此时开始执行任务，我们代码中没每遇到一个Action算子，都会触发一个job
8、将job划分为多个stage，通过stage的划分算法，进行阶段划分
9、划分完stage后，会在stage的内部提交task，通过TaskSet将task提交给TaskSceduler
10、TaskSceduler在接收到任务后，会将task分发到不同Executor执行
11、在提交过程中中，内部会通过本地化级别，对任务进行级别划分，共有5种级别
12、TaskRunner执行Task，以FIFO的模式进行任务调度
13、Task内部，会将Task分为两种：上游Task(MapTask)和下游Task(ReduceTask)

打赏

所有权利归属于原作者，如文章来源标示错误或侵犯了您的权利请联系微信13520258486

更多>最近资讯中心

更多>最新资讯中心

0 条相关评论

• 基于FreeCAD的CAE数值仿真平台开发概述	• 超值！分布式系统架构精讲篇：知识图谱＋主流技
• 姐夫面试前半夜睡不着，居然躲在被子里偷偷看这	• 秋招Java岗成功斩获招商、字节、快手等Offer！
• 读书笔记-增量学习-Broad Learning System: An	• Redis使用RedisTemplate模板类的常用操作

• Esp8266天猫精灵_RGB灯_非点灯平台	• STM32F103 串口1和串口3对发数据配合蓝牙模块
• TMS570学习【1】了解什么是TMS570	• 新闻稿 \| Qt公司收购froglogic公司以巩固市场领
• [Java]SpringBoot2整合mqtt服务器EMQ实现消息订	• 苹果群控投屏同步操作原理及运用的平台APP分享

• Esp8266天猫精灵_RGB灯_非点灯平台	• STM32F103 串口1和串口3对发数据配合蓝牙模块
• TMS570学习【1】了解什么是TMS570	• 新闻稿 \| Qt公司收购froglogic公司以巩固市场领
• [Java]SpringBoot2整合mqtt服务器EMQ实现消息订	• 苹果群控投屏同步操作原理及运用的平台APP分享
• STM32查询式按键输入[直接用寄存器]	• Ubuntu系统 USB设备端口绑定
• 2021-04-14 第四次按键输入实验	• Flutter扫码功能完美实现