Task:物理图的节点。任务是工作的基本单元,由Flink的运行时执行。任务精确地封装运算符或运算符链的一个并行实例。Task是逻辑概念,一个Operator就代表一个Task(多个Operator被chain之后产生的新Operator算一个Operator)就是Flink作业计算时的算子 比如 map、keyBy等等。
(Node of a Physical Graph. A task is the basic unit of work, which is executed by Flink’s runtime. Tasks encapsulate exactly one parallel instance of an Operator or Operator Chain.)
Sub-Task:子任务是负责处理数据流分区的任务。术语“子任务”强调的是同一个操作符或操作符链有多个并行任务,即Task会按照并行度分成多个Subtask,Subtask是执行/调度的基本单元。Sub-Task可以理解成算子在运行时根据并行度设置而产生的运算算子实例,每个Subtask需要一个线程(Thread)来执行。不同Task的Sub-Task可能会被组合成Operator Chains,即组合成一个Sub-Task,然后到一个线程里执行。
(A Sub-Task is a Task responsible for processing a partition of the data stream. The term “Sub-Task” emphasizes that there are multiple parallel Tasks for the same Operator or