Azkaban失败重试

1
2
3
4
5
6
7
8
9
10
11
12
# 自动失败重试
nodes:
- name: jobA
type: command
config:
command: sh /not exists.sh
retries: 3
retry.backoff: 10000

# 参数说明:
# retries: 重试次数
# retry.backoff: 重试的时间间隔
1
2
3
4
5
6
# 手动失败重试
# 理想的就是从成功的地方跳过,失败的地方重试
# 需求:JobA => JobB(依赖于A) => JobC => JobD => JobE => JobF。生产环境中,任何Job都有可能挂掉,可以根据需求执行想要的Job
# 直接从webui操作
# 1.history->flow->Prepare execution->execute
# 2.就是从头开始,但是把成功的disable就可以了