DolphinScheduler衍生内置参数怎么用
时间: 2025-04-30 20:47:16 浏览: 50
### DolphinScheduler 内置参数使用详解
#### 配置文件概述
DolphinScheduler 中的内置参数主要集中在 `conf` 目录下的多个配置文件中。这些配置文件用于定义系统的运行环境、数据库连接以及其他重要设置。
#### 数据库连接配置
对于数据库连接部分,在 `application.yaml` 文件中有详细的配置项[^2]:
```yaml
datasource:
driver-class-name: com.mysql.cj.jdbc.Driver
url: jdbc:mysql://bigdata01:3306/dolphinscheduler?useUnicode=true&characterEncoding=UTF-8&useSSL=false&allowPublicKeyRetrieval=true
username: dolphinscheduler
password: 123456
```
此段配置指定了 MySQL 数据库的相关信息,包括驱动类名称、URL、用户名和密码等。
#### 环境变量配置
为了支持不同类型的作业执行,如 Shell、Python 或 Spark 任务,可以通过编辑 `dolphinscheduler_env.sh` 来设定必要的环境变量[^3]。这允许用户自定义特定于每种工作负载所需的路径和其他依赖关系。
#### API Server 设置
API Servers 的地址可以在配置文件中指定为:
```properties
apiServers="ds1"
```
这一行告诉系统哪些节点作为 API server 运行,这对于分布式部署非常重要。
#### 参数传递机制
当创建流程实例时,可以利用预设的工作流模板来填充默认值或者动态传入外部参数给各个节点上的具体任务。例如,在编写 SQL 查询语句时可以直接引用 `${param}` 形式的占位符,并在实际调用前由平台自动替换为真实数据源中的相应字段值。
#### 示例代码片段展示如何向任务注入参数
假设有一个简单的 Python 脚本需要接收两个输入参数——日期范围(start_date 和 end_date),则可以在设计阶段预先声明这两个参数并将其映射到具体的业务逻辑处理函数上:
```python
def process_data(start_date, end_date):
print(f"Processing data from {start_date} to {end_date}")
if __name__ == "__main__":
import sys
start_date = sys.argv[1]
end_date = sys.argv[2]
process_data(start_date=start_date, end_date=end_date)
```
上述例子展示了怎样通过命令行参数的方式获取来自上游组件传输过来的信息,并据此调整下游操作的行为模式。
阅读全文
相关推荐

















