Spring-batch简介.pdf

批处理技术是企业中应对大量数据处理需求的重要技术手段,尤其在数据量达到百万至亿级时,批处理成为一种高效的数据处理方式。批处理工作的特点包括数据量巨大、无需人工干预、基于系统配置自动完成,以及与时间相关性,如定期执行。在系统架构设计上,批处理应用需要重点考虑事务粒度、日志监控、执行和资源管理,特别是在并发环境下。从设计角度出发,应当考虑数据读写与业务处理的解耦,以及提高复用性和可测试性。 SpringBatch是SpringSource与Accenture合作开发的一个开源大数据量并行处理框架。它提供了丰富的参考经验,Accenture在工业级别的批处理架构上拥有丰富的经验,而SpringSource则基于深刻的Spring框架编程模型。SpringBatch主要关注批处理任务的事务、并发、监控和执行等,它本身不提供调度功能,如果需要实现任务的定期执行,可以与其他调度框架如Quartz结合使用。SpringBatch具有轻量级、稳健、并行处理的特点,并支持统一的接口管理和任务管理。 SpringBatch的结构可以分为三个重要的层次:应用层、核心层和基础架构层。应用层包含了所有的批处理作业,由Spring框架管理着程序员自定义的代码。核心层则包括了Batch启动和控制所需的核心类,例如JobLauncher、Job以及Step等。而基础架构层提供了通用的读写服务和额外服务,比如RetryTemplate重试模块,这被应用层和核心层使用。 SpringBatch流程主要由Job组成,Job相当于一个容器,里面包含了若干个Step。Step是Batch中的实际工作单元,负责数据的读取、处理和存储。JobLauncher用于启动Job,而JobRepository则提供了一个持久化机制,为JobLauncher、Job和Step实例提供CRUD操作。 在Step的执行过程中,数据通常是从数据库或文件中取出。read()操作每次读取一条记录,然后传给processor进行处理,这个过程一直重复,直到达到batch配置信息中定义的“commit-interval”设定值,此时会执行一次write操作。整个处理过程不断重复,直至所有数据处理完毕。一个Step完成后,它会跳转到下一个Step继续执行,或者结束整个Job。 SpringBatch的应用可以分为简单应用和高级应用。简单应用包括构建应用、对象定义、读写及处理接口的定义、任务定义以及任务执行等部分。高级应用则包括StepFlow介绍、批量操作数据库、Job多个Step的执行、条件流程和流程决策、并发处理以及监控等方面。 总结而言,SpringBatch是构建在Spring框架之上,用于大数据量并行处理的批处理框架。其主要关注点在于批处理任务执行的各个方面,比如事务管理、并发处理、执行流程以及监控。通过SpringBatch,开发者可以构建轻量级、健壮的并行处理应用,适合于处理大量数据且需要定期执行的任务。

























剩余28页未读,继续阅读

- 原来只是个小丑2020-05-07赞

- 粉丝: 0
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 互联医疗信息化解决方案医院微信公众平台服务.docx
- 网络管理系统安装配置.doc
- 水果网络营销方案.pptx
- 广西专业技术人员网络培训管理系统2013年低碳经济试题及答案98分通过.doc
- 立体仓库堆垛机控制系统安全操作规程样本.doc
- 网络游戏服务协议书范本.doc
- 项目软件测试方案(定稿).doc
- 网络安全复习题.doc
- 网络销售人员绩效考核.doc
- 工业和信息化局关于2022年度工作计划范文.doc
- 移动互联网技术课程设计报告.docx
- 行业门户网站推广方案.doc
- 制造型企业精益研发项目管理的研究.pdf
- 基于网络学习空间的小学数学智慧课堂教学策略研究.doc
- 第7讲matlab部分智能优化算法.ppt
- 四川建设工程项目管理.docx


