医疗Presto和GreenPlum选型测试报告

该测试报告显示,在医疗数据场景下,Presto在单大表查询和多表关联查询中表现出优于Oracle、Hive、SparkSQL和GreenPlum的性能。尤其是在数据量较大时,Presto的查询速度显著更快。测试建议Hive使用ORC格式存储数据以提升查询效率,并推荐在医疗场景中采用Presto结合Alluxio分布式缓存系统。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

注:数据尽可能模拟现场,环境亲手搭建,测试结果真实有效,转载请注明版权所有—作者:周源(网名 源神)

医疗Presto和GreenPlum选型测试报告

  1. 测试背景

本次测试针对现有Oracle(12c)、Hive(3.1.0)、SparkSQL(2.3.2)、Presto(0.229)、TiDB(3.0.8)、GreenPlum(6.1.0) 基础性能测试。我们采用单大表和多表关联,分别对比不同组件在查询性能方面的测试

模拟医疗现场患者数据和就诊记录,oracle表情况如下:

 

表名

行数

数据量

患者数据

ORG_PATIENT_INFO_BIG

158,220,288

10,048M

就诊记录1

INP_MR_PAGE_BIG1

44,083,200

24,230M

就诊记录2

INP_MR_PAGE_BIG2

88,166,400

48,460M

 注:因oracle存储磁盘空间有限,目前只创建3张大表数据

 

本次测试方案的大数据Ambari 2.7.3版本,操作系统为CentOS 7.4,基础硬件配置信息如下表:

服务器IP

服务器域名

核心数

内存

单块磁盘空间

**.**.**.8

host8

24

128G

279G

**.**.**.5

host5

40

128G

1.7T

**.**.**.6

host6

40

128G

1.7T

**.**.**.7

host7

40

128G

1.7T

 

Oracle部署信息:

服务器IP

服务器域名

核心数

内存

磁盘空间

**.**.**.46

host46

24

64G

251G

 

Hive部署信息:

服务器IP

服务器域名

Hive Metastore

HiveServer2

Hive Clients

**.**.**.5

host5

**.**.**.6

host6

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值