系统运维系列 之CSV文件读取时内容中包含逗号的处理方法

博客指出CSV文件默认以逗号分隔,若内容含逗号会导致分隔失败或数组下标匹配越界。给出两种处理方法,一是用正则表达式,二是使用第三方jar,还提供了相关参考资料链接。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

问题描述:
CSV文件默认逗号分隔,但是如果在内容中包含逗号,则会导致分隔失败或者数组下标匹配越界的问题。

处理方法:
(1)正则表达式

//(?=pattern)
//非获取匹配,正向肯定预查,在任何匹配pattern的字符串开始处匹配查找字符串,该匹配不需要获取供以后使用
//(?:pattern) 
//非获取匹配,匹配pattern但不获取匹配结果,不进行存储供以后使用。这在使用或字符“(|)”来组合一个模式的各个部分是很有用。例如“industr(?:y|ies)”就是一个比“industry|industries”更简略的表达式
//分割没有被双引号扩住的逗号
line.split(",(?=([^\"]*\"[^\"]*\")*[^\"]*$)")

(2)使用第三方jar

<dependency>
    <groupId>com.opencsv</groupId>
    <artifactId>opencsv</artifactId>
    <version>4.4</version>
</dependency>

参考资料:
https://blog.csdn.net/wls_2019/article/details/123225335 csv文件读写中的特殊情况(逗号)
https://www.cnblogs.com/allen2333/p/9835654.html 正则表达式 - (?!), (?😃, (?=)
https://blog.csdn.net/superbeyone/article/details/83624241 Java读取CSV文件(CSV文件数据内容包含逗号处理)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值