利用Python读取文件独特行数

甯公子_

已于 2025-02-08 10:36:19 修改

阅读量425

点赞数 7

CC 4.0 BY-SA版权

分类专栏： Python入门程序文章标签： python 开发语言

于 2025-02-08 10:32:39 首次发布

本文链接：https://blog.csdn.net/Picky888/article/details/145510027

文件独特行数指的是文件中不重复的行的数量。统计文件独特行数是一个常见的需求，尤其是在处理日志文件、数据集或文本文件时。

以下是使用 Python 实现统计文件独特行数的方法：

方法 1：使用集合（Set）

集合（Set）是一种无序且不重复的数据结构，非常适合用来统计独特行数。

代码实现

def count_unique_lines(file_path):
    unique_lines = set()  # 用集合存储独特行
    with open(file_path, 'r', encoding='utf-8') as f:
        for line in f:
            unique_lines.add(line.strip())  # 去除换行符并添加到集合
    return len(unique_lines)  # 返回独特行数

# 示例调用
file_path = 'example.txt'
unique_count = count_unique_lines(file_path)
print(f"文件 '{file_path}' 中的独特行数为: {unique_count}")

优点

代码简洁，易于理解。
集合自动去重，无需额外处理。

缺点

如果文件非常大，集合可能会占用较多内存。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

甯公子_

关注关注

7
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

专栏目录

从文件批处理来看Python的优点（Python vs Swift vs Rust）

11-27

1112

总体而言，选择哪种语言取决于具体的应用场景和需求。如果追求快速开发、代码简洁且对性能要求不是特别高，Python是不错的选择；若主要在苹果生态环境下工作，注重代码安全性和较好的性能，Swift比较合适；而当需要高性能、内存安全以及可能涉及复杂并发处理的文件操作场景时，Rust则更具优势。在实际使用这些代码时，建议先在测试环境下对少量文件进行操作，确保功能符合预期后，再应用到实际有大量文件需要处理的场景中，以免出现意外的数据丢失或错误的重命名情况。的文件名称批处理修改（添加序号）的示例代码。

python:文件独特行数

weixin_50037251的博客

09-01

348

参与评论您还未登录，请先登录后发表或查看评论

python语言程序设计——文件独特行数

菲茨的博客

09-19

470

对《python语言程序设计》第7周的练习题——文件独特行数，参考答案的理解补充笔记

Python文件独特行数

m0_48943438的博客

05-04

1053

统计附件文件中与其他任何其他行都不同的行的数量，即独特行的数量

python例题——文件独特行数

panlan7的博客

04-11

1773

统计附件文件中与其他任何其他行都不同的行的数量，即独特行的数量。【参考代码】 f = open("latex.log") ls = f.readlines() s = set(ls) for i in s: ls.remove(i) t = set(ls) print("共{}独特行".format(len(s)-len(t))) 记住：如果需要"去重"功能，请使用集合类型。 ls.remove()可以去掉某一个元素，如果该行是独特行，去掉该元素后将不在集合t中出现。例题来源：p

python简易应用：去掉重复的项

最新发布

weixin_62598385的博客

09-30

719

This Python script reads data from a text file, removes duplicate IP addresses and domain names, and writes the unique entries into a new file. The input data is assumed to be separated by " , " (a space, comma, and space). The script defines a `remove_dup

【Python数据分析】Pandas_文件读写操作

qq_45951891的博客

06-17

535

在 CSV 文件中指定了一个列，然后使用index_col可以实现自定义索引。

python爬取aspx数据_如何利用Python爬取网站数据？

weixin_36276256的博客

02-04

1248

1.基本方法其实用python爬取网页很简单，只有简单的几句话这样就可以获得到页面的内容。接下来再用正则匹配去匹配所需要的内容就行了。但是，真正要做起来，就会有各种各样的细节问题。2.登录这是一个需要登录认证的网站。也不太难，只要导入cookielib和urllib库就行。这样就装载进一个cookie，用urlOpener去open登录以后就可以记住信息。3.断线重连如果只是做到上面的程度，不对o...

文件夹内统计行数文件夹内统计行数

07-20

在编程语言层面，如Python，我们可以使用内置的`os`和`glob`模块来遍历文件夹，再利用`open()`函数读取文件，并用`readlines()`方法获取所有行。例如： ```python import os import glob total_lines = 0 for file...

PTA9文件操作(python3)

weixin_46487304的博客

06-05

6162

python程序设计09-文件操作9-1 从文件中查找最长的单词（20分，请勿修改） (20 分)9-2 求文件行数 (20 分)9-3 analyze the character distribution of a document (20 分) 我找不着要补的题了……，如果有看到我的哪篇PTA有题目但是答案没有，请告诉我，谢谢哦。 9-1 从文件中查找最长的单词（20分，请勿修改） (20 分) data.txt中保存有若干个单词，每个单词一行。请编写一个程序从文件中将所有单词读出，找到其中最长的单词，

python文件独特行数_python——文件和数据格式化练习题：文件独特行数

weixin_39845613的博客

11-29

555

描述统计附件文件中与其他任何其他行都不同的行的数量，即独特行的数量。问题分析这道题是python123课程里面的一道题，我先说一下我的分析过程：要实现问题找到不同行数，那就要用每一行分别和出它以外剩余所有行比较，然后如果剩余所有行中有和它相同的行，那么它就不是独特行，需要跳过。代码f=open("latex.log","r")f1=f.readlines() #建立一个列表，文件的每一行就是列表的...

python文件独特行数_python 计算一个文件行数的简单示例

weixin_39589557的博客

11-29

219

这篇文章主要为大家详细介绍了python 计算一个文件行数的简单示例，具有一定的参考价值，可以用来参考一下。对python这个高级语言感兴趣的小伙伴，下面一起跟随512笔记的小编两巴掌来看看吧！python可以统计文件的行数，你相信吗？不管你信不信反正我信了。下面我们来看一下python怎样统计文件的行数，代码很简单，我也做了注释，很简单的实现。。。# @param 用python脚本计算某一个文...

python 统计文件行数

热门推荐

仗剑天涯

08-30

2万+

python 统计文件函数

python练习题（3）：文件字符分布，文件独特行数

clyuan1996的博客

07-18

5358

python练习题（3）：文件字符分布，文件独特行数

【Python 123】文件独特行数

记录专业模型开发、算法程序设计、软件学习笔记、生活日志。

12-22

1652

描述统计附件文件中与其他任何其他行都不同的行的数量，即独特行的数量。输入输出示例附件见附录代码 fo = open("latex.log", encoding="utf-8") lines = fo.readlines() fo.close() count = 0 counts = {} for line in lines: counts[line] = counts.get(...

python——文件和数据格式化练习题：文件独特行数

PigeonKiing的博客

10-24

2916

描述统计附件文件中与其他任何其他行都不同的行的数量，即独特行的数量。问题分析这道题是python123课程里面的一道题，我先说一下我的分析过程：要实现问题找到不同行数，那就要用每一行分别和出它以外剩余所有行比较，然后如果剩余所有行中有和它相同的行，那么它就不是独特行，需要跳过。代码 f=open("latex.log","r") f1=f.readlines() #建立一个列表，文件的每...

文件独特行数问题

xiaowuke的博客

01-03

1643

@Python学习文件和数据格式化文件独特行数问题问题：统计附件文件中与其他任何其他行都不同的行的数量，即独特行的数量。我的思路：读入文件，设置一个字典，键为每行内容，值为出现次数，通过for循环遍历，使用dic[i] = dic.get(i, 0) + 1来实现内容出现次数的统计，最后遍历筛选，统计出现次数为一次的行数。实现代码： f = open('latex.log', "r", encoding = 'utf-8') dic = {} for i in f: dic[i] = d

Python读取文件行数

我壮着胆子再问一遍冬雪枫花

07-16

7087

直接调用readlines函数接口： #encoding=utf-8 #文件比较小 count=len(open(r"train.data",'rU').readlines()) print(count) 借助循环计算文件行数： #文件比较大 count=-1 for count, line in enumerate(open(r"train.data",'rU')): count+=...

python123文件独特行数

05-10

我不太明白您的问题是什么，但是如果您是在问如何统计 Python 代码文件中不同行数的数量，您可以使用以下 Python 代码来做到这一点： ```python def count_lines(file_path): with open(file_path, 'r') as f: lines = f.readlines() return len(lines) def count_unique_lines(file_path): with open(file_path, 'r') as f: lines = f.readlines() unique_lines = set(lines) return len(unique_lines) file_path = 'python123.py' total_lines = count_lines(file_path) unique_lines = count_unique_lines(file_path) print(f'Total lines: {total_lines}') print(f'Unique lines: {unique_lines}') ``` 这个代码中，`count_lines` 函数用来统计文件中的总行数，而 `count_unique_lines` 函数用来统计文件中不同行数的数量。您只需要将 `file_path` 变量设置为您要统计的文件路径即可。