
Pyhton数据分析
文章平均质量分 95
零基础学习Python数据分析,从Python基础到案例分析
艾派森
【商务合作vx:zxb_1222】CSDN内容合伙人、新星导师、大数据分析领域优质创作者、阿里云社区专家博主,热爱python(昵称的由来),专注于数据分析、数据挖掘,持续分享学习笔记,感谢关注与支持。专栏【大数据分析案例合集】,感兴趣的小伙伴速速订阅!接Python爬虫、数据分析、数据挖掘、机器学习等相关课程设计作业/毕设,有需求请私信我!需要领取博文代码、数据集、学习资料、进粉丝交流群、的小伙伴点击了解:https://bbs.csdn.net/topics/614636587
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
情感分析预训练模型之multilingual-sentiment-analysis
multilingual-sentiment-analysis是由tabularisai团队基于distilbert/distilbert-base-multilingual-cased模型做的一个多语言情感分析模型,发布于2024年12月,该模型支持英语和中文等多种语言。该模型将情感分为了五个等级,即 (Very Negative, Negative, Neutral, Positive, Very Positive)主要可用于 :社交媒体分析客户反馈分析商品评论分类品牌监控市场调研原创 2025-07-26 10:55:08 · 5252 阅读 · 28 评论 -
数据挖掘实战-基于逻辑回归算法的结直肠癌生存预测模型
本实验数据集来源于Kaggle,原始数据集共有167497条数据,28个变量。该数据集包含来自不同国家的结直肠癌病例的真实信息。其中包括患者人口统计、生活方式风险、病史、癌症分期、治疗类型、生存机会和医疗费用。该数据集跟踪结直肠癌发病率、死亡率和预防的全球趋势。使用该数据集可建立癌症预测、生存分析、医疗保健成本估算和疾病风险因素的模型。数据集结构每一行代表一个个案,列包括:患者 ID(唯一标识符)国家/地区(基于发病率分布)年龄(遵循结直肠癌年龄趋势)原创 2025-07-19 10:12:14 · 4685 阅读 · 32 评论 -
【论文复现】在线健康社区重大慢病患者负面评论倾向的关键影响因素分析
1]王辉,王晓玉,李卫东,等.在线健康社区重大慢病患者负面评论倾向的关键影响因素分析[J].情报科学,2024,42(06):12-20+28.本次论文技术复现只是做了部分复现,如爬虫、情感分析和BERTopic模型分析。复现的内容并不完整!如需源码或数据集请关注公主号【派森小木屋】!原创 2025-07-12 10:36:02 · 7574 阅读 · 23 评论 -
数据挖掘实战-基于机器学习算法的空气质量预测模型
本实验数据集来源于Kaggle,该数据集重点关注各地区的空气质量评估。数据集包含5000个样本,并捕获了影响污染水平的关键环境和人口因素。Temperature(°C):该地区的平均温度。Humidity(%):该地区记录的相对湿度。PM2.5浓度(µg/m³):细颗粒物水平。PM10浓度(µg/m³):粗颗粒物水平。NO2浓度(ppb):二氧化氮水平。SO2浓度(ppb):二氧化硫水平。CO浓度(ppm):一氧化碳水平。原创 2025-07-07 17:06:34 · 8825 阅读 · 30 评论 -
Labubu为什么火?基于多平台数据的潮玩IP受众与舆情分析
本研究分析抖音、B站和小红书平台关于潮玩IP“Labubu”的用户评论数据(共7069条),探讨其火爆原因及舆论特征。通过情感分析和词频统计发现,评论呈现两极分化:极端负面评价(占比49.5%)集中批评“泡沫经济”“智商税”等,反映对盲盒商业模式的质疑;极端正面评价(11.3%)则强调“可爱”“文化输出”等情感价值。地域分布显示,广东、江浙沪用户讨论最活跃,海外以美日为主。词云分析揭示核心争议围绕“审美差异”“资本炒作”展开,折射Z世代对潮玩文化的认知割裂。原创 2025-07-03 10:43:40 · 14554 阅读 · 33 评论 -
主题分析利器BERTopic详解与实战应用指南(附中文案例)
《BERTopic:基于深度学习的现代主题建模方法》摘要 BERTopic是一种结合Transformer预训练模型与无监督聚类算法的现代主题建模方法,解决了传统LDA模型在语义理解、短文本处理等方面的局限性。其核心流程包括:1)使用Sentence-BERT生成语义向量;2)通过UMAP降维;3)采用HDBSCAN聚类;4)利用c-TF-IDF抽取主题关键词。相比LDA,BERTopic具有更好的语义理解能力、短文本处理效果和主题一致性。实战案例展示了中文新闻主题建模全过程,包括分词、模型构建、训练及6种原创 2025-06-30 10:40:57 · 14272 阅读 · 25 评论 -
基于Flask+Bootstrap+机器学习的会计专业毕业生薪资可视化分析系统
本项目使用Flask框架搭建基于机器学习的会计专业毕业生薪资可视化分析系统其中关于Flask知识点可参考文章Flask全套知识点从入门到精通,学完可直接做项目1.登录/注册模块2.首页板块3.训练模型板块3.岗位信息模块4.可视化大屏模块技术:Flask、html、css、javascript、bootstrap、echarts系统架构:。原创 2025-06-10 09:08:06 · 9641 阅读 · 26 评论 -
HuggingFace平台详细介绍|模型or数据集下载
一、HuggingFace平台介绍)平台可以类比为机器学习领域的 GitHub,它是用于分享、协作和托管预训练模型、数据集和相关代码的平台。其主要的优势是提供了简单易用的 API 和界面,使得即使是没有深厚机器学习背景的用户也能轻松使用这些模型。原创 2025-06-03 10:21:35 · 9191 阅读 · 29 评论 -
【论文复现】基于文本挖掘的互联网医疗平台用户画像模型构建
本研究旨在通过文本挖掘技术构建互联网医疗平台的用户画像模型,以提升诊疗准确性和效率。研究以自闭症问诊数据为例,使用Python爬虫从好大夫在线平台获取6000条数据,并通过LDA主题分析和Kmeans聚类技术对数据进行处理。实验过程包括数据导入、预处理、可视化、主题分析和聚类,最终构建了具有代表性的用户画像。研究结果表明,该模型能够有效挖掘用户需求,优化问诊流程,提升患者满意度,推动互联网医疗平台向智能化、个性化方向发展。原创 2025-05-15 11:55:30 · 12559 阅读 · 26 评论 -
Python实现Doc2Vec的入门使用(附中文和英文文本案例)
本次实验将分别对中文和英文文本进行Doc2Vec分析,其中中文数据集为新闻数据集,包含新闻的类型和内容(数据集来源于天池网)英文数据集为某一研究领域的英文文献,包含论文标题和摘要(数据集来源于Kaggle)本次实验案例分别使用Doc2Vec对中英文文本内容进行分析,其中可以看出中英文的差距就是在分词那块,其他板块都是一样的套路,同时本次实验只是Doc2Vec的入门使用,后续如果学到进阶使用再回来更新或发新文。原创 2025-04-19 08:52:25 · 16222 阅读 · 27 评论 -
【Python基础】- 自定义函数和匿名函数
本文将重点介绍python中的自定义函数和匿名函数以及参数的传递原创 2023-07-29 16:59:22 · 9291 阅读 · 88 评论 -
【Python基础】- 文件的读写操作
本文将重点介绍Python中的文件读写操作原创 2023-07-05 20:00:00 · 9539 阅读 · 157 评论 -
【Python基础】- for/while循环语句
本文主要介绍了Python中的循环语句,包括for循环和while循环。原创 2023-06-08 19:00:00 · 11388 阅读 · 133 评论 -
【Python基础】- 基础数据类型(下)
上文我们介绍了Python基础数据类型中的数字、布尔、字符串类型,今天主要介绍列表、元组、字典和集合类型。原创 2023-06-04 21:09:52 · 9256 阅读 · 36 评论 -
【Python基础】- 基础数据类型(上)
本文主要介绍了Python基础数据类型中的数字类型、布尔类型、字符串类型三种数据结构。原创 2023-05-28 17:00:00 · 7917 阅读 · 69 评论 -
Python中处理无效数据的详细教程(附案例实战)
本文将主要介绍无效数据是什么,以及缺失值、重复值、异常值如何处理,手把手教会你使用Python做无效数据的处理原创 2023-05-26 08:54:35 · 8009 阅读 · 81 评论 -
【Python基础】- break和continue语句
break 语句可以跳出 for 和 while 的循环体。如果你从 for 或 while 循环中终止,任何对应的循环 else 块将不行。continue 语句被用来告诉 Python 跳过当前循环块中的剩余语句,然后继续进行下一轮循环。原创 2023-06-29 20:23:02 · 11636 阅读 · 116 评论 -
【Python基础】- if/else控制语句
本文主要介绍Python中的控制语句if-else,包括单分支和多分支语句。原创 2023-06-12 08:00:00 · 21986 阅读 · 108 评论 -
【Python基础】- 初学者必备之基础语法规则
本文主要讲解了Python中的基础语法规则,帮助初学者快速入门!原创 2023-05-05 08:15:00 · 6143 阅读 · 178 评论 -
Anaconda最新版详细安装教程
Anaconda(官方网站)就是可以便捷获取包且对包能够进行管理,同时对环境可以统一管理的发行版本。Anaconda包含了conda、Python在内的超过180个科学包及其依赖项。原创 2023-04-18 07:00:00 · 8114 阅读 · 63 评论 -
Python是什么?有什么用?怎么入门?
Python是当今世界最流行的程序语言之一。由荷兰人,吉多·范罗苏姆(Guido van Rossum)1989年发明,1991年公布。官网:www.python.orgPython 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。Python 的设计具有很强的可读性,相比其他语言经常使用英文关键字,其他语言的一些标点符号,它具有比其他语言更有特色语法结构。Python 是一种解释型语言: 这意味着开发过程中没有了编译这个环节。类似于PHP和Perl语言。原创 2023-04-13 20:04:45 · 6593 阅读 · 133 评论