
python
文章平均质量分 79
Slwhy
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python 编码
1,什么是编码2,如何简单处理python2中文乱码的问题3,如何查看python3的默认编码原创 2017-11-19 18:46:06 · 634 阅读 · 1 评论 -
python jieba 分词初识
在我们写代码的时经常需要用的一些不是很熟悉的工具,但又需要快速上手,最直接的方法就是看官方文档,不过,很多文档都是英文的(暴击),此博客就是帮助萌新快速上手的,不会牵涉很复杂的理论,老司机请自动略过(当然欢迎指正)jieba 分词的作用在做文本分析的时候,我们经常要做的一件事就是对文本进行分词,最直接的就是 n-gram 模型,但很时候,我们希望按照一定的语义进行分词,例如下面这句话:...原创 2018-05-07 19:15:03 · 440 阅读 · 0 评论 -
Python WordCloud 初识
在我们写代码的时经常需要用的一些不是很熟悉的工具,但又需要快速上手,最直接的方法就是看官方文档,不过,很多文档都是英文的(暴击),此博客就是帮助萌新快速上手的,不会牵涉很复杂的理论,老司机请自动略过(当然欢迎指正)worldcloud的作用基于 Python 的词云生成库,可以实现词频可视化,根据你给出字符串,对词频进行统计,以不同的大小显示出来用法安装pip ...原创 2018-05-07 18:41:44 · 4931 阅读 · 2 评论 -
python 处理非标准 json 格式字符串
在写爬虫的时候,会发现很多数据都是通过 json 格式进行传输的,标准的 json 我们可以将其转化为 Python 中的数据类型,进行查询,但对于一些类似于 json 但又非标准 json 格式的字符,就会比较头疼了,这里统计一些咱遇到的非标准的 json 格式,及相应的解析方法。字符串中 key 的值没有被单引号包裹类似于这种字符,看上去格式和 json 很像(眼尖的朋友可能发现了...原创 2018-04-12 17:52:03 · 5877 阅读 · 4 评论 -
Python 发送 multipart/form-data 数据
前言最近做知乎模拟登录的时候,碰到一个很奇怪的参数类型,与一般的键值对不同,大概长这样:------WebKitFormBoundaryA0Srut8TBztAofvxContent-Disposition: form-data; name="client_id"a3cef7c66a1843f8b3a9e6b1e5162e21------WebKitFormBoundaryA0...原创 2018-03-05 21:31:49 · 13365 阅读 · 5 评论 -
python 爬取海量网易云评论并写入数据库
本人是一个网易云音乐的重度患者,最近闲来无事,就想起来写一个爬虫爬一下网易云音乐上都有哪些有趣的评论,于此记录一下过程。整体思路可能是我的脑回路那啥,作为一个新手,咱一上来,是直接尝试爬取评论。随便挑了一首歌,进行尝试,看是否能够拿到评论数据。虽然过程有些曲折,但还是让咱拿到了评论。于是开始正儿八经进行分析,应该如何才能拿到大量的评论数据。经过咱的观察。我发现,每一首歌都有一个 id ,如原创 2018-02-03 11:50:07 · 2931 阅读 · 0 评论 -
Python中模块导入之版本二与三的区别
事先声明,这些乃是本人学习 Python 目录规范时碰到了问题,然后通过不断尝试出来的,这里做了一个总结,仅供大家参考,如有错误欢迎指正,我是在 Ubuntu 上用 pycharm 试,并不能保证 Windows 下同样适用。相同点没有相同之处,何来不同之分;聊区别之前,先看一下相同的部分。下级目录导入上级目录中的模块,可以直接导入,如图Python 3 中导入上级目录模块 Python 2中原创 2018-01-02 21:48:57 · 510 阅读 · 0 评论 -
Python 调用有道的翻译接口
最近为了熟悉一下 js 用有道翻译练了一下手,写一篇博客记录一下,也希望能对大家有所启迪,不过这些网站更新太快,可能大家尝试的时候会有所不同。首先来看一下网页 post 过去的数据 大家不难发现,我们翻译的内容是放在 post 的 data 中的,这些参数,除了 salt 和 sign 要么就是不会变化,要么就是一眼能看出来意义的;那么这个 salt 和 sign 是什么呢?sal原创 2018-01-09 17:07:34 · 9086 阅读 · 3 评论 -
Python 爬取网易云评论
最近闲来无事,研究了一下网易云音乐,发现 ta 客户端传输给服务器的数据是经过加密的,大抵是将你要传输的数据经过两次 AES 加密,因为 AES 是对称加密算法,还需要将 AES 的秘钥以 RSA 的方式加密后传输给服务器。但经过我的分析发现,我们不用登录也是可以浏览到评论的,而且,服务器返回的评论数据,也没有经过加密,如果我们只是简单的想拿到某些歌曲的评论,可以绕过加密算法,直接请求数据。但这样原创 2018-01-11 15:42:01 · 4214 阅读 · 0 评论 -
python装饰器(decorator)
装饰器,decorat原创 2017-12-18 12:56:43 · 684 阅读 · 1 评论 -
python的赋值与深浅拷贝
python——赋值与深浅拷贝转载 2017-11-19 20:55:42 · 480 阅读 · 0 评论 -
python 文件操作
python文件基本操作原创 2017-12-02 21:55:19 · 530 阅读 · 0 评论 -
python的序列,映像和集合类型
python的序列,映射,集合类型原创 2017-11-20 21:45:20 · 2665 阅读 · 0 评论 -
python指定书目抓取小说文本
功能简介支持人为指定书目,而后根据书名,通过站内的索引接口进行检索抓取对象为一个比较大型小说网站(网站见代码内),当然如果该站内没有对应小说的文本是无法抓取的书名需要指定,如果要获取书单,直接解析网址首页即可获取较多的数据,本人分析了一下网址,没有发现可以直接遍历整个站内地图的方法,所以就没做遍历站内地图的模板(偷偷说一下,新版的网址支持遍历,不过这个已经能实现咱的需求,就懒得去解析了)...原创 2019-09-02 00:03:16 · 718 阅读 · 1 评论