- 博客(9)
- 收藏
- 关注

原创 爆肝4万字!手把手带你入门Python
本文《Python编程基础指南》系统讲解了Python的核心概念和应用,适合零基础入门学习。主要内容包括: 基础语法:变量、数据类型、运算符、字符串操作及集合类型(列表、元组、字典、集合)的使用方法。 流程控制:条件语句(if-elif-else)、循环语句(for/while)及循环控制(break/continue/else)。 函数与模块:函数定义、参数传递、作用域、lambda表达式;模块和包的创建与导入,标准库的应用。 文件操作:文件读写(open()/with语句)、指针管理及异常处理机制。 面
2025-06-25 20:31:47
961

原创 关于网络爬虫
定义网络爬虫是一种自动化程序,通过模拟人类浏览行为,按照预设规则遍历互联网页面,提取并存储目标数据。其核心任务是将非结构化的网页内容转化为结构化数据。工作流程种子URL队列:从初始网址(如网站主页)开始网页下载:通过HTTP协议获取页面内容(常用工具:Python的requestsaiohttp数据解析:使用XPath、正则表达式或解析库(如PyQuery)提取目标信息链接发现:从当前页面提取新链接加入队列(广度/深度优先策略)数据存储。
2025-05-09 21:14:31
1175
原创 网络爬虫进阶
网络爬虫进阶是技术深度与应用广度的结合。掌握动态页面抓取、突破反爬机制、构建分布式架构,并始终遵循道德法律边界,方能高效稳定地获取价值数据。爬虫不仅是工具,更是一门融合网络、编程与逆向的工程艺术。不断学习,方能游刃有余。随着AI发展,基于LLM的智能爬虫(自动理解页面结构、生成抓取代码)和自适应反反爬策略将成为新方向。保持技术敏感度,是爬虫工程师持续进阶的关键。
2025-07-03 22:05:32
1047
原创 CF997A Convert to Ones
我们可以将给出的字符串 edit 压缩一下,也就是将一段连续的相同字符压缩成一个这样的字符,比如将字符串 1000110 压缩成 1010。我们先执行 cnt−1 次翻转操作,把压缩后的字符串变成 01 或 10,然后再执行一次取反操作,将压缩后的字符串中的 0 去掉。我们在统计压缩后的字符串中 0 的个数 cnt 时,还要查看一下 edit 中最后一个字符是否为 0,如果是,将 cnt 加 1。如果压缩后的字符串中 0 的个数为 0,表示没有 0,直接输出 0,因为不需要修改。
2025-05-09 19:09:48
1623
原创 数据结构(1)——二叉堆
二叉堆(Binary Heap)是一棵完全二叉树,其每个节点都有一个权值。每个子节点的权值均大于等于或小于等于其父节点。如果这个二叉堆每个子节点的权值均大于等于其父节点,我们称这个二叉堆为如果这个二叉堆每个子节点的权值均小于等于其父节点,我们称这个二叉堆为。
2025-03-16 17:49:20
200
原创 [NOIP2000 提高组] 方格取数 题解
我们可以设 i 为我们现在总共走的步数,设 j 为第一条路径目前的横坐标,再设 k 为第二条路径目前的横坐标。状态转移方程十分好推,这里就不给出了,如果真的不知道状态转移方程是什么,就去看我的代码,我的代码中间有个三重循环,这个三重循环里面就是状态转移方程的实现部分。某人从图的左上角的 A 点出发,可以向下行走,也可以向右走,直到到达右下角的 B 点。输入的第一行为一个整数 N(表示 N×N 的方格图),接下来的每行有三个整数,前两个表示位置,第三个数为该位置上所放的数。一行单独的 0 表示输入结束。
2025-03-12 21:39:38
400
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人