Python 系统复习与提高

2025-11-30

一、第一优先级：Python 核心语法（所有方向的地基，必须吃透）

这部分是 Python 区别于 Java 的核心，也是后续框架/工具的基础，重点突破“Python 特有特性”（Java 没有的逻辑）：

1. 数据类型与内置结构（结合后续场景）

知识点	复习重点	后续应用场景
基础类型（str/int/float/bool）	str 常用方法（strip/split/replace/join）、int/float 精度问题、bool 判断规则	所有场景：Django 表单验证、LLM 提示词处理、数据分析文本清洗
容器类型（list/tuple/dict/set）	1. list：列表推导式、切片、append/extend/pop 区别；2. tuple：不可变性、单元素逗号；3. dict：字典推导式、get()/items()/keys()、3.7+ 有序性；4. set：去重、交集/差集运算	1. Django：模板遍历、视图数据处理；2. 数据分析：Pandas 数据筛选；3. 云原生：配置项去重
不可变 vs 可变类型	区分标准（是否修改原对象）、深拷贝/浅拷贝（copy 模块）	所有场景：避免 Django 视图数据污染、LLM 缓存数据安全、数据分析避免原数据修改

2. 控制流与函数（后端/数据/AI 都依赖的逻辑载体）

知识点	复习重点	后续应用场景
条件/循环（if/for/while）	for 循环遍历容器、enumerate 取索引+元素、break/continue/else 用法	1. Django：数据批量处理；2. 数据分析：循环处理数据集；3. LLM：批量调用 API
函数基础	形参/实参、默认参数、关键字参数、可变参数（args/*kwargs）	1. Django：视图函数、自定义过滤器；2. LLM：封装 API 调用函数；3. 云原生：工具函数封装
函数进阶（装饰器/闭包）	1. 装饰器：语法结构、带参数的装饰器；2. 闭包：变量作用域、nonlocal 关键字	1. Django：权限校验装饰器、缓存装饰器；2. FastAPI（LLM 服务）：依赖注入、接口拦截
生成器/迭代器	yield 关键字、生成器表达式、iter()/next() 原理、可迭代对象 vs 迭代器	1. 数据分析：处理大数据量（避免内存溢出）；2. Django：批量查询数据；3. LLM：流式响应

3. 面向对象（OOP）（Django/框架开发核心）

知识点	复习重点	后续应用场景
类与对象	class 定义、init 构造方法、实例属性/类属性区别	1. Django：模型（Model）定义、自定义中间件；2. 数据分析：封装数据处理类；3. LLM：模型封装类
继承/多态	单继承、多重继承（MRO 顺序）、方法重写	1. Django：自定义用户模型、扩展 Admin 类；2. 云原生：封装不同云厂商 SDK 类
魔法方法	str/repr（打印友好）、dict（属性字典）、call（对象可调用）	1. Django：模型打印优化；2. 数据分析：自定义数据类型（如时间格式）；3. LLM：自定义模型类
封装	私有属性（_xxx/__xxx）、属性装饰器（@property）	1. Django：模型字段校验；2. 云原生：工具类封装（隐藏内部实现）

4. 异常处理与模块（工程化开发必备）

知识点	复习重点	后续应用场景
异常处理（try/except）	常见异常类型（KeyError/IndexError/TypeError）、多 except 捕获、else/finally、自定义异常	1. Django：视图异常捕获（返回友好提示）；2. LLM：API 调用超时/报错处理；3. 云原生：服务部署异常处理
模块与包	import/from…import 用法、init.py 作用、相对导入 vs 绝对导入	所有场景：项目工程化拆分（如 Django 应用、LLM 服务模块、数据分析脚本拆分）
常用标准库	1. os/pathlib：路径处理（跨平台）；2. sys：系统参数、模块路径；3. json：JSON 序列化/反序列化；4. datetime：时间处理	1. Django：文件上传路径、时间戳转换；2. LLM：JSON 格式提示词、响应解析；3. 云原生：配置文件读取

二、第二优先级：后端/数据基础（衔接 Django/数据分析/LLM 服务）

这部分是“Python 语法到实际场景”的桥梁，所有后续方向都离不开：

1. 数据库基础（Django 核心+数据分析存储）

知识点	复习重点	后续应用场景
SQL 基础	SELECT/INSERT/UPDATE/DELETE、WHERE 条件、JOIN 关联查询、索引基础	1. Django：ORM 底层原理、自定义 SQL；2. 数据分析：Pandas 连接数据库（read_sql）
Python 数据库连接	sqlite3（轻量测试）、MySQL 客户端（pymysql）、连接池概念	1. Django：数据库配置、原生 SQL 执行；2. 数据分析：批量读写数据库；3. LLM：存储对话历史

2. 网络编程基础（LLM 服务/云原生/接口开发）

知识点	复习重点	后续应用场景
HTTP 协议基础	GET/POST 区别、请求头/响应头、状态码（200/400/500）、JSON 响应格式	1. Django：视图请求处理（request/response）；2. LLM：调用第三方 API（OpenAI/通义千问）；3. 云原生：调用云服务 API
requests 库	get()/post() 用法、请求参数（params/data/json）、超时设置、异常处理	1. LLM：封装大模型 API；2. 数据分析：爬取公开数据；3. 云原生：监控云资源状态
异步编程基础（asyncio）	async/await 语法、asyncio.run()、异步 HTTP 客户端（aiohttp）	1. FastAPI（LLM 服务）：异步接口（高并发）；2. Django 3.2+：异步视图；3. 云原生：异步任务处理

三、第三优先级：高阶衔接点（为 LLM/云原生/数据分析铺路）

这部分不用深钻，但要“知道是什么、能做什么”，后续学习时能快速切入：

1. 性能优化基础

知识点	复习重点	后续应用场景
性能分析工具	timeit（代码耗时测试）、cProfile（函数调用分析）	1. Django：视图性能优化；2. LLM：接口响应速度优化；3. 数据分析：脚本效率优化
优化技巧	列表推导式 vs 循环、生成器节省内存、lru_cache 缓存（functools 模块）	1. 数据分析：处理大数据量；2. LLM：缓存重复提示词响应；3. 云原生：工具函数缓存

2. 序列化与数据处理

知识点	复习重点	后续应用场景
数据序列化	json 模块（复杂对象序列化：如 datetime）、pickle 模块（Python 专属序列化）	1. Django：API 数据返回；2. LLM：提示词/响应序列化；3. 云原生：配置项序列化
正则表达式（re 模块）	匹配规则（贪婪/非贪婪）、常用符号（\d/\w/./*/+）、sub()（替换）、findall()	1. Django：表单验证（手机号/邮箱）；2. 数据分析：文本提取；3. LLM：提示词格式校验

3. 云原生/LLM 铺垫知识点

知识点	复习重点	后续应用场景
命令行工具（argparse）	解析命令行参数、子命令定义	1. 云原生：开发运维脚本（批量部署）；2. LLM：本地模型启动参数配置
进程/线程基础	multiprocessing（多进程）、threading（多线程）、GIL 对并发的影响	1. 云原生：多进程部署 Python 服务；2. LLM：批量处理多用户请求；3. 数据分析：多线程下载数据

四、复习方法：“知识点+场景落地”结合（避免只背不练）

每个知识点配 1-2 个场景化练习：
- 例：学完“字典推导式”→ 练习“将 Django 模型查询结果转为字典（适配 API 返回）”；
- 例：学完“requests 库”→ 练习“调用 OpenAI API 实现简单问答（LLM 入门）”；
- 例：学完“生成器”→ 练习“读取大 CSV 文件（数据分析场景，避免内存溢出）”。
用“小项目”串联知识点：
- 推荐小项目：“个人笔记 API 服务”（覆盖核心语法+后端基础）：
  - 功能：创建/查询/修改/删除笔记，支持按标签筛选、时间排序；
  - 技术点：list/dict 存储数据、函数封装逻辑、异常处理（如不存在的笔记 ID）、json 序列化返回、requests 模拟调用；
  - 延伸：后续可无缝迁移到 Django（用 Model 替代字典存储）、添加 LLM 摘要功能（调用大模型生成笔记摘要）。
针对性补充“Java 转 Python”的思维差异：
- 不要用 Java 思维写 Python：比如 Java 的“类继承”在 Python 中少用，优先用“组合”；Java 的“循环”在 Python 中优先用推导式/生成器；
- 关注 Python 的“简洁性”：比如用 if x in list 替代 Java 的循环判断，用装饰器替代 Java 的拦截器模式。

五、复习时间规划（按 2-3 个月安排，每天 1-2 小时）

阶段	时间	核心任务
基础语法阶段	1 个月	吃透“第一优先级”知识点，完成每个知识点的场景练习，搭建“个人笔记 API 服务”雏形
后端/数据基础	1 个月	学习“第二优先级”知识点，完善笔记 API 服务（添加数据库存储、HTTP 接口）
高阶衔接阶段	0.5-1 个月	学习“第三优先级”知识点，给笔记 API 加功能（LLM 摘要、多线程查询、性能优化）

总结

这套知识点框架的核心是“不冗余、不脱节”——既覆盖了 Python 核心，又每个知识点都能衔接后续方向（Django/LLM/数据分析/云原生）。对你来说，重点是“先打通 Python 特有逻辑（如装饰器、生成器、字典推导式）”，再通过场景化练习把“语法”变成“解决问题的能力”，2-3 个月扎实复习后，后续学习 Django、LLM 时会事半功倍。

如果某个知识点卡住（比如装饰器、异步编程），可以先“会用”再“深究原理”，优先保证“核心流程能跑通”，后续在实际项目中再迭代优化。