# ML_tutorial **Repository Path**: zhou-hongkai62/ml_tutorial ## Basic Information - **Project Name**: ML_tutorial - **Description**: 学习机器学习(包含深度学习的包) - **Primary Language**: Unknown - **License**: MulanPSL-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-12-11 - **Last Updated**: 2025-12-11 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # ML_xa_tutorial 机器学习教程项目 这是一个使用 Jupyter Notebook 学习机器学习的项目,采用了标准的数据科学项目结构。 ## 目录结构说明 ``` ML_xa_tutorial/ ├── data/ # 数据存储目录 │ ├── raw/ # 原始数据,不可更改 │ ├── processed/ # 处理后的数据 │ └── external/ # 外部数据源 ├── notebooks/ # Jupyter Notebooks │ ├── exploration/ # 数据探索性分析 notebook │ ├── modeling/ # 建模相关的 notebook │ └── visualization/ # 可视化相关的 notebook ├── src/ # 源代码目录 │ ├── data/ # 数据处理脚本 │ ├── features/ # 特征工程脚本 │ ├── models/ # 模型定义和训练脚本 │ └── visualization/ # 可视化函数 ├── models/ # 训练好的模型存储位置 ├── reports/ # 实验报告和结果 │ └── figures/ # 图表文件 ├── references/ # 参考文献和资料 ├── requirements.txt # Python 依赖包列表 └── README.md # 项目说明文档 ``` ## 各目录详细说明 ### data/ 存放项目所需的所有数据文件: - `raw/`: 原始数据,不应该被直接修改,保持原始格式 - `processed/`: 经过清洗和预处理后的数据 - `external/`: 从外部来源获取的数据 ### notebooks/ 存放所有的 Jupyter Notebooks,按照用途分类: - `exploration/`: 数据探索和初步分析 - `modeling/`: 模型建立、训练和评估 - `visualization/`: 数据可视化和图表生成 ### src/ 存放可重用的 Python 源代码: - `data/`: 数据加载和预处理函数 - `features/`: 特征工程相关函数 - `models/`: 模型定义和训练函数 - `visualization/`: 可视化工具函数 ### models/ 保存训练完成的模型文件,如 `.pkl` 或 `.h5` 文件。 ### reports/ 实验报告、演示文稿和其他文档: - `figures/`: 生成的图表和可视化结果 ### references/ 项目参考资料,包括论文、文章链接或书籍章节等。 ## 工作流程建议 1. 将原始数据放入 `data/raw/` 2. 在 `notebooks/exploration/` 中进行数据探索 3. 在 `src/data/` 中编写数据预处理脚本 4. 将处理后的数据保存到 `data/processed/` 5. 在 `notebooks/modeling/` 中进行建模实验 6. 将可重用代码重构到 `src/` 相应目录中 7. 保存训练好的模型到 `models/` 8. 生成的图表保存到 `reports/figures/`