# html2md **Repository Path**: alwarse/html2md ## Basic Information - **Project Name**: html2md - **Description**: node+ts ,html转测markdown工具 - **Primary Language**: TypeScript - **License**: MIT - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-03-06 - **Last Updated**: 2025-03-06 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # HTML2Markdown 转换工具 ## 项目简介 HTML2Markdown是一个高效的HTML转Markdown工具,能够将HTML文件或整个目录中的HTML文件批量转换为Markdown格式。支持常见的HTML元素转换,包括标题、段落、列表、链接和图片等。 ## 技术栈 - Node.js - TypeScript - cheerio - 用于HTML解析 - 文件系统操作 (fs模块) ## 安装说明 1. 克隆项目到本地: ```bash git clone [项目地址] cd html2md ``` 2. 安装依赖: ```bash npm install ``` ## 使用说明 ### 命令行使用 ```bash node src/index.js <输入目录> <输出目录> ``` ### 作为模块使用 ```javascript const HTML2Markdown = require('./src/index.js').default; const converter = new HTML2Markdown({ indentSize: 2, bulletPoint: '-' }); // 转换单个文件 converter.convertFile('input.html', 'output.md'); // 转换整个目录 converter.convertDirectory('input_dir', 'output_dir'); ``` ## 项目结构 ``` html2md/ ├── src/ # 源代码目录 │ └── index.js # 主程序文件 ├── html/ # HTML源文件目录 ├── output/ # 转换后的Markdown文件目录 ├── package.json # 项目配置文件 └── README.md # 项目说明文档 ``` ## 主要功能 1. HTML到Markdown的转换 - 支持标题转换 (h1-h6) - 支持段落转换 - 支持有序和无序列表 - 支持链接和图片 2. 批量转换 - 支持整个目录的批量转换 - 自动创建输出目录 - 保持目录结构 3. 自定义选项 - 可配置缩进大小 - 可自定义列表符号 ## 开发指南 ### 代码风格 - 使用TypeScript进行开发 - 遵循ES6+语法规范 - 使用async/await处理异步操作 ### 调试 可以使用以下命令进行调试: ```bash node --inspect src/index.js <输入目录> <输出目录> ``` ## 注意事项 1. 确保输入文件为有效的HTML格式 2. 转换大文件时注意内存使用 3. 建议定期备份重要文件 ## 许可证 ISC License