# 训练书法字体图像获取

**Repository Path**: YXY0216/Image_acquisition

## Basic Information

- **Project Name**: 训练书法字体图像获取
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2025-05-23
- **Last Updated**: 2025-06-06

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# 汉字图像处理与分割系统

该项目是一个用于处理和分割汉字图像的自动化系统，能够从包含多个汉字的图像中提取单个字符。本系统采用多级图像处理技术结合计算机视觉算法，确保高质量的字符分割结果。适用于文字识别、数据集制作、文档数字化等多种应用场景。

## 功能特点

### 核心功能
- 图像预处理
  - 自适应直方图均衡化（CLAHE）
  - 智能二值化处理
  - 多级形态学变换
  - 噪声抑制与增强
- 智能区域检测
  - 基于轮廓的区域提取
  - 自适应阈值分割
  - 区域特征分析
  - 异常区域修正
- 精确网格检测
  - Hough变换网格线检测
  - 透视校正
  - 网格交点优化
  - 自适应单元格划分
- 字符分割功能
  - 自动边界检测
  - 字符区域精确提取
  - 笔画完整性保持
  - 批量处理支持

### 辅助功能
- 过程可视化
  - 实时处理进度显示
  - 中间结果展示
  - 错误定位标注
  - 处理日志记录
- 自适应处理
  - 参数自动优化
  - 图像质量评估
  - 动态阈值调整
  - 异常检测与处理

## 项目结构

```
│  hanzi1.jpg                  # 原始输入图像
│  process_hanzi.py            # 主要处理脚本
│  
└─chars/                       # 输出目录
    │  1_原始图像.jpg          # 原始图像
    │  2_增强图像.jpg          # 增强后的图像
    │  3_二值化.jpg           # 二值化后的图像
    │  4_腐蚀.jpg             # 腐蚀处理后的图像
    │  5_膨胀.jpg             # 膨胀处理后的图像
    │  6_闭运算.jpg           # 闭运算后的图像
    │  7_开运算.jpg           # 开运算后的图像
    │  8_主区域.jpg           # 主要区域提取结果
    │  9_边缘检测.jpg         # 边缘检测结果
    │  10_字符框标注.jpg      # 字符定位结果
    │  10_字符边缘.jpg        # 字符边缘结果
    │  
    └─chars/                   # 分割后的单个字符
            汉字_001.jpg      # 分割得到的单个汉字
            汉字_002.jpg
            ...               # 更多分割字符
```

## 处理流程详解

1. 图像加载与预处理
   - 读取原始图像并进行格式转换
   - 使用CLAHE算法进行自适应直方图均衡化
   - 对比度优化和亮度调整
   - 输出：1_原始图像.jpg, 2_增强图像.jpg

2. 图像二值化处理
   - 结合高斯自适应阈值和Otsu阈值方法
   - 智能背景分离
   - 输出：3_二值化.jpg

3. 形态学处理链
   - 腐蚀操作去除噪点：4_腐蚀.jpg
   - 膨胀操作加粗特征：5_膨胀.jpg
   - 闭运算填充间隙：6_闭运算.jpg
   - 开运算去除杂点：7_开运算.jpg

4. 主要区域提取
   - 轮廓检测和区域筛选
   - 主区域边界确定
   - 输出：8_主区域.jpg

5. 边缘检测与字符定位
   - Canny边缘检测器
   - 自适应参数计算
   - 输出：9_边缘检测.jpg

6. 字符分割与保存
   - 网格线检测与单元格划分
   - 字符区域精确定位
   - 结果可视化：10_字符框标注.jpg, 10_字符边缘.jpg
   - 单字导出：chars/汉字_XXX.jpg

## 技术实现

### 1. 图像预处理优化
```python
def optimize_image(image):
    # 自适应直方图均衡化
    clahe = cv2.createCLAHE(clipLimit=2.0, tileGridSize=(8,8))
    lab = cv2.cvtColor(image, cv2.COLOR_BGR2LAB)
    lab[...,0] = clahe.apply(lab[...,0])
    enhanced = cv2.cvtColor(lab, cv2.COLOR_LAB2BGR)
    
    # 降噪处理
    denoised = cv2.fastNlMeansDenoisingColored(enhanced)
    
    return denoised
```

### 2. 智能二值化
```python
def adaptive_threshold(image):
    # 自适应阈值结合Otsu方法
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    blur = cv2.GaussianBlur(gray, (5,5), 0)
    binary = cv2.adaptiveThreshold(
        blur, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C,
        cv2.THRESH_BINARY_INV, 11, 2
    )
    return binary
```

### 3. 字符分割算法
```python
def extract_characters(binary):
    # 轮廓检测
    contours, _ = cv2.findContours(
        binary, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE
    )
    
    # 字符筛选与提取
    characters = []
    for cnt in contours:
        if cv2.contourArea(cnt) > min_area:
            x,y,w,h = cv2.boundingRect(cnt)
            char = binary[y:y+h, x:x+w]
            characters.append(char)
    
    return characters
```

## 环境要求

### 基础环境
- Python 3.8+ (推荐3.9或更高版本)
- OpenCV (cv2) >= 4.5.0
- NumPy >= 1.20.0
- Pillow >= 8.0.0
- SciPy >= 1.6.0

### 操作系统
- Windows 10/11 (推荐)
- Ubuntu 20.04+ / CentOS 8+
- macOS 11.0+

### 硬件建议
- CPU: 双核及以上
- 内存: 8GB及以上
- 存储: 固态硬盘优先

## 详细安装指南

### Windows环境

1. Python环境配置：
```powershell
# 下载安装Python 3.9+
# 添加到系统环境变量

# 更新pip
python -m pip install --upgrade pip
```

2. 安装依赖：
```powershell
# 安装必要库
pip install opencv-python numpy pillow scipy
```

### Linux环境

1. 系统依赖：
```bash
# Ubuntu/Debian
sudo apt update
sudo apt install python3-pip python3-opencv

# CentOS
sudo yum install python3-pip opencv
```

2. Python包安装：
```bash
pip3 install -r requirements.txt
```

## 使用指南

### 基础用法

1. 准备输入图像：
   - 将待处理图像放入项目根目录
   - 建议使用扫描件或清晰照片
   - 支持jpg、png、bmp等格式

2. 运行程序：
```bash
# 基本使用
python process_hanzi.py --input image.jpg

# 指定输出目录
python process_hanzi.py --input image.jpg --output result/

# 启用调试模式
python process_hanzi.py --input image.jpg --debug
```

### 高级参数

```bash
python process_hanzi.py [参数]

参数说明：
  --input    -i   输入图像路径
  --output   -o   输出目录
  --method   -m   处理方法选择 (basic/advanced)
  --debug    -d   启用调试输出
  --config   -c   指定配置文件
```

## 参数优化指南

### 1. 图像预处理参数

```yaml
preprocessing:
  clahe_limit: 2.0    # CLAHE裁剪限制
  grid_size: 8        # CLAHE网格大小
  denoise_h: 10       # 降噪强度
  blur_size: 5        # 高斯模糊核大小
```

### 2. 字符分割参数

```yaml
segmentation:
  min_area: 100       # 最小字符面积
  max_area: 10000     # 最大字符面积
  aspect_ratio: 1.5   # 纵横比阈值
  overlap_thresh: 0.3 # 重叠阈值
```

## 问题排查

### 1. 图像质量问题

- 过曝/欠曝
  ```python
  # 调整图像亮度
  alpha = 1.5  # 对比度
  beta = 0     # 亮度
  adjusted = cv2.convertScaleAbs(image, alpha=alpha, beta=beta)
  ```

- 噪点过多
  ```python
  # 增强降噪
  denoised = cv2.fastNlMeansDenoisingColored(image, None, 10, 10, 7, 21)
  ```

### 2. 分割问题

- 字符粘连
  ```python
  # 调整形态学操作
  kernel = np.ones((3,3), np.uint8)
  separated = cv2.erode(binary, kernel, iterations=1)
  ```

- 字符残缺
  ```python
  # 闭运算修复
  kernel = np.ones((5,5), np.uint8)
  repaired = cv2.morphologyEx(binary, cv2.MORPH_CLOSE, kernel)
  ```

## 性能优化

### 1. 代码优化

- 使用NumPy向量化运算
- 实现并行处理
- 优化内存使用
- 使用缓存机制

### 2. 参数调优

- 根据图像尺寸调整处理参数
- 优化阈值选择策略
- 调整形态学操作参数

## 更新日志

### v1.1.0 (2025-06-06)
- 优化字符分割算法
- 增加自适应参数调整
- 改进图像预处理流程
- 添加批处理支持
- 优化性能表现

### v1.0.0 (2025-05-01)
- 初始版本发布
- 实现基础功能

## 作者信息

- 姓名：尹星宇
- 学号：202352320208
- 班级：23智能科学与技术二班

## 开发计划

### 近期计划
- [ ] 添加深度学习模型支持
- [ ] 优化字符切分算法
- [ ] 提升处理速度
- [ ] 改进用户界面

### 长期目标
- [ ] 支持更多图像格式
- [ ] 提供API接口
- [ ] 开发GUI界面
- [ ] 支持批量处理