# 第一周作业 **Repository Path**: huangjiezhou/first_week_homework ## Basic Information - **Project Name**: 第一周作业 - **Description**: 人工智能工程师培训第一周作业 - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 2 - **Forks**: 0 - **Created**: 2019-02-27 - **Last Updated**: 2024-06-08 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 第一周作业 ## 介绍 学生:黄捷洲 人工智能工程师培训第一周作业 ### 第一问:视觉系统都有哪些构成要素? 以机械臂视觉控制系统为例,说明视觉系统的构成要素。 #### 1、照明设备:光源 通过适当的光源照明设计,使图像中的目标信息与背景信息得到最佳分离,可以大大降低图像处理算法分割、识别的难度,同时提高系统的定位、测量精度,使系统的可靠性和综合性能得到提高。反之,如果光源设计不当,会导致在图像处理算法设计和成像系统设计中事倍功半。因此,光源及光学系统设计的成败是决定系统成败的首要因素。在机器视觉系统中,光源的作用至少有以下几种: - 照亮目标,提高目标亮度; - 形成最有利于图像处理的成像效果; - 克服环境光干扰,保证图像的稳定性; - 用作测量的工具或参照; ![各种机器视觉光源](https://images.gitee.com/uploads/images/2019/0227/163816_67ee79ad_4837051.jpeg "timg.jpg") #### 2、成像设备:相机 机器视觉相机的目的是将通过镜头投影到传感器的图像传送到能够储存、分析和(或者)显示的机器设备上。按照芯片类型可以分为CCD相机、CMOS相机;按照传感器的结构特性可以分为线阵相机、面阵相机;按照扫描方式可以分为隔行扫描相机、逐行扫描相机;按照分辨率大小可以分为普通分辨率相机、高分辨率相机;按照输出信号方式可以分为模拟相机、数字相机;按照输出色彩可以分为单色(黑白)相机、彩色相机;按照输出信号速度可以分为普通速度相机、高速相机;按照响应频率范围可以分为可见光(普通)相机、红外相机、紫外相机等。 ![机器视觉相机](https://images.gitee.com/uploads/images/2019/0227/164438_03a4a2dc_4837051.jpeg "timg (1).jpg") #### 3、处理设备:主机 ![输入图片说明](https://images.gitee.com/uploads/images/2019/0228/150842_ec043eed_4837051.png "微信截图_20190228140052.png") 人工智能主要的处理器分为:CPU、GPU、FPGA、ASIC等。随着这几年人工智能技术的发展,各大厂家都在大力研发人工智能处理器,由于GPU非常适合机器学习算法的计算,目前各大厂商都推出性能强悍的GPU处理器,甚至推出人工智能专用芯片,以适应人工智能计算的高性能要求。 #### 4、算法软件:视觉处理系统 机器学习的算法很多,我们从两个方面来介绍,第一个方面是学习的方式,第二个方面是根据算法的功能和形式的类似性。 - 学习的方式分类:监督式学习、非监督式学习、半监督式学习和强化学习。 - 算法的功能和形式的类似性分类:回归算法、基于实例的算法、正则化方法、决策树学习、贝叶斯方法、基于核的算法、聚类算法、关联规则学习、人工神经网络、深度学习、降低维度算法、集成算法。 - 其中,计算机视觉常用的算法有:半监督式学习、人工神经网络、深度学习等。 详情请参考:[《人工智能之机器学习常见算法》](https://www.cnblogs.com/xiyushimei/p/7874019.html) ##### 如图是一个机械臂选取指定点数色子的计算机视觉系统: ![输入图片说明](https://images.gitee.com/uploads/images/2019/0227/220623_d1d31c0c_4837051.png "QQ截图20190227204725.png") ![输入图片说明](https://images.gitee.com/uploads/images/2019/0227/220638_5dabecdb_4837051.png "QQ截图20190227205345.png") 系统主要由相机、光源、计算机、算法、机械臂组成。 相机采集色子的图像信息传输给计算机,然后通过图像算法将需要选取的色子进行定位分析,进而控制机械臂抓取指定的色子。 ### 第二问:尝试从模仿人类视觉处理流程的角度,阐述本对课程内容组织的理解。进一步在网上搜索,找到自己认为学习过程中最值得参考的1-2本书(不要太厚) 如图是人类视觉处理流程和课程体系的框架图: ![输入图片说明](https://images.gitee.com/uploads/images/2019/0227/221420_6a29ffd9_4837051.png "QQ截图20190227211051.png") 本课程的讲解过程模仿人类视觉处理的流程,循序渐进,通俗易懂,比较能够让人理解其中的原理。 课程体系中的图像采集模拟人类眼睛对画面的感知;图像预处理模拟视网膜对画面的采集和处理;特征提取、边缘检测、图像分割模拟人类对画面中物体的认识;位置估计、运动估计、相机标定模拟人类对画面中物体行为的理解;三维视觉则模拟人类对整个画面的内在联系的理解。 #### 推荐2本本人购买的书,嘻嘻! ![输入图片说明](https://images.gitee.com/uploads/images/2019/0227/223026_e0fc1113_4837051.jpeg "O1CN011ICXsftKoSc6UVC_!!2049420857.jpg") 《OpenCV 3计算机视觉 Python语言实现》 - 本书分9章来介绍计算机视觉的重要概念,所有的概念都融入了一些很有趣的项目。本书首先详细介绍了多个平台下基于Python的OpenCV安装,继而介绍了计算机视觉应用的基本操作,包括图像文件的读取与显示,图像处理的基本操作(比如边缘检测等),深度估计与分割,人脸检测与识别,图像的检索,目标的检测与识别,目标跟踪,神经网络的手写体识别。可以这样说,本书是一本不可多得的采用OpenCV实践计算机视觉应用的好书。 ![输入图片说明](https://images.gitee.com/uploads/images/2019/0227/223140_ea4d9db5_4837051.png "QQ截图20190227212736.png") 《机器学习实战》 - 主要介绍机器学习基础,以及如何利用算法进行分类,并逐步介绍了多种经典的监督学习算法,如k近邻算法、朴素贝叶斯算法、Logistic回归算法、支持向量机、AdaBoost集成方法、基于树的回归算法和分类回归树(CART)算法等。第三部分则重点介绍无监督学习及其—些主要算法:k均值聚类算法、Apriori算法、FP-Growth算法。第四部分介绍了机器学习算法的—些附属工具。 ### 第三问:什么是光通量和辐照度?说明几个常见光源的光通量,以及几个常见照明环境的辐照度。 ![输入图片说明](https://images.gitee.com/uploads/images/2019/0227/222240_2c2b7f0a_4837051.jpeg "timg (2).jpg") - 光通量:指人眼所能感觉到的辐射功率,它等于单位时间内某一波段的辐射能量和该波段的相对视见率的乘积 - 以符号Φ表示,单位是lm(流明) - 1流明 = 0.00146 瓦 常见光源光通量: | 光源 | 光通量 | | ------------------ | ------------- | | 太阳 | 3.566×1028 lm | | 烛光 | 12.56 lm | | 白炽灯/卤钨灯 | 12~24 lm/W | | 荧光灯和气体放电灯 | 50~120 lm/W | | LED灯 | 110 lm/W | ![输入图片说明](https://images.gitee.com/uploads/images/2019/0227/222345_60b516c8_4837051.jpeg "cb8065380cd79123231210dea8345982b3b780ae.jpg") - 辐照度:指投射到一平表面上的辐射通量密度。指到达一表平面上,单位时间,单位面积上的辐射能 - 以符号E表示,常用单位是lux(勒克斯) - 1 lux = 1 lm / m2 常见照明环境的辐照度: | 场景 | 照度 | | ------------------ | ----------- | | 黑夜 | 0.001—0.02 | | 阴天室内 | 5~50 | | 晴天阳光直射 | 100000 | | 适合阅读 | 300~750 | | 家用摄像机标准照度 | 1400 | ### 第四问:结合颜色空间示意图,简述HSI颜色空间中各通道的物理意义,并结合图像实例说明。 ![输入图片说明](https://images.gitee.com/uploads/images/2019/0227/223701_366b4c86_4837051.png "QQ截图20190227223638.png") - HSI颜色模型: - 色调H 是描述纯色的属性(如红色、黄色等) - 饱和度S 表示的是一种纯色被白光稀释的程度的度量 - 亮度I 体现了无色的光强度概念,是一个主观的描述 ![输入图片说明](https://images.gitee.com/uploads/images/2019/0227/224010_410de768_4837051.png "QQ截图20190227224003.png") ### 第五问:说明彩色图像传感器及γ校正的基本原理。 ##### 彩色图像传感器原理:彩色图像传感器通过带颜色的像素点过滤颜色来采集彩色信息 ![输入图片说明](https://images.gitee.com/uploads/images/2019/0227/224243_999483e4_4837051.png "QQ截图20190227224228.png") 如上图: 某一测试点按照如下规则确定非自身颜色的颜色信息: - 某一测试点的红色信息为该点四角上四个红色像素点的平均值; - 某一测试点的绿色信息为该点上下左右四个绿色像素点的平均值; - 某一测试点的蓝色信息为该点上下两个蓝色像素点或者左右两个蓝色像素点的平均值; ##### γ校正的基本原理: ##### Gamma校正是对输入图像灰度值进行的非线性操作,使输出图像灰度值与输入图像灰度值呈指数关系; ![输入图片说明](https://images.gitee.com/uploads/images/2019/0227/225857_5cf2b7a1_4837051.png "1357030235_2918.png") 人眼对外界光源的感光值与输入光强不是呈线性关系的,而是呈指数型关系的。在低照度下,人眼更容易分辨出亮度的变化,随着照度的增加,人眼不易分辨出亮度的变化。而摄像机感光与输入光强呈线性关系。如图所示人眼和摄像机的感光与实际输入光强的关系,为方便人眼辨识图像,需要将摄像机采集的图像进行gamma校正。