文章信息
- 刘思洋, 黄坚, 刘桂雄, 罗文佳
- LIU Siyang, HUANG Jian, LIU Guixiong, LUO Wenjia
- AlexNet两光照下多类别法定货币识别技术
- Technology of multi-category legal currency identification under multi-light conditions based on AlexNet
- 中国测试, 2019, 45(9): 118-122
- CHINA MEASUREMENT & TEST, 2019, 45(9): 118-122
- http://dx.doi.org/10.11857/j.issn.1674-5124.2018080085
-
文章历史
- 收稿日期: 2018-08-22
- 收到修改稿日期: 2018-09-29
2. 广州市银科电子有限公司,广东 广州 510663
2. Guangzhou Yin Ke Electronics Co., Ltd., Guangzhou 510663, China
法定货币作为重要交易手段,其自动识别技术是货币防伪鉴别技术的应用基础。目前法定货币识别方法主要包括尺寸识别法与基于货币图像特征的识别方法[1]。尺寸识别法计算量小,但可靠性低[2]。基于货币图像特征的识别方法在提取图像特征基础上,采用识别算法实现货币图像特征识别,具备通用性与泛化能力[3],是法定货识别领域的主流方法。
图像识别算法主要包括货币图像经典特征提取与识别算法、货币图像机器特征提取与识别算法、货币图像深度学习特征提取与识别算法[4]。其中,货币图像经典特征提取与识别算法是根据不同货币图像间色差、荧光特征等显著区别,设计图像处理算法完成识别任务[5]。如清华大学(2017年)利用在紫外光照射下人民币正面荧光面额区域作为识别特征,运用几何结构分析和模板匹配的方法实现对6种人民币面额的识别,识别准确率达到99%以上[6]。货币图像机器特征提取与识别算法是将图像上易区分的图像特征转换为特征向量,采用k最近邻算法(k-nearest neighbor,KNN)、支持向量机(support vector machine,SVM)等机器学习算法完成特征向量运算与识别[7]。如四川大学(2012年)提出一种在复杂背景条件下的票据字符分割方法,其通过小波变换提取图像中字符区域纹理特征,基于SVM对区域进行分类,定位包含文字的图像区域,随后采用kNN算法对文字区域内的像素进行聚类划分,从而实现文字分割[8]。货币图像深度学习特征提取与识别算法以图像全域特征作为输入向量,通过多层神经网络学习与训练过程,实现图像特征自动提取与识别[9]。文献[10]采用基于BP神经网络的票据图像自动识别技术,通过BP神经网络完成票据特征自动提取,完成票据金额、传票号或交易码等识别,但浅层BP神经网络存在识别准确率不足问题;文献[11]提出一种基于深度学习钞票识别方法,采用卷积神经网络(CNN)在钞票图像数据集上训练,实现韩元、印度卢比与美元多种钞票金额准确识别。上述货币图像识别算法中,经典图像处理算法须由人工设计图像防伪特征,应用不便;机器学习算法则需经过图像特征选择、特征向量生成过程,适用于小样本货币图像识别;深度学习算法由神经网络自动实现货币图像特征提取与识别,无需人工完成复杂的特征提取任务,适合两光照下多类法定货币的识别。
本文将从不同光照下法定货币图像特征分析入手,分析AlexNet训练过程与识别机理,提出基于AlexNet的两光照下多类别法定货币识别技术与应用。
1 不同光照下法定货币图像特征分析法定货币在不同光照下呈现不同的识别特征,是区分不同光照下法定货币图像的基础。法定货币在识别过程中光照条件主要包括自然光、紫外光。图1为百元人民币在自然光、紫外光下的图像特征。
可以发现,不同光照下货币图像特征区别明显。从图像全局特征看,不同光照下图像整体色泽、饱和度与亮度差别很大;从图像局域特征看,不同光照下货币图像具有不同的图案、面额数字与其他特征,并且局域特征在整体图像上的位置、局域特征的颜色与边缘等均有显著区别。
分析不同光照下法定货币图像特征的区别可知,采用深度学习识别算法识别时,通过制作不同光照下法定货币图像数据集训练识别器,由神经网络自动提取局域图像的边缘、位置与颜色特征信息,直至全域图像的色泽、饱和度与亮度特征信息,完成特征提取与识别过程,减少人工提取图像特征的工作量。
2 基于AlexNet两光照下多类别法定货币识别技术 2.1 AlexNet神经网络模型分析卷积神经网络作为高效的图像识别网络,主要由卷积层、池化层与全连接层组成[12]。卷积层的神经元节点存在于特征图像中,每个节点与上一层特征图像中的局部区域通过一系列权重的卷积核连接,通过卷积运算实现特征自动提取与特征局部连接。待识别目标的图像特征相对位置不同,池化层粗糙化每个特征位置,合并图像特征相似局部区域,减少特征向量维度,增加移动或扭曲不变性。全连接层是相邻两个特征图象中,每个输入神经元均与所有输出神经元完全连接,将图像特征矩阵转换为列向量,与识别结果的类别数目相匹配。
对大型图像识别数据集ImageNet上训练并优化的卷积神经网络模型——AlexNet神经网络进行分析[13]。图2为AlexNet卷积神经网络模型图,它由11层神经网络组成,包含5层卷积层、3层池化层与3层全连接层。卷积层与池化层相互交叉堆叠,由非线性激活函数完成非线性运算,再与全连接层相连,通过反向传播算法训练所有卷积核权重参数,得到AlexNet卷积神经网络。
AlexNet的输入图像分辨率为227×227,为3通道RGB图像,图像经过不同层级的卷积层与池化层作用,特征图像尺寸逐层递减,随后由全连接层神经元运算,将提取的图像特征转换为4096×1维度的特征列向量,最后经SoftMax分类层完成1 000类别物体识别。图3为AlexNet网络堆叠方式及其对应特征图像维度变化情况。
2.2 面向法定货币识别的AlexNet迁移学习
迁移学习(transfer learning)将在某一数据集上训练完成的模型参数迁移到新任务中辅助新模型训练[14]。在图像识别任务中,大部分数据或任务存在相关性,如物体边缘、纹理等特征高度一致,通过迁移学习可将已学到模型参数通过某种方式来分享给新模型,从而加快并优化模型的学习效率。面向法定货币识别任务中使用迁移学习,要对神经网络结构进行微调以实现适应新任务的网络模型训练。具体是修改AlexNet全连接层神经元个数,与法定货币识别任务类别数对应,使微调后AlexNet输出为法定货币类别。
图4为不同光照下法定货币图像特征提取过程。法定货币图像通过神经网络逐层特征提取与特征图像降维,AlexNet依次识别法定货币图像边缘、色泽特征、边缘特征局部组合构成纹理图案,纹理图案拼接构成上述待识别货币在光照下局部特征,特征组合形成待识别法定货币图像。
面向法定货币识别的AlexNet网络训练过程包括特征提取的前向传播过程、网络权重更新的反向传播过程。
设法定货币图像样本集包括
$ y_l^{(i)} = {f_l}({w_l}{x^{(i)}} + {b_l});\quad y_{\rm{pred}}^{(i)} = {f_n}({w_n}{x^{(i)}} + {b_n}) $ | (1) |
定义代价函数度量识别结果误差以更新AlexNet网络参数,图像
$ J({w_l},{b_l};{x^{(i)}},{y^{(i)}}) = \frac{1}{2}{({y^{(i)}_{\rm{pred}}} - {y^{(i)}_{\rm{true}}})^2} $ | (2) |
采用批量梯度下降法更新AlexNet网络权重,以全体样本作为对象,正则化项为
$ J({w_l},{b_l}) = \frac{{{1}}}{m}\sum\limits_{i = 1}^m {\left[\frac{1}{2}{{({y^{(i)}_{\rm{pred}}} - {y^{(i)}_{\rm{true}}})}^2}\right]} + \frac{\lambda }{2}\sum\limits_{l = 1}^n {{w_l}^2} $ | (3) |
求得最优识别效果,需更新AlexNet网络参数,以最小化代价函数,网络学习率
$ {w_l} = {w_l} - \alpha \frac{\partial }{{\partial {w_l}}}J({w_l},{b_l});\quad {b_l} = {b_l} - \alpha \frac{\partial }{{\partial {b_l}}}J({w_l},{b_l}) $ | (4) |
式(1)~式(4)即为AlexNet神经网络特征提取的前向传播、网络参数更新的反向传播一次迭代过程,重复上述迭代过程直至整体代价函数收敛,面向法定货币识别任务的AlexNet网络参数更新迭代完成。
3 试验研究按表1部件搭建法定货币图像采集装置。在紫外光照(UL)与自然光(NL)照条件下,采集两种光照条件下2005年版人民币(CN)1套、克罗地亚外币(HR)1套货币正反两面共30种法定货币图像。在MATLAB R2017b软件环境下针对法定货币图像样本库进行AlexNet网络训练。
装置部件 | 生产产家 | 型号 | 性能参数 |
相机 | 深圳市迈德威视有限公司 | MV-SUA200GC-T | 分辨率1600×1200,像元尺寸4.5 μm×4.5 μm, 像素位深度10 bit |
镜头 | 深圳市英视科技有限公司 | YS1616-5M | 焦距16 mm,径向畸变<0.06% |
紫外条形光源 | 广东奥普特科技股份有限公司 | OPT-LIT21228 | 功率7 W,接口JST SMR-02V-B |
图5为训练过程中,在训练集与验证集上法定货币图像识别准确率与整体代价函数收敛变化过程。可以看出,在学习率
4 结束语
本文从自然光照与紫外光照下人民币图像局部特征分析入手,指出不同光照下法定货币图像具有不同的面额与图案等特征,可采用深度学习方法识别两光照下多类别法定货币图像;分析AlexNet网络架构与模型,研究面向法定货币图像识别任务的AlexNet迁移学习方法,微调AlexNet网络模型以满足法定货币图像识别的特定任务要求;建立面向法定货币图像识别任务的AlexNet神经网络训练过程数学模型,并应用该训练方法在自然光照与紫外光找条件下中外两套货币共30类别货币图像样本库上进行深度学习,达到100%货币图像识别准确率,并能区分货币币种、光照条件、面额与正反面图像,有效减少人工提取图像特征的工作量。
[1] |
宋晓宁, 刘梓, 於东军, 等. 表格型票据图像手写体特殊符号的混合检测算法[J].
南京理工大学学报(自然科学版), 2012, 36(6): 909-914.
DOI:10.3969/j.issn.1005-9830.2012.06.001 |
[2] |
HASANUZZAMAN F M, YANG X, TIAN Y L. Robust and effective component-based banknote recognition for the blind[J].
IEEE Transactions on Systems Man & Cybernetics Part C, 2012, 42(6): 1021-1030.
|
[3] |
YONG K S, DANH P T, RYOUNG P K, et al. Recognition of banknote fitness based on a fuzzy system using visible light reflection and near-infrared light transmission images[J].
Sensors, 2016, 16(6): 863.
DOI:10.3390/s16060863 |
[4] |
罗帅, 娄震. 基于印刷年份的人民币版本识别技术研究[J].
现代电子技术, 2015, 38(18): 72-74.
DOI:10.3969/j.issn.1004-373X.2015.18.021 |
[5] |
金长江, 师廷伟. 红外弱小目标检测背景抑制算法研究[J].
中国测试, 2016, 42(4): 115-119.
|
[6] |
李雪梨, 索双富, 武佩君. 一种基于紫外荧光图像的人民币面额识别算法[J].
机械设计与制造, 2017(3): 1-3.
DOI:10.3969/j.issn.2095-509X.2017.03.001 |
[7] |
郭雪梅, 刘桂雄. 多颜色模型分割自学习k-NN设备状态识别方法[J].
中国测试, 2016, 42(4): 107-110.
|
[8] |
叶龙欢, 王俊峰, 高琳, 等. 复杂背景下的票据字符分割方法[J].
计算机应用, 2012, 32(11): 3198-3200.
|
[9] |
SOSA-GARCÍA J, ODONE F. Banknote recognition as a CBIR problem [C]// International Conference on Similarity Search and Applications. Springer, 2015.
|
[10] |
韩梦迪, 曹玉东, 杜刚. 基于BP神经网络的银行票据识别[J].
信息通信, 2016(9): 157-159.
DOI:10.3969/j.issn.1673-1131.2016.09.079 |
[11] |
PHAM T D, NGUYEN D T, KIM W, et al. Deep learning-based banknote fitness classification using the reflection images by a visible-light one-dimensional line image sensor[J].
Sensors, 2018, 18(2): 472.
DOI:10.3390/s18020472 |
[12] |
卢宏涛, 张秦川. 深度卷积神经网络在计算机视觉中的应用研究综述[J].
数据采集与处理, 2016, 31(1): 1-17.
|
[13] |
KRIZHEVSKY A, SUTSKEVER I, HINTON G E. ImageNet classification with deep convolutional neural networks [C]// International Conference on Neural Information Processing Systems. 2012: 1097-1105.
|
[14] |
LONG M S, WANG J M, DING G G, et al. Transfer feature learning with joint distribution adaptation [C]// IEEE International Conference on Computer Vision. IEEE, 2014: 2200-2207.
|