成果详情 1.技术领域
本项目属于深度学习中的训练方法。
2.本项目所要解决的技术问题
① 在深度学习模型训练过程中,数据增广方法无法配合模型训练,无法针对性的生成难样本的问题。
② 深度学习模型在训练过程中,参数容易收敛到局部最优解,导致模型鲁棒性较低的问题。
③常见的对抗样本生成技术复杂性较高,无法应用到实时的模型训练过程中,无法动态的根据模型当前训练阶段生成对抗样本的问题。
3.本项目欲保护的技术关键点
①提出了一种新型的在训练中实时增广数据的方法,使用网络梯度回传修改输入图片,生成对抗样本,并实时用生成的对抗样本来训练深度学习网络。
② 使用两个优化器,在训练中分别对对抗参数层和网络参数进行优化,以达到一次前向就可以同时优化对抗参数和网络参数的效果。加速了对抗与训练。
③步骤7中的两个终止训练条件:一是以验证集中简单样本比例来判断是否应当终止训练;二是人工观察由验证集生成的对抗样本,如果人都很难判定这些样本的类别,则可以终止训练。
4.本项目的有益效果包括:
①使用本技术中的数据增广方法,可以有效提升训练出来的深度学习模型鲁棒性,提升模型在实际应用时的精度和召回,能有效避免模型在未知数据上出现的不可解释的误判现象。例如,在多语种OCR文字识别上,应用了本发明后,在各种语种的识别精度和召回上均比Google的OCR高了数个百分点,也解决了一些国内OCR供应商的识别错误问题。
②本技术可以较方便的集成进现有的各种图片模型训练过程中,只需要少量修改训练代码即可使用本发明中提到的方法。本发明既可用于新模型训练,又能用于已有模型的精调,兼容性强。从方案设计图中即可看到,应用本方案无需改变原有的网络结构,只需要增加一个对抗参数层,一个Loss函数,以及一个优化器即可。
③本技术占用的额外资源较少,只需要多占用约20%的显存,以及减慢大约50%的训练速度,与其他将对抗样本生成与模型训练分开的方案相比,有效的节省了资源。
④本技术提出的训练终止条件,可以由人工来观察模型的对抗样本变化情况,能够更直观的让人判定网络当前的收敛状态,在训练完毕以后能够对模型给出直观评价,能够预知模型在什么样本上能够正常工作。
知识产权情况 暂无
应用效果及市场前景 暂无
技术优势 暂无