一种实时生成对抗样本的深度学习训练数据增广方法

2023-12-16 12:08:47

技术领域：新一代电子信息

所在地区：广东省/广州市/黄埔区

技术成熟度：暂无

转让方式：技术入股

交易价格：面议

联系人： 155*****198

联系人电话： 155****6198

所属单位名称：广东杰纳医药科技有限公司

单位简介：

广东杰纳医药科技有限公司是一家专业为药物研发而提供临床研究服务的合同研究组织（CRO）高科技企业（以下简称杰纳医药），主要是以临床试验为基础，覆盖临床研发阶段所有相关的研发服务。公司成立于2018年，注册资本2000万元，目前投资总额500万元；总面积2200平方米，在职人数85人。核心团队：创始人&CEO Gary xigui Huang(黄锡桂），毕业于中山医科大学，在杜兰大学医学中心临床试验中心和密歇根大学攻读博士和博士后学位。做过临床医生、博士后研究、软件开发，并曾经在 Novartis、Schering-Plough等多家药企工作，有着丰富的临床医学背景。介绍视频链接：-- 官网链接：www.q2bi.com 详细地址：广州市黄埔区掬泉路3号H栋6楼

成果详情 1.技术领域本项目属于深度学习中的训练方法。 2.本项目所要解决的技术问题 ① 在深度学习模型训练过程中，数据增广方法无法配合模型训练，无法针对性的生成难样本的问题。 ② 深度学习模型在训练过程中，参数容易收敛到局部最优解，导致模型鲁棒性较低的问题。 ③常见的对抗样本生成技术复杂性较高，无法应用到实时的模型训练过程中，无法动态的根据模型当前训练阶段生成对抗样本的问题。 3.本项目欲保护的技术关键点 ①提出了一种新型的在训练中实时增广数据的方法，使用网络梯度回传修改输入图片，生成对抗样本，并实时用生成的对抗样本来训练深度学习网络。 ② 使用两个优化器，在训练中分别对对抗参数层和网络参数进行优化，以达到一次前向就可以同时优化对抗参数和网络参数的效果。加速了对抗与训练。 ③步骤7中的两个终止训练条件：一是以验证集中简单样本比例来判断是否应当终止训练；二是人工观察由验证集生成的对抗样本，如果人都很难判定这些样本的类别，则可以终止训练。 4.本项目的有益效果包括： ①使用本技术中的数据增广方法，可以有效提升训练出来的深度学习模型鲁棒性，提升模型在实际应用时的精度和召回，能有效避免模型在未知数据上出现的不可解释的误判现象。例如，在多语种OCR文字识别上，应用了本发明后，在各种语种的识别精度和召回上均比Google的OCR高了数个百分点，也解决了一些国内OCR供应商的识别错误问题。 ②本技术可以较方便的集成进现有的各种图片模型训练过程中，只需要少量修改训练代码即可使用本发明中提到的方法。本发明既可用于新模型训练，又能用于已有模型的精调，兼容性强。从方案设计图中即可看到，应用本方案无需改变原有的网络结构，只需要增加一个对抗参数层，一个Loss函数，以及一个优化器即可。 ③本技术占用的额外资源较少，只需要多占用约20%的显存，以及减慢大约50%的训练速度，与其他将对抗样本生成与模型训练分开的方案相比，有效的节省了资源。 ④本技术提出的训练终止条件，可以由人工来观察模型的对抗样本变化情况，能够更直观的让人判定网络当前的收敛状态，在训练完毕以后能够对模型给出直观评价，能够预知模型在什么样本上能够正常工作。

知识产权情况暂无

应用效果及市场前景暂无

技术优势暂无

智能客服
需求发布
成果发布
入驻专家
入驻技术
经理人
返回顶部