-
Notifications
You must be signed in to change notification settings - Fork 315
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
模型训练详情 #35
Comments
作者的model是一个五层CNN,经过多次调参,测试集准确率最高到50%。 和同学探讨之后,认为模型(五层CNN)过于简单(也可能我们调参不够好),于是我们将模型换为了34层的残差网络res34-net,达到了测试集上86%的准确率。 86% Setting:1W例训练集、1000例测试集、15-30个epoch、64大小batch_size、学习率0.0002,loss最终在0.001左右。 |
另外,作者的版本为CPU版本,改成GPU版本的跑起来会很快(如果有一块不错的显卡),欢迎大家把更高准确率的模型训练详情po在这里,一起学习,共同进步! |
我也是新手,才做了3天, |
请问你们用的loss也是MultiLabelSoftMarginLoss吗?只是把backbone换成ResNet34其他的都没动么? |
没错,没有改动别的,只有模型层。
…----------
该邮件从移动设备发送
--------------原始邮件--------------
发件人:"燦哲 "<[email protected]>;
发送时间:2020年6月11日(星期四) 中午11:11
收件人:"dee1024/pytorch-captcha-recognition" <[email protected]>;
抄送:"zzh "<[email protected]>;"Author "<[email protected]>;
主题:Re: [dee1024/pytorch-captcha-recognition] 模型训练详情 (#35)
-----------------------------------
作者的model是一个五层CNN,经过多次调参,测试集准确率最高到50%。
和同学探讨之后,认为模型(五层CNN)过于简单(也可能我们调参不够好),于是我们将模型换为了34层的残差网络res34-net,达到了测试集上86%的准确率。
86% Setting:1W例训练集、1000例测试集、15-30个epoch、64大小batch_size、学习率0.0002,loss最终在0.001左右。
请问你们用的loss也是MultiLabelSoftMarginLoss吗?只是把backbone换成ResNet34其他的都没动么?
—
You are receiving this because you authored the thread.
Reply to this email directly, view it on GitHub, or unsubscribe.
|
我们把作者的5层的模型改了下,在10万的training_set和1万的test_set上30个epoch后最后loss大概0.6,测试准确度大概76%. |
没有,torch.nn里定义好的模型 |
训练数据10w,1k图片测试准确率96% 把作者CNN特征提取的dropout去掉,只留下Linear层的dropout, |
感谢楼主,按照楼主方法,5个字符长度,1w训练集,500测试集完全用楼主参数精度只有22%。后来动态调整了lr, |
模型简单只会欠拟合,目前这个情况看来是作者释放的模型超参有问题,具体改法你可以看看其他人的分享~ |
感谢分享! |
感谢分享! |
基于以上修改,20W training data, 2k test data, feature extract增加到7层,最后几层输出通道改128,lr=0.0002,epochs=150,batch_size=64。测试正确率在98.8%到99%之间 |
训练集10w、测试集1000、epoch30、batch_size64、学习率0.0002, 我将模型的卷积层全部去掉,换成了pytorch官方预训练好的resent34,并将resnet最后一层的fc改为了作者模型倒数第二层的fc,将模型移至gpu上训练,30轮后损失在0.001上下,测试集准确率为96%左右 |
求教97%准确率模型的超参设置和数据集划分,谢谢了~
The text was updated successfully, but these errors were encountered: