-
Notifications
You must be signed in to change notification settings - Fork 4
RL 训练参数尝试
limiao edited this page Nov 28, 2017
·
18 revisions
- 是否固定 Image Model
limiao: 目前都是固定Image Model的
- 尝试Adam训练
limiao: 目前Adam正在尝试1e-2,1e-3,1e-4,1e-5几种学习率,发现1e-2和1e-3都有问题 配置1: init_lr= 1e-4, decay=0.6, 每8个epoch decay一次
epoch | Bleu_4 | CIDEr | METEOR | ROUGE_L |
---|---|---|---|---|
643194 | 0.5345 | 1.6569 | 0.3905 | 0.6682 |
662220 | 0.5677 | 1.7897 | 0.4016 | 0.6843 |
681211 | 0.5647 | 1.8022 | 0.4020 | 0.6821 |
700125 | 0.5715 | 1.8214 | 0.4046 | 0.6857 |
720293 | 0.5736 | 1.8287 | 0.4039 | 0.6857 |
741736 | 0.5767 | 1.8431 | 0.4057 | 0.6879 |
760705 | 0.5797 | 1.8491 | 0.4061 | 0.6879 |
780968 | 0.5778 | 1.8439 | 0.4072 | 0.6887 |
802434 | 0.5779 | 1.8509 | 0.4066 | 0.6889 |
821201 | 0.5810 | 1.8578 | 0.4074 | 0.6887 |
841051 | 0.5812 | 1.8597 | 0.4077 | 0.6897 |
860083 | 0.5781 | 1.8594 | 0.4074 | 0.6893 |
880657 | 0.5787 | 1.8617 | 0.4069 | 0.6883 |
900000 | 0.5809 | 1.8604 | 0.4071 | 0.6890 |
- 尝试不同学习率
limiao: 目前SGD正在尝试了两种0.1和0.01两种学习率,decay factor还是0.6。 仅仅从训练集上的cider score变化看,“好像”0.1的学习率好一点,这个结论还有待继续验证
- 尝试加入Multi-Task loss