Skip to content

RL 训练参数尝试

limiao edited this page Nov 28, 2017 · 18 revisions

几个方向

  • 是否固定 Image Model

limiao: 目前都是固定Image Model的

  • 尝试Adam训练

limiao: 目前Adam正在尝试1e-2,1e-3,1e-4,1e-5几种学习率,发现1e-2和1e-3都有问题 配置1: init_lr= 1e-4, decay=0.6, 每8个epoch decay一次

epoch Bleu_4 CIDEr METEOR ROUGE_L
643194 0.5345 1.6569 0.3905 0.6682
662220 0.5677 1.7897 0.4016 0.6843
681211 0.5647 1.8022 0.4020 0.6821
700125 0.5715 1.8214 0.4046 0.6857
720293 0.5736 1.8287 0.4039 0.6857
741736 0.5767 1.8431 0.4057 0.6879
760705 0.5797 1.8491 0.4061 0.6879
780968 0.5778 1.8439 0.4072 0.6887
802434 0.5779 1.8509 0.4066 0.6889
821201 0.5810 1.8578 0.4074 0.6887
841051 0.5812 1.8597 0.4077 0.6897
860083 0.5781 1.8594 0.4074 0.6893
880657 0.5787 1.8617 0.4069 0.6883
900000 0.5809 1.8604 0.4071 0.6890
  • 尝试不同学习率

limiao: 目前SGD正在尝试了两种0.1和0.01两种学习率,decay factor还是0.6。 仅仅从训练集上的cider score变化看,“好像”0.1的学习率好一点,这个结论还有待继续验证

  • 尝试加入Multi-Task loss