Skip to content

RL 训练参数尝试

limiao edited this page Nov 24, 2017 · 18 revisions

几个方向

  • 是否固定 Image Model

limiao: 目前都是固定Image Model的

  • 尝试Adam训练

limiao: 准备尝试使用Adam训练

  • 尝试不同学习率

limiao: 目前正在尝试两种0.1和0.01两种学习率,decay factor还是0.6。 仅仅从训练集上的cider score变化看,“好像”0.1的学习率好一点,这个结论还有待继续验证

  • 尝试加入Multi-Task loss