Skip to content

ImageCaptionReader 使用

Heda Wang edited this page Nov 28, 2017 · 2 revisions

FLAGS

用于训练

--reader=ImageCaptionReader

用于测试:

--reader=ImageCaptionTestReader

数据位置:

目录:

data/Loc_TFRecord_data # 不带框的数据
data/Newloc_TFRecord_data # 带框的数据

文件:

train*.tfrecord # 训练数据    
validate*.tfrecord # 验证数据    
test1*.tfrecord # 测试数据A    
test2*.tfrecord # 测试数据B,尚未生成

RL 训练:

开启 multiple references 使用多个 ref 评价 cider

--multiple_references=True  
--rl_training=True   
--rl_training_loss="SelfCriticalLoss"   
--document_frequency_file=data/document_frequency.json  

Bottom-Up Attention

开启带 Localization 的 Attention

--localization_attention=True  
--cropping_images=False