MLDS HW2-1
TAs
ntu.mldsta@gmail.com
HW2-1 Update (4/19)
�
Data & format
�
更新 dataset:�
因為助教需要另外生成TAreview的output,�為了讓script的argument較為簡單,所以
把testing_data 移動到testing_data內�並改名為id.txt�把training_data移動到training_data內
並改名為id.txt�所以只需要輸入資料夾名稱,便可以直接生成
該資料夾影片的captions
ç√Ω
ç√Ω
Submission & Rules
助教除了會使用到testing_data這個資料夾之外,還會另外使用到ta_review_data這個資料夾來生成ta_review的句子。�Your script should be done within 10 mins excluding model donwloading.
Outline
Timeline
Two Parts in HW2
Schedule
Task Descriptions
HW2-1: Video caption generation
�
HW2-1: Video caption generation
�
HW2-1 Introduction
( In this task, video features will be provided )�
Input
Output
“a man is playing a song on the piano”
HW2-1 Sequence-to-sequence 1/5
encoder
decoder
<BOS>
<EOS>
HW2-1 Sequence-to-sequence 2/5
HW2-1 Sequence-to-sequence 3/5
HW2-1 Sequence-to-sequence - S2VT 4/5
Refer to the following paper for detailed info:
http://www.cs.utexas.edu/users/ml/papers/venugopalan.iccv15.pdf
HW2-1 Sequence-to-sequence - S2VT 5/5
HW2-1 Training Tips - Attention 1/3
HW2-1 Training Tips - Schedule Sampling 2/3
HW2-1 Training Tips - Beam search 3/3
HW2-1 How to reach the baseline ? 1/2
where c = candidate length, r = reference length
HW2-1 How to reach the baseline ? 2/2
Data & format
�
更新 dataset:�
因為助教需要另外生成TAreview的output,�為了讓script的argument較為簡單,所以
把testing_data 移動到testing_data內�並改名為id.txt�把training_data移動到training_data內
並改名為id.txt�
ç√Ω
ç√Ω
Submission & Rules
Submission & Rules
Submission & Rules
助教除了會使用到testing_data這個資料夾之外,還會另外使用到ta_review_data這個資料夾來生成ta_review的句子。��Your script should be done within 10 mins excluding model donwloading.
Grading Policy
- Grammar score (2%)� - Relative score (2%)
Grading Policy - Report (7%)
Grading Policy - NOTICE
Q&A
ntu.mldsta@gmail.com
Q1: 請問助教會跑training的程式嗎?
A:不會。 我們所規定的十分鐘只包含testing。除非我們認為有必要就會請你們來跑training的code。
Q2: 有推薦上傳model的平台嗎?
A:dropbox, google drive都是大家常用的平台。 不過推薦大家可以使用gitlab,操作方法與github類似,但是可以上傳大容量的檔案。
p.s. github 單一檔案上傳上限為100MB, 若超過50MB則會出現警告,但依舊能上傳。也可參考網路上的教學 (ref) 。
Q3: test set 的答案怎麼一起給了?
A:因為沒有Kaggle,方便大家validation 和測準確率,因此也給大家testset 的答案。
Q4: data 裡的feature是怎麼抽的呢?
A:pretrain在ILSVRC的VGG19。
80*4096維的feature,是指每個影片抽80個frame,每個frame有4096維feature。
Q5: Average bleu score 是怎麼算的呢?
A:對於每個影片,你的答案會對他的所有的字幕算bleu score。將所有影片的分數取平均後,就是你的總bleu score。
p.s. 詳細演算法請見 bleu_eval.py