最先端NLP 2021
神藤 駿介(東大 宮尾研 M2)
ACL 2021
1
概要
要約 : Pretrained LM が Syntactic Test を解くメカニズムを因果媒介分析で調査
The man that the friends love _____
laugh / laughs
どっちが正しいか判断
Pretrained LM
Syntactic Test
活用の正しさが分かる
= 主語を把握している
= 統語構造を把握している
因果媒介分析
モデルのどの辺りがタスクを解くのに寄与しているか分析
2
研究背景 ~ Syntactic Test
言語モデルの文法把握能力を測定したい … 主語と動詞の一致を活用
3
✔
❌
The farmer that the parents love *confuse/confuses .
研究背景 ~ Causal Mediation Analysis (因果媒介分析)
★二つの変数の因果関係を、ある変数が媒介するかを分析
例:タバコ → 肺炎
本研究
タバコ
ニコチン
肺炎
二つの文章
Model Component
予測結果
Control Variable
Response Variable
Mediator
4
X
Y
M
Total Effect
Indirect Effect
XがYに与える影響の総量
Total Effect のうちのMの影響
いろんな成分が原因
ニコチンも原因の一つ
どれだけきちんと予測できるか
モデルのどの部分が予測に寄与するか
実験の前提 ~ 各変数の設定
Control Variable
二つの文章
Model Component
予測結果
→ 主語の単複を変えた2つの文章
Response Variable
→ 2つの候補となる単語の予測確率の比
The farmer(sg) that the parents love ____
The farmers(pl) that the parents love ____
主語が単数形の文章 (farmer)
動詞を複数形(pl)と予測 (confuse)
動詞を単数形(sg)と予測 (confuses)
※ y < 1 なら正しく予測できている
5
実験の前提 ~ モデルとデータセット
モデル:Transformer-based を調査
データセット:6カテゴリの Syntactic Test
6
実験1:Total Effect の測定
二つの文章
Model Component
予測結果
★ Total Effect (TE) : y の相対変化量で定義
7
y
Total Effect の結果
8
Total Effect の結果
主語と動詞が隣り合うケース:大体似た傾向(比較的高め)
distractor で阻まれているケース: TEが最も高い(!)← 副詞は動詞のサイン?
9
Total Effect の結果
attractor で阻まれているケース
:TEは低い傾向 = 比較的難しいタスク(直観通り)
10
Total Effect の結果
モデルサイズの影響:あまり一貫していない(大きければ良いという話ではない)
(例:PP, RC 系は Medium が大体良い・distractor 系は小さい方が良い
11
実験2:Indirect Effect の測定
二つの文章
Model Component
予測結果
★ Natural Indirect Effect (NIE)
TE と全く同じ定義(y の相対変化量)
扱うモデルが変化(=確率値が変化)
12
y
Indirect Effect の結果 ~ GPT-2
13
※各レイヤにおける NIE が上位5%のニューロンの平均をプロット
Indirect Effect の結果 ~ GPT-2
14
主語と動詞が隣り合うケース (local)
Indirect Effect の結果 ~ GPT-2
15
主語と動詞が離れているケース (non-local)
Indirect Effect の結果 ~ GPT-2
モデルサイズの影響
16
Indirect Effect の結果 ~ GPT-2 と他のモデルの比較
17
GPT-2 Medium
Transformer-XL
XLNet
Indirect Effect の結果 ~ GPT-2 と他のモデルの比較
18
GPT-2 Medium
Transformer-XL
XLNet
local / non-local で異なる傾向が見られるという点でGPT-2 と共通している
Indirect Effect の結果 ~ GPT-2 と他のモデルの比較
19
GPT-2 Medium
Transformer-XL
XLNet
local / non-local 問わず似たような傾向
結論
20
コメント
21