1 of 16

語言

模型

語言

模型

語言

模型

語言

模型

語言

模型

語言

模型

語言

模型

1

1

2

3

4

5

有那些在不訓練模型的情況下強化語言模型的方法

2 of 16

從《葬送的芙莉蓮》25, 26 話動畫講起

3 of 16

從《葬送的芙莉蓮》25, 26 話動畫講起

圖片來源:萌娘百科

GPT-4

其他模型

4 of 16

模型合作:讓合適的模型做合適的事情

語言模型A

(語言)

模型

語言模型B

語言模型C

判斷那一個工作該給誰

任務

輸入

不同能力、不同成本

其實在展示平台上為你服務的不一定是同一個模型

模型 A 就決定是你了

任務

輸入

任務

輸出

https://arxiv.org/abs/2305.05176

FrugalGPT

video:

https://youtu.be/vxxPtDCb9Go?si=WO4eqPTHDyS1pal3

https://youtu.be/VpKN3KvSK6c?si=lyqO8QSHBno89HIG

5 of 16

模型合作:讓模型彼此討論

語言

模型

任務輸入

……

……

語言

模型A

語言

模型B

任務輸入

任務輸入

……

……

……

……

……

反省

討論

6 of 16

模型合作:讓模型彼此討論

https://arxiv.org/abs/2305.19118

7 of 16

模型合作:多一點模型一起討論

https://arxiv.org/abs/2305.14325

8 of 16

模型合作:多模型怎麼討論

https://arxiv.org/abs/2312.01823

Exchange-of-Thought

不同任務最合適的討論方式是不一樣的

9 of 16

討論要怎麼停下來?

語言模型A

語言模型B

我覺得 …

我不同意 …

未達成共識,討論繼續

語言模型A

語言模型B

那我覺得 …

有道理 …

達成共識,結論是 ……

裁判

模型

裁判

模型

10 of 16

https://arxiv.org/abs/2305.19118

為反對而反對

討論會不會停不下來?

https://arxiv.org/abs/2305.14325

11 of 16

團隊需要有不同的腳色

七步之外,魔法快;

七步之內,斧頭快。

12 of 16

引入不同的腳色

https://arxiv.org/abs/2303.17760

把一個人活成一個團隊

CEO

完成某項專案

先做 A,再做 B,然後 C ……

寫程式

試用一下 …

給建議

加上 XX 功能

AI project manager

AI project manager

AI programmer

AI user

……

創造不同腳色:

  • 不同模型本來就有不同的專長
  • “你是一個 project manager ”

e.g. Code llama

13 of 16

https://arxiv.org/abs/2310.02170

CEO

先做 A,再做 B,然後 C ……

寫程式

試用一下 …

給建議

AI project manager

AI programmer

AI user

Dynamic LLM Agent Network

根據上述對話,給每個人的貢獻度打分數?

Programmer: 10, User: 8 …

Project manager: 7, User: 9 …

Project manager: 7, Programmer: 10 …

分數太低的之後就不參與工作

優化團隊

(學術論文目前通常是測試在比較簡單的任務上)

14 of 16

未來不需要打造全能的模型,語言模型可以專業分工,不同團隊可以專注於打造專業領域的語言模型

https://arxiv.org/abs/2308.00352

https://github.com/OpenBMB/ChatDev

MetaGPT

ChatDev

15 of 16

由 AI 組成的社群!

https://arxiv.org/abs/2304.03442

https://youtu.be/G44Lkj7XDsA?si=cMbKG3tqPbIgnnBq

16 of 16

語言

模型

語言

模型

語言

模型

語言

模型

語言

模型

語言

模型

語言

模型

1

1

2

3

4

5

有那些在不訓練模型的情況下強化語言模型的方法