에이전틱 시스템의 학습
석사과정 성명기연구원
mg.seong@seoultech.ac.kr
2026.04.21
목차
에이전트 학습의 두 가지 방법
비모수적 학습 (Nonparametric Learning)이란? 모델 가중치를 변경하지 않고 성능을 향상시키는 방법
모수적 학습 (Parametric Learning)이란? 모델 가중치를 직접 업데이트해 성능을 향상시키는 방법
[특징]
비모수 학습
Example Learning
Reflexion
ExpeL
[특징]
보완점
[특징]
ICL (In-Context Learning)이란?
한계점
모수 학습
[1] Brown, T., Mann, B., Ryder, N., Subbiah, M., Kaplan, J. D., Dhariwal, P., ... & Amodei, D. (2020). Language models are few-shot learners. Advances in neural information processing systems, 33, 1877-1901.
모수 학습
파인튜닝(Fine-tuning)이란?
모수 학습
Instruction Tuning이란?
Dataset example
{
“instruction” : ~~
“output” : ~~
{
Parameter ↑
GPU ↑↑
[2] Wei, J., Bosma, M., Zhao, V. Y., Guu, K., Yu, A. W., Lester, B., ... & Le, Q. V. (2021). Finetuned language models are zero-shot learners. arXiv preprint arXiv:2109.01652.
모수 학습
LoRA (Low-Rank Adaptation)의 필요성
핵심 포인트
파인튜닝(Fine-tuning)의 한계 → 효율적인 파라미터 튜닝이 필요 → Parameter-Efficient Fine-Tuning(PEFT)
[실습] LoRA vs. SFT
LoRA가 SFT보다 낮은 loss와 높은 정확도를 기록한 이유