GPT Understands, Too

개요

이 논문은 프롬프트에 학습가능한 임베딩 벡터를 추가해서 파인튜닝하는 방법인 P-Tuning을 처음 소개하였다.
AI Open Journal 2023에 출판되었다.

사전 학습된 언어 모델(PLMs)은 자연어 이해(NLU) 분야의 성능을 향상시켰다.
PLMs는 마스크드 언어 모델링, 오토리그레시브 언어 모델링, 시퀀스 투 시퀀스 모델링 등을 통해 훈련되었다.

프롬프트를 활용하면 PLM을 소규모 라벨링 데이터로 파인튜닝하거나, 모델을 프리즈한 상태로 다운스트림 태스크에 사용할 수 있다.
프롬프트 기반 학습은 여러 NLU 태스크에서 성능을 개선하는 데 사용되었다.

수작업으로 작성된 discrete prompt는 불안정성을 가진다.

few-shot 세팅에서는 이러한 문제가 더 두드러진다고 한다.
discrete prompt 불안정성때문에 적용이 잘 안된다고 한다.

기존 연구들은 자동으로 프롬프트를 탐색하는 방법을 시도하였다.

이 접근법들은 discrete prompt 자체의 딱딱 나눠져서 생기는 불안정성을 해결하지 못했다.
또한, 이렇게 분리된 공간적 정보에서는 역전파를 효과적으로 활용할 수 없다고 한다.

P-Tuning은 디스크리트 프롬프트의 불안정성을 완화하기 위해 제안되었다.

핵심 내용은 다음과 같다.

모델 설정:

기존 프롬프트 방식:

"The capital of [INPUT] is [LABEL]."

예시:

(Britain, London) → "The capital of Britain is [MASK]."

디스크리트 프롬프트와 입력 데이터를 함께 인베딩하여 모델에 입력한다.

P-Tuning은 연속형 임베딩을 사용한다.

[
{h_0, h_1, ..., h_i, e(x), h_{i+1}, ..., h_j, e(y), h_{j+1}, ..., h_k}
]

descrete 프롬프트와 continuous 프롬프트를 조합할 수 있고, 성능이 더 높다.
P-Tuning은 모델이 frezen되었거나 파인튜닝된 상태 모두에 적용 가능하다.

프롬프트 간 의존성을 모델링하기 위해
프롬프트 인코더(prompt encoder)를 사용한다.

P-Tuning은 두 가지 벤치마크에서 실험되었다.

또한, 프롬프트 간 성능 편차를 줄여 언어 모델 적응의 안정성을 높였다고 한다.

(자세한 실험내용은 논문 참조.)

Mixture of LoRA Experts (MoLE) (0)	2024.12.19
Improving Language Understanding by Generative Pre-Training (GPT1) (0)	2024.08.10
LoRA: Low-Rank Adaptation of Large Language Models (0)	2024.08.10