1 of 17

3강 - 열려버린 판도라의 상자

AI의 확산, 그리고 필연적으로 도래할 충격들

KAIST 경영공학과 DFMBA

Chaesang Jung

2 of 17

Disclaimer

  • 영어와 한글이 어중간하게 섞여 있습니다.
  • 질문들은 여기로

  • 과목과 관련 적은 질문들은

3 of 17

1강 - 놀라움과 두려움 사이에서 등장하다

- 챗GPT의 탄생

2강 - 우리는 왜 챗GPT에 열광하게 되었나?

- 느닷없이 나타나는 능력, 인공일반지능(AGI)

3강 - 열려버린 판도라의 상자

- AI의 확산, 그리고 필연적으로 도래할 충격들

4강 - 몸에 대한 실험, 마음에 대한 실험

- 미디어는 메시지다

5강 - 인류는 어떻게 대응해야 하는가?

- 신뢰할 수 있는 인공지능을 향하여

4 of 17

3강 - 열려버린 판도라의 상자

- AI의 확산, 그리고 필연적으로 도래할 충격들

  • Open AI?
  • 마이크로소프트 AI 윤리팀 해고
  • ‘백화제방'의 시간이 시작되다
  • 우리에겐 해자가 없다
  • 게리 마커스의 다섯 가지 걱정
  • Don’t Look Up? 올려다보지 말라고?
  • 오리지널의 실종
  • 자연 독점
  • 오염된 데이터, 오염된 결과
  • 잘못된 학습, 차별의 재생산
  • 잊힐 권리와 지적재산권 침해
  • 미드저니 때문에… 모든 걸 잃었어요.

5 of 17

Open AI?

  • GPT-4는 스펙, 모델, 하드웨어 규모, 데이터 셋, 훈련 방법 모두 미공개

  • OpenAI vs Anthropic
  • Speak with OpenAI whisper API

6 of 17

마이크로소프트 AI 윤리팀 해고

  • ORA ( Office of Responsible AI ), Aether Committee, RAISE ( Responsible AI Strategy in Engineering )
  • At 3/14/2023

7 of 17

‘백화제방'의 시간이 시작되다

  • 2/24/2023 - LLAMA by Meta
    • 오픈소스로 공개
    • 70억 parameters ( vs 1,750억 GPT3.5 )
    • 10조 개 토큰으로 학습 ( vs 3,000억 GPT3 )

  • 3/13/2023 - Alpaca by Stanford

  • 8/22/2022 - Stable Diffusion by Stability AI
    • 오픈소스 라이센스
    • Text to image 생성형 인공지능 모델

8 of 17

우리에겐 해자(moat)가 없다

2023년 2월 24일 : LLAMA 출시

2023년 3월 3일: 피할 수 없는 일이 벌어지다

2023년 3월 12일: 토스터의 언어 모델

2023년 3월 13일: 노트북에서 fine tuning

2023년 3월 18일: 빨라지다

2023년 3월 19일: 13B 모델이 bard와 비슷한 성능을 달성하다

2023년 3월 25일: 나만의 모델 선택하기

2023년 3월 28일: 오픈소스 GPT-3

2023년 3월 28일: 1시간 안에 멀티모달 훈련 가능

2023년 4월 3일: 실제 인간은 13B 개방형 모델과 ChatGPT의 차이를 구분할 수 없다

2023년 4월 15일: ChatGPT 수준의 오픈소스 RLHF

9 of 17

게리 마커스의 다섯 가지 걱정

  1. 극단주의자들이 어마어마한 허위 정보를 생성해 민주주의와 공론을 쓸어버릴 것이다.
  2. 환각은 잘못된 의료 정보를 생성할 것이다.
  3. Content farm 들이 광고 클릭을 위해 사실과 상관 없는 자극적인 내용을 생성할 것이다.
  4. 챗봇은 일부 사용자들에게 감정적인 고통을 유발할 수 있다.
  5. 남용으로 인해 웹 포럼과 피어 리뷰 사이트를 붕괴시킬 것이다.

By Gary Marcus

10 of 17

Don’t Look Up? 올려다보지 말라고?

“Look Up!”

By Max Tagmark

인공지능이 어느 시점에 인공일반지능이 되는지

인간은 알 수 없음.

11 of 17

오리지널의 실종

  • 대규모 생성모델이 미래의 데이터 세트를 손상시킬 것인가?
    • DALL-E2, 미드저니, 스테이블 디퓨전으로 생성된 이미지로 학습 시도
    • 인공지능이 그린 그림이 많아질 수록 성능이 나빠짐

  • Clarkesworld
    • 표절작 때문에 폐쇄

  • Stackoverflow.com
    • ChatGPT로 대체됨

12 of 17

자연 독점

  • 2020. 12. Timmet Gebru
    • Stochastic Parrots

  1. 환경적 - 재정적 비용
  2. 거대언어모델이 이해할 수 없는 모델
  3. 연구의 기회비용
  4. 할루시네이션

//

// 주제는 타당하나 논문 발표 과정에서의 불협화음과 해고가 부당하지 않다는 개인적 의견

//

13 of 17

오염된 데이터, 오염된 결과

  • Imagenet roulette
  • Imagenet 분류가 편견의 모임들
  • 2,832개 사람 범주 중에서 1,593개 삭제

14 of 17

잘못된 학습, 차별의 재생산

  • 신용 평가 모델
    • 잠재적 패턴 중에 의도치 않은 성별, 인종 등의 차별이 적용됨.

  • 아마존 채용 시 서류 심사 시 bias

15 of 17

잊힐 권리와 지적재산권 침해

  • ChatGPT
    • 공개된 자료들이 써도 되는 것들인지 ?
    • 자료를 지우고 싶을 때 어떻게 ?
    • 프롬프트에 비밀이 오가게 될 때 처리들 ?
      • On-prem LLM 이 다시 화두에 오름

//

// 구글 검색 인덱스는 투명하게 하려는 노력

//

  • https://designer.microsoft.com/
    • New image for “apple tech” ?

16 of 17

미드저니 때문에… 모든 걸 잃었어요.

  • 생산성 때문에 회사들은 Midjourney 사용을 강제함

17 of 17

Questions