[용어] 딥시크 (DeepSeek)

딥시크(DeepSeek)란?

딥시크는 중국 스타트업 '딥시크'가 개발한 생성형 인공지능(AI) 서비스로 챗CPT와 비슷한 성능을 가지고 있지만 최대 10분의 1비용으로 개발에 성공해 많은 충격을 주고 있다. 또한 선보였던 모델인 R1을 MIT 라이선스 하에 완전 공개했다. 적은 비용으로 AI 서비스가 가능해 엔비디아 주가가 하루에 17% 하락하는 사태도 일어났다. 어떻게 이러한 기술을 선보일 수 있었는지 알아보자.

특징

  • 지식 증류 방식 사용
  • 규모의 법칙

1. 지식 증류(Knowledge Distillation)란?

"대형 AI 모델이 배운 중요한 정보만을 추출해 작은 모델에 전수하는 방식"으로 대형 모델(Teacher)이 작은 모델(Student)에게 중요한 지식을 전수하는 방식이다.

 

지식 증류 방식의 핵심 과정

  1. 대형 모델(Teacher)이 방대한 데이터에서 학습
  2. 학생 모델(Student)이 주요 지식만을 학습하여 경량화된 형태로 재학습
  3. 성능은 유지하면서도 더 가벼운 모델이 탄생

기존 방식과 차이점

  • 전통적인 모델 경량화 기법(양자화, 프루닝)보다 성능 저하 없이 효율적으로 압축 가능
  • 하드웨어 부담을 줄이면서도 AI 성능을 유지하는 방법

오픈소스끼리는 증류하는 방법이 가능하다. 딥시크는 메타, 알리바바 AI를 증류했다고 주장하지만 openAI는 자사의 지식을 무단으로 증류한 정황이 있다고 한다. (하단 참조 [딥시크 개발자 하드캐리 | 딥시크 기술분석 | 미친 최적화 4:45초) ]

 

2.  규모의 법칙(scaling Law)이란?

기존 AI 모델들은 "규모의 법칙", 즉 모델의 크기와 데이터, 연산량을 늘리면 성능이 향상된다는 원칙을 바탕으로 발전해왔다.

그러나 딥시크(DeepSeek)는 이 불문율을 깨뜨렸다.
전통적으로 AI 모델은 클수록 더 강력하다는 인식이 지배적이었지만, 딥시크는 비교적 적은 비용으로도 높은 성능을 내는 AI 모델을 구현해냈다.

이로 인해 비싼 연산 자원을 요구하는 기존 초거대 모델의 경제성이 흔들리면서, 고성능 칩에 대한 수요가 줄어들게 되어 엔비디아의 주가가 하락하는 결과로 이어졌다.

 

3.  보안 정말 괜찮을까?

우선 중국에 개인정보 유출에 대한 부정적인 인식이 절대적이기 때문에 현재 많은 국가들에서 제한 정책들을 내놓고 있다. 딥시크의 이용자 정보는 중국 서버에 저장이 된다. 또한, 당사자가 정보 수집을 명시적으로 거부할 때 정보 수집이 금지되는 제도인 "옵트아웃(Opt-out)"기능이 없기 떄문에 강제로 정보 수집이 되게 된다.

 

일본, 타이완 - 공무원이나 공공기관 중심으로 딥시크 사용 금지

미국- 의회와 국방부 직원들에게 접속 자체 금지

이탈리아 - 앱 다운로드 차단

대한민국 - 중앙부처와 17개 광역 지방자치단체에 생성형 AI 사용에 유의, 금지X 

 

참조

딥시크 개발자 하드캐리 | 딥시크 기술분석 | 미친 최적화

딥시크, 뭔데 이렇게 난리야?