Back to InsightsAI 애플리케이션

DeepSeek에 대한 생각

Mercury Technology Solutions2025년 2월 4일4 min read

TL;DR:DeepSeek는 오픈 소스 AI 모델로, 기술 대기업에는 최소한의 위협을 주지만 개인과 지식 근로자에게는 상당한 혼란을 초래합니다. 이는 기존 AI 비즈니스 모델에 도전하고 소규모 도메인 특화 AI 애플리케이션으로의 전환을 가속화하는 민주화된 기술 혁신의 힘을 보여줍니다. 그러나 이러한 민주화는 일자리 대체와 잠재적 오용과 같은 위험도 동반합니다.

소개

인공지능의 진화하는 환경에서 DeepSeek는 주요 기술 기업을 위협하는 것이 아니라 개인과 지식 근로자를 위한 기술 환경을 재편성함으로써 주목할 만한 플레이어로 등장합니다. 메타의 수석 AI 과학자인 얀 르쿤에 따르면, DeepSeek는 "오픈 소스 커뮤니티의 승리"입니다. 이 발전은 오늘날 오픈 소스 AI 모델이 제시하는 독특한 능력과 도전을 강조합니다.

DeepSeek의 출현은 불가피하다

왜 얀 르쿤의 발언에 주목해야 할까요? 이는 메타의 오픈 소스 접근 방식에 내재된 전략적 통찰력을 강조합니다. LLaMA라는 기초 모델은 DeepSeek의 길을 열었고, 알리바바 클라우드의 Qwen 및 미디어텍의 Breeze와 같은 다른 전문 모델에 영감을 주었습니다. 메타의 전략은 글로벌 혁신을 활용하여 커뮤니티 피드백을 통해 AI 모델을 개선하고 강화합니다.

메타에게 DeepSeek와 같은 모델이 가져온 기술 혁신은 예상된 것이었고, 불확실성은 어떤 팀이 먼저 이룰지를 두고 있었습니다. 오늘은 DeepSeek가 그 주인공이며, 내일은 다른 주체가 선두에 설 수 있습니다.

DeepSeek의 성공의 우연성

놀랍게도, DeepSeek는 처음에 암호화폐 채굴과 정량적 거래를 목표로 했습니다. 그들의 V3 모델은 부수적인 프로젝트로 시작되었다고 전해지며, 이 주장은 일부에 의해 의문을 제기받았지만 저에게는 공감이 됩니다. LLaMA 모델을 조정하는 기업들은 종종 AI를 새로운 경계로 탐색하며, 이 오픈 소스 프레임워크 내에서 방법을 실험합니다.

초기 채굴 팀은 GPU 클러스터 컴퓨팅을 최적화하는 방대한 기술 전문성을 축적했습니다. 보고서에 따르면 그들은 성능을 극대화하기 위해 CUDA보다 더 세분화된 언어인 PTX를 사용하기도 했습니다. 그들의 성과가 인상적인 것은 놀라운 일이 아닙니다.

그렇다면 정량적 거래 회사가 AI 모델링에 나선 이유는 무엇일까요? 그 동기는 AI가 글로벌 시장을 분석하고 수익성 있는 기회를 식별할 수 있는 잠재력에 있을 수 있습니다. 이는 자원이 풍부한 조직에게 매력적인 전망입니다.

DeepSeek의 영향

DeepSeek는 가격 구조에 상당한 혼란을 주며, 대규모 모델 API에 의존하는 AI 기업에 도전합니다. 효과적이라면, 이 접근 방식은 주요 기업들이 고객 서비스, 법률 상담 또는 의료 상담과 같은 분야를 위한 소규모 전문 모델을 개발할 수 있게 하여, 방대한 일반 모델에 의존하지 않고 API 비용을 줄일 수 있게 합니다.

얼마 전 OpenAI는 "크리스마스 12일" 행사에서 강화 학습 미세 조정을 도입하여 사용자가 최소한의 예제로 모델을 미세 조정할 수 있도록 했습니다. 저는 2025년이 비용 효율적인 도메인 특화 미세 조정의 해가 될 것으로 예상했습니다. 그러나 DeepSeek는 이 경로를 가속화하여 모델 훈련의 장벽을 낮추고 있습니다.

이것은 중요한 질문을 제기합니다: 모델을 처음부터 훈련하는 것이 더 나은가, 아니면 기존 모델을 미세 조정하는 것이 더 나은가?

좋은 소식은 여기서 끝납니다; 나쁜 소식은…

DeepSeek의 실험은 전통적인 스케일링 법칙을 넘어 모델 성능을 향상시키고 훈련 비용을 절감하는 여러 방법을 보여줍니다. 일부는 이것이 주요 AI 기업의 이점을 약화시킬 수 있다고 우려하지만, 저는 이를 긍정적으로 봅니다. 상당한 컴퓨팅 자원을 가진 기업들은 며칠 만에 DeepSeek의 모델을 복제할 수 있어, 소규모 팀들이 새로운 도메인에 진입할 수 있게 합니다. 중소기업조차도 이미 일부 학생 팀들이 보여준 것처럼 고급 AI 모델을 만들기 위해 필요한 컴퓨팅 파워를 활용하거나 임대할 수 있습니다.

왜 이것이 나쁜 소식일까요?

훈련 및 배포 장벽이 낮아짐에 따라, 더 많은 주체들이 틈새 모델을 개발할 것이며, 이는 AI로 전문 지식을 "해킹"할 가능성을 높입니다. 기업들은 내부적으로 AI를 채택해야 한다는 압박을 느낄 것이며, 이는 모든 기업에 필요한 업그레이드입니다. 초기 채택자들은 경쟁 우위를 가질 것입니다.

간단히 말해, AI는 특정 일자리를 대체하기 시작할 것입니다.

일자리 대체를 넘어, 더 어두운 측면이 있습니다: DeepSeek R1의 정렬 능력은 약합니다. 약간의 지식만 있으면 그 제한을 우회하기가 매우 쉽기 때문에, 이는 정교한 사기나 유해한 콘텐츠 생성을 위한 잠재적 악용 도구가 될 수 있습니다. DeepSeek는 통제할 수 없는 산불과 같습니다: 혁신의 잠재력을 지니고 있지만, 광범위한 피해를 초래할 가능성도 있습니다.

결론

어려움에도 불구하고 DeepSeek는 인류를 AGI(인공지능 일반)로 더 가까이 다가가게 합니다. AGI가 불가피하다면, 우리는 그 도전에 더 빨리 직면해야 합니다. 민주화된 기술이 혁신을 촉진하지만, 사회적 격차를 심화시킬 수도 있습니다. AGI로 나아가면서 AI의 부정적인 영향을 완화하는 것은 학문적 주의에서 공동의 책임으로 전환될 것입니다.

우리는 발견과 창조의 황금 시대에 살고 있습니다. 증인과 참여자로서, 저는 더 많은 혁신적인 발전을 기대하며 이 변혁의 길을 현명하게 헤쳐 나갈 수 있기를 바랍니다.

마지막으로, 우리의 논의에 비추어 볼 때, 저는 Nvidia의 Project Digits가 기업 전반에 걸쳐 표준이 될 것이라고 믿습니다. 이는 다양한 작업을 위한 다목적 도구가 될 것입니다.

Originally published on MTS Blog & Research