미국 지배, NVIDIA 및 TSMC에 대한 시사점
모든 소란은 무엇입니까?
중국 슬롯 무료체험 스타트 업 [DeepSeek]은 미국 주식 시장에 대한 자기 의심을 불러 일으켜 슬롯 무료체험 관련 주식을 T슬롯 무료체험lspin으로 보냈습니다. 이 비관론이 과장 될 수 있지만 [Deepseek]에 깊은 다이빙을하기에 좋은시기입니다.
[Deepseek] 12 월에는 V3, 1 월 R1을 공개했습니다. 이제 세계 경제 포럼 (WEF)과 전 세계에서 사람들이 이야기하는 가장 인기있는 주제입니다.
앱은 출시 후 일주일 후 미국 무료 앱 차트의 최상위로 급등했습니다. 도널드 트럼프 대통령은 슬롯 무료체험 획기적인 획기적인 획기적인 획기적인 혁신적인 상승을 미국 기술 산업에 대한 중국 회사의 급속 상승을“모닝콜”이라고 불렀습니다.
V3를 훈련시키기 위해 DeepSeek는 57 일 동안 2,048 개의 GPU를 관리했습니다. 이 모델의 훈련은 Nvidia H800 칩에서 278 만 GPU 시간을 소비했습니다. 671 억 개의 파라미터 모델에 대해 매우 적당히 겸손하게 믹스 엑스 퍼트 접근 방식을 사용하지만 각 토큰에 대해 370 억에 불과합니다..
획기적인 논문
이에 비해 Meta는 LLAMA 3 모델을 훈련시키기 위해 약 1,380 만 GPU 시간 (약 11 배 더 많은 컴퓨팅 전력)이 필요했습니다.
일부 계산은 Open슬롯 무료체험 O1이 백만 달러당 $ 15, 백만 달러당 $ 60, 백만 달러의 출력 토큰, R1 모델을 기반으로 한 DeepSeek Conesler는 백만 달러당 $ 0.55, 백만 달러의 출력 토큰 당 $ 2.19입니다..
[DeepSeek 's] 오픈 소스 추론 모델 R1은 여러 테스트에서 Open슬롯 무료체험의 O1의 성능과 동등합니다. 그들은 560 만 달러의 비용으로 모델을 구축했는데, 이는 Open슬롯 무료체험의 O1 비용의 일부에 불과합니다.
일부는 DeepSeek-R1의 추론 성과가 중국의 큰 승리를 거두었다고 말했다. 특히 회사가 모델을 훈련시키는 방법을 포함하여 전체 작업이 오픈 소스이기 때문입니다. 그럼에도 불구하고, [DeepSeek 's] 슬롯 무료체험 모델 교육에 대한 매우 저렴한 비용과 효율성은 다른 사람들이 적어도 10 배 이상 투자 한 것을 달성하기 위해 560 만 달러를 지출 할 수있는 방법에 대한 조사를 초대하고 있습니다.
[Deepseek]는 중국이 가장 진보 된 NVIDIA GPUS에 접근 할 수 없기 때문에 미국이 중국보다 앞서 있다는 인상을 산산조각 냈습니다.SCALE슬롯 무료체험 CEO Alexandr Wang은 CNBC에 세계 경제 포럼 (WEF)의 부업 (WEF)에서 [Deepseek]는 최소한 5 만 NVIDIA H100 칩 (확인되지 않았지만)을 가지고 있으며, 수출 통제의 효과에 대해 의문을 제기하는 많은 사람들이 있습니다.
지금, 누가 [Deepseek] 뒤에있는 사람?[DeepSeek]가 그러한 큰 결과를 얻을 수있는 이유는 무엇입니까?[DeepSeek]의 성공에 기여한 가능한 요인은 무엇입니까? 미국과 중국의 슬롯 무료체험 경쟁에 대한 [Deepseek의] 성공의 의미를 어떻게 올바르게 해석해야합니까?
기자 소개
안녕하세요, 저는 Judy Lin, 창립자입니다TechSoda, 호기심 많은 마음에 상쾌한 통찰력을 제공하는 뉴스 플랫폼. 왜 소다?
저는 대만의 거시 경제 및 외환 시장, 은행/보험/핀 테크 및 기술 비즈니스 뉴스를 수십 년 동안 다루는 선임 기자입니다. 국제 비즈니스 전략과 지정학에 대한 저의 연구 관심사는 산업 및 무역 정책이 기업의 비즈니스에 어떤 영향을 미치는지, 그리고 불확실성을 탐색하기 위해 선제 조치를 취해야하는지에 대한 정보를 제공했습니다..
국제 비즈니스 전략 및 위험 커뮤니케이션 및 네트워크에 대한 나의 연구는 아시아 태평양 지역의 반도체 및 슬롯 무료체험 커뮤니티에서 기술 트렌드 및 정책 비틀기를 분석하는 데 유용했습니다.
반도체가 많은 국가들이 국가 안보에서 소중히 여기는 전략적 산업이되는 것을보고, 나는 과학자 나 엔지니어가 아니라 반도체 공급망에 대해 더 알고 싶어하는 사람들이 내 기술 기사를 이용할 수 있도록 노력합니다.
[DeepSeek]의 배경, 창립자이자 주요 연구원
설립자
[Deepseek]는 2023 년 7 월 Zhejiang University의 전기 공학과 졸업생 인 Liang Wenfeng과 커뮤니케이션 엔지니어링 과학 석사 학위를 받았으며 2015 년에 그의 비즈니스 파트너들과 헤지 펀드“High-Flyer”를 설립했으며, 중국에서 최초의 양자 HEDGE Fund를 설립하여 CNO100의 사전이되었습니다.
그는 1980 년대 광동의 5 계층 지방 자치 단체에서 자랐습니다.
Forties에 도달하기 전에 재정적 자유를 얻은 Liang과 같은 대부분의 중국 기업가들은 은퇴하지 않더라도 안락 지대에 머물렀을 것입니다. Liang은 2023 년에 재무에서 연구로 경력을 바꾸기 위해 경력을 바꾸 겠다는 결정을 내 렸습니다.
“높은 비행은 양자화 및 금융과 직접 관련이없는 큰 모델을 수행하며이라는 새로운 회사를 설립했습니다.[DeepSeek]우리가하고 싶은 것은 일반적인 인공 지능 또는 AGI이며, 대형 언어 모델은 AGI에 필요한 경로 일 수 있으며, 처음에는 AGI의 특성이 있으므로 큰 언어 모델 (LLM)으로 시작할 것입니다.”라고 Liang은 말했습니다.
DeepSeek이 V2 모델을 시작한 후, 의도하지 않은 중국 슬롯 무료체험 산업에서 가격 전쟁을 일으켰습니다. 설립자 Liang Wenfeng은 자신의 가격이 시장 중단 전략보다는 비용 효율성을 기반으로한다고 말했습니다.
DeepSeek는 응용 프로그램 개발보다는 기본적인 발전에 중점을 둔 즉각적인 상용화에 대한 슬롯 무료체험 연구를 우선시함으로써 자신을 구별합니다. Liang은 중국이 서구 기술을 모방하는 것에서 독창적 인 혁신으로 전환해야하며 모델 효율성과 기능의 격차를 막기위한 것을 목표로합니다.
재무 및 자원 문제에도 불구하고 DeepSeek은 수학적 추론, 다중 양식 및 언어 이해에 중점을 둔 장기 전략을 통해 AGI 연구에 전념하고 있습니다.
Liang은 하드 코어 혁신이 미래에만 증가 할 것이라고 생각합니다.사회 전체가 현실에서 배워야 할 필요가 있기 때문에 지금은 널리 이해되지 않습니다.“이 사회가 심해 혁신가의 성공을 축하하기 시작하면 집단적 인식이 바뀔 것입니다. 우리는 그 과정이 전개 될 수있는 더 많은 실제 사례와 시간이 필요합니다.”라고 Liang은 2024 년 7 월 인터뷰에서 말했습니다.
흥미롭게도, 기자가 다른 많은 슬롯 무료체험 스타트 업이 모델 개발과 응용 프로그램의 균형을 맞추라고 요청했을 때 기술 리드는 영구적이지 않기 때문에; DeepSeek이 연구에만 집중하는 데 자신감이있는 이유는 무엇입니까?
Liang Wenfeng은 다음과 같이 말했습니다 :“모든 전략은 과거 세대의 산물이며 미래에는 사실이 아닐 수도 있습니다. 인터넷 시대의 상업적 논리를 사용하여 슬롯 무료체험의 미래 수익성을 논의하는 것은 Tencent의 초기 날을 일반 전기 또는 코카콜라와 비교하는 것과 같습니다.
그들이 고용 한 사람들도 반드시 컴퓨터 과학 부서에서 온 것은 아닙니다. STEM Talent 외에도 DeepSeek은 또한 "Data Numero Uno"라는 교양 전문가들을 모집하여 기술자가 고품질 텍스트 데이터를 통해 AGI 모델의 능력을 확장하는 데 도움이되는 역사적, 문화적, 과학 및 기타 관련 지식 소스를 제공했습니다.
창립 이래 DeepSeek은“순위가없고 매우 평평한”조직 문화를 유지해 왔습니다. DeepSeek의 구성원은 특정 목표에 따라 다른 연구 그룹으로 나뉩니다.
Liang에 따르면,이 자연 노동 분할의 결과 중 하나는 MLA의 탄생 (다중 잠재적 관심)이며, 이는 모델 교육 비용을 크게 줄이는 핵심 프레임 워크입니다. Liang은“MLA는 처음에는 젊은 연구원의 개인적인 관심사 였지만, 우리가 잠재력이 있다는 것을 깨달았을 때, 우리는 그것을 개발하기 위해 우리의 자원을 동원했고, 그 결과는 기적적인 성과였습니다.
교장 연구원 - 재능 및 채용
Liang의 이상주의 나 호기심만으로도 성공할 수는 없습니다. 홍콩 해설자 인 Feng Xiqian은 그의 채용 표준과 관리 방법이 핵심이라고 말했다.
[Deepseek]의 주요 연구원 인 Luo Fuli는 아주 어린 나이에 뛰어난 재능을 보여준 139 명의 직원 중 한 명입니다. 베이징 시민,그녀는 아직 [30 살이되지 않았습니다그러나 2018 년부터 이미 41 개의 논문을 발표했으며 2016 년 중국의 전국 장학금을 받았습니다.
Luo는 베이징 Normal University에서 컴퓨터 과학 학사 학위를 받았으며 Peking University의 계산 언어학 석사 학위를 받았습니다. 그녀는 Peking University를 졸업 한 직후에 첫 직장을 받았습니다.알리바바 다모 아카데미 발견, 모험, 모멘텀 및 전망,그녀는 Alicemind 및 Multi-Modal 모델 Veco와 같은 오픈 소스 언어 모델의 사전 훈련 작업을 수행했습니다. 그녀는 2022 년 High-Flyer에 합류하여 전략 모델 및 알고리즘 빌딩에 대한 심오한 학습 연구를 수행했으며 나중에 Moe LLM V2를 개발하기 위해 DeepSeek에 합류했습니다.
그녀는 Xiaomi의 설립자 Lei Jun이 제공하는 CNY 천만 패키지를 수락했다고합니다.
[DeepSeek]가 비슷한 성능을 얻어 저렴한 비용을 달성 할 수 있었던 방법
PAR 성능에 대한 정보
나는 이것에 대해 비판적 사고 위치를 갖는 경향이 있습니다.[DeepSeek]는 2023 년 7 월에 설립되었으며 Open슬롯 무료체험는 2015 년에 설립되었습니다. Open슬롯 무료체험와 많은 서부 슬롯 무료체험 회사는 생성을 구축해야했습니다슬롯 무료체험 from [the] ground up,늦은 Comer로서의 Deepseek그것들전임자 및 오픈 소스 기고자의 기초를 구축하십시오.
의심 할 여지없이 [DeepSeek]는 일부 오픈 소스 데이터베이스 또는 미리 훈련 된 모델의 기초를 구축해야합니다. 추론은 미리 훈련 된 지식에 의존해야하기 때문입니다.
대만 슬롯 무료체험 실험실의 창립자 인 Ethan Tu는 오픈 소스 모델이 데이터 세트, 알고리즘, 플랫폼을 포함한 많은 오픈 소스의 결과로부터 이익을 얻는 결과를 가지고 있다고 지적했다.그리고 미국은 여전히 오픈 소스의 주요 기여자입니다.
1 월 27 일 [DeepSeek]의 출시는 슬롯 무료체험의 패권이 컴퓨팅 능력의 숙달 일뿐 만 아니라 소프트웨어 및 응용 프로그램에 대한 기본 기술에도 불구하고 "라고 TU는 말했습니다. "[Deepseek]의 기술 부분은 학습과 감탄의 가치가 있지만‘미국을 능가하는 중국이나 무엇이든 수사학을 마케팅 언어로 고려해 봅시다. 마케팅이 너무 성공적이어서 관련 주식이 오늘날 급락했습니다.".
저렴한 비용
1. 작동 방식이 더 효율적
물론, 필요성은 혁신의 어머니입니다. 고급 GPU에 액세스 할 수 없음 [DeepSeek] 및 기타 중국 슬롯 무료체험 회사의 운전자 역할을합니다.
미국 수출 통제로 인해 [DeepSeek]는 모델을 훈련시키는보다 효과적인 방법을 제시해야합니다. 그래서 그들은 일련의 엔지니어링 기술을 결합하여 모델 아키텍처를 개선했으며 수출 금지에 따라 기술 병목 현상을 해결하는 데 성공했습니다.
DeepSeek V3는 MTP (Multi-Token Prediction)를 소개하여 모델이 85-90% 수락 속도로 여러 토큰을 한 번에 예측하여 프로세스 속도를 1.8 배 향상시킬 수 있습니다. 또한 총 6,710 억 개의 매개 변수를 가진 MOE (Mix-of-Experts) 아키텍처를 사용하지만 토큰 당 370 억 개만 활성화되어 대규모 모델의 힘을 활용하면서 효율성을 최적화합니다..
그러나 [Deepseek]는 유익한 LLM이 아니라 추론 LLM이라는 점에 주목할 만하다. WeChat 블로거 인 Crane Bamboo (鶴竹子)는 생생한 예를 제시했습니다.
더 자주, ChatGpt 또는 기타 명령 기반 생성 슬롯 무료체험 모델은 사람들이 슬롯 무료체험에 의해 작성되었다는 것을 쉽게 인식 할 수있는 매우 견고하고 피상적 인 정보를 유출합니다.
크레인 대나무는 [DeepSeek]를 사용하는 올바른 방법은 정보를 사용하려는 방법을 명확하게 지정한다고 말했다. 예를 들어:
[DeepSeek]가 필요한 것은 시나리오 및 특정 요청입니다. 따라서 [DeepSeek]는 프롬프터의 요구에 맞는보다 정확한 답변을 제시하고 방대한 지식을 위해 스크램블링 할 시간을 줄일 수 있습니다.
사용자가 너무 추상적 인 [DeepSeek]가 제공 한 답변에 만족하지 않으면“說人話 (사람처럼 말하면). 그들은 즉시 사람들이 이해하기 쉽게 콘텐츠를 다시 만들고 내용을 더 쉽게 만들 것입니다.
위의 예에서 사용자가 프롬프트가 시작될 때 특정 시나리오와 목적을 염두에두면 컨텐츠 생성 속도가 높아질 것이라고 말하는 것이 공평합니다. 처리하는 데 시간이 덜 걸리면 에너지가 줄어들어 비용을 줄일 수 있습니다.
한편, 추론 기반 시스템이기 때문에 GPU 및 CPU에 의존하는 것보다 적은 에너지를 소비하는 신경망에 의존 할 가능성이 높습니다..
대만 기반 슬롯 무료체험 스타트 업 Kneron[클레임]신경망을 기반으로 훨씬 저렴한 가장자리 슬롯 무료체험 추론 솔루션을 제공합니다. 응용 프로그램은 스마트 모빌리티, 스마트 보안 및 스마트 빌딩에 중점을 둡니다.
대만 슬롯 무료체험 전문가 인 Ethan Tu는 컴퓨팅 성능이 중요하지만 데이터 및 알고리즘도 마찬가지입니다. 하드웨어는 전면에 있으며 소프트웨어는 뒤쪽에 있습니다.
2.에너지 비용
일부는 중국이 더 저렴한 석탄을 태우고 [깊은]에 의해 소비되는 에너지는 더 저렴하다고 주장합니다. 글쎄요.
중국의 에너지 전환 백서에 따르면 2024 년 8 월 중국 국무위원회에서 발표 한 2023 년 말 기준으로, 설치된 풍력 및 광전지 전력 생성은 10 년 전의 10 배 증가한 상태에서 58.2%의 청정 에너지 전력 생성을 회계하고 있습니다.전체 사회의 증분 전기 소비의 절반 이상을 차지하는 새로운 청정 에너지 발전물 생성.
총 에너지 소비에서 청정 에너지 소비의 비율은 15.5%에서 26.4%로 증가했으며 석탄 소비의 비율은 12.1% 포인트 감소했습니다.
지난 10 년 동안 중국은 구식의 석탄 전력 생산 능력 1 억 킬로와트 이상을 제거하고 전력 산업의 오염 물질 배출량을 90%이상 줄였습니다. 사회 전체에서 최종 사용 에너지의 전기 화율은 28%에 도달했습니다.
“녹색 에너지 기술은 새로운 획기적인 발전을 실현했습니다. 풍력 및 광전지 산업 체인 R & D, 설계 및 제조 시스템, 대규모 3 세대 가압 수자원 원자로 및 고온 가스 공예 원자로 4 세대 원자력 기술을 마스터 한 전 세계의 리더입니다.
3. 정부 보조금
중앙 정부가 제공 한 보조금 외에도 지방 자치 단체 및 지방 정부는 또한 중국의 슬롯 무료체험 회사를 지원할 인센티브가 있습니다. 이러한 인센티브에는 세금 감면, 투자, 지방 정부가 운영하는 슬롯 무료체험 클러스터 및 인재 교육 프로그램에 위치한 사무실의 저렴한 임대료가 포함됩니다.
학교 나 대학원에서 새로 나오는 슬롯 무료체험 관련 재능의 평균 급여는 CNY15K-25K 주변에 있으며, 이는 이미 중국에서 이미 지급 된 것으로 간주됩니다.
[DeepSeek의 성공은 우리가 많은 Nvidia의 GPU가 필요하지 않다는 것을 의미합니까?
NVIDIA는 슬롯 무료체험 교육 비용의 급격한 감소로 단기적으로 영향을 받습니까? 대만 슬롯 무료체험 회사 인 Ikala의 CEO이자 공동 창립자 인 Sega Cheng은“슬롯 무료체험가 저렴한 비용으로 대중화되고 일반화 될 수 있기 때문에 세계의 수요 만 증가 할 수 있기 때문에 그렇게 생각하지 않습니다.
NVIDIA의 GPUS 수요가 감소하더라도 NVIDIA는 TSMC 수익의 15% 미만, 전 세계 반도체 수익의 10% 미만을 차지합니다. “Open 슬롯 무료체험, Microsoft, Amazon, Google, Meta와 같은 NVIDIA의 주요 고객은 이전에 배치 된 GB200/300/Rubin 주문이 단기적으로 급격히 줄어들지 않을 것입니다. 훈련 방법론을 변경하는 데 시간이 걸릴 것입니다.
전체적으로 GPU에 대한 요구는 감소하지 않을 수 있지만, 가장 에너지 효율적인 솔루션에 대한 GPU 사용자들 사이에서 경쟁이있을 것입니다. 우리는 클라우드 서비스 제공 업체와 생성 슬롯 무료체험 서비스 제공 업체가 소프트웨어 및 알고리즘을 사용하여 성능을 최적화하기 위해 응용 프로그램 특정 IC (ASIC)를 개발할 것입니다..
이 칩은 고객이 가장 신뢰하는 파운드리에서 계속 생산 될 것입니다.
Gartner 및 IDC를 포함한 많은 연구 기관은 슬롯 무료체험의 강력한 성장과 고성능 컴퓨팅 (HPC)의 강력한 성장 덕분에 2025 년에 반도체에 대한 세계 수요가 15% 증가 할 것으로 예측합니다. 그러나 TSMC 회장 겸 CEO C.C.
TSMC는 7nm 및 더 많은 고급 프로세스로 제조 된 칩의 약 90%를 제조하기 때문에 HPC 및 슬롯 무료체험 컴퓨팅에 필요한 칩이므로 TSMC는 앞으로도 평균보다 높은 성장을 계속하고있을 것입니다.
단기적으로 NVIDIA 및 TSMC에 대한 미국 수출 통제의 의미는 여전히 두 회사가 만든 슬롯 무료체험 칩의 위치 분포에 영향을 미칠 가능성이 높습니다. 더 중요한 질문은 트렌드가보다 소프트웨어 정의 된 슬롯 무료체험 컴퓨팅 미래로 이동하는 경우 슬롯 무료체험 서버의 대역폭 메모리 (HBM) 및 열산 소실 솔루션에 대한 수요에 어떤 영향을 미치는가?
[Deepseek] 현상이 중요한 이유 : US-China 슬롯 무료체험 전쟁 변경 방향?
수출 통제는 중국의 슬롯 무료체험 기술 개발의 캐치 업 속도를 늦추었지만 이번 라운드 [DeepSeek]의 승리는 미국이 정책을 포기하지 않을 것입니다. 슬롯 무료체험 우위 경쟁을위한 긴 게임이 더욱 복잡해지고 있습니다.
Chip War의 저자 인 Chris Miller는 2025 년 1 월 초 슬롯 무료체험가 US-China Chip War를 광범위한“클라우드 전쟁”으로 변화시키는 방법을 공개했습니다. 그는 스케일링 법이 흔들리는 것을보고 옳았으며 효율성은 원시 규모를 능가했습니다.
Feng은 [Deepseek]가 실리콘 밸리의 기존의 사고에 완전히 도전했다고 생각합니다. "객관적인 관점에서 볼 때 미국의 금지령 이이 중국 천재들의 작은 우주를 촉발시켜 다른 선택없이 혁신하도록 강요했다는 것은 아이러니 한 일입니다.".
[Deepseek]의 성공은 다른 중국 슬롯 무료체험 신생 기업으로부터 투자 자본과 인재를 유치 할 수 있습니다. 한편, [Deepseek] 엔지니어가 다른 회사에 의해 유인되지 않을지 누가 알 수 있습니까?
Ethan Tu는 이미 [DeepSeek]가 이미 검열 프롬프트임을 알았습니다.
“생성 슬롯 무료체험 플랫폼에 대한 성능 테스트는 입학 시험과 같습니다. 저는 애플리케이션과 사회 전체와 인류의 복지를 변화시키는 방법에 대해 더 우려하고 있습니다.
Deepseek 슬롯 무료체험의 상승은 Global 슬롯 무료체험 Race에서 중요한 순간을 표시하여 혁신이 제약으로 번성 할 수 있음을 증명합니다. 미국의 수출 통제는 중국의 진보를 늦추기위한 반면, 실수로 독창성의 물결을 불러 일으켜 중국 엔지니어들이 다르게 생각하고 규모에 따라 효율성을 높이도록 강요했을 수도 있습니다.
그러나 앞으로의 도로는 여전히 불확실합니다. Deepseek의 성공은 중국의 슬롯 무료체험 생태계에 대한 투자 급증을 일으킬 수 있지만 내부 경쟁, 재능 밀렵 및 검열에 대한 현재의 도전은 미래에 대한 그림자를 초래했습니다.
슬롯 무료체험 우위 웹 사이트에 게시 된이 깊은 다이브를 읽으려면여기.