SR Stock Research
목록으로
📝 기타 📝 블로그 Freedom is not Free 2026.05.02 15:00

Agentic AI가 폭증시킨 토큰의 가치 (Semianalysis)

원문 네이버 블로그에서 보기
🤖

AI 요약

🔥 핵심 한줄 Agentic AI 덕분에 토큰 수요가 폭발하며 모델랩이 매출·마진을 싹쓸이 중 🧠 무슨 일이 벌어지고 있나 – 단순 챗봇을 넘어 코드 작성·데이터 분석까지 처리하는 Agentic AI가 토큰을 ‘노동 대체’ 단위로 만들며 소비량이 급증 – 적은 비용으로 대량 업무를 해결하니 토큰 가격 민감도 낮고 사용량은 폭발 ⚙️ 그래서 뭐가 필요해지나 – 대규모 추론용 GPU·고속 메모리 모듈(SOCAMM, HBM, LPDDR) – 소프트웨어 최적화 솔루션(wideEP, disagg, MTP) 💰 누가 돈 버나 – 모델랩(예: Anthropic) : ARR 9→44조, 추론 마진 38→70% – GPU·메모리 업체(Nvidia, TSMC) : SOCAMM 등으로 추가 가격 인상 여력 보유 – 메모리 모듈 설계사(Rubin) : 소켓형 LPDDR 분리 과금 모델 📈 돈 흐름 Agentic AI → 토큰 수요 폭증 → 모델랩 매출·마진 상승 → 인프라 최적화 → Nvidia/TSMC 수익 확대 ⏳ 지속성 중기 – 토큰 소비량 증가와 소프트웨어 최적화 여파가 1~2년 더 이어질 전망 – Nvidia·TSMC가 아직 가격 인상 재조정 단계라 추가 수익 기회 존재 💡 투자 인사이트 – 단기 : Anthropic 등 모델랩 고객사(클라우드 추론 서비스) 지분 확보 – 중기 : Nvidia 주식 매수, SOCAMM 모듈 채택 가속화 모니터링 – 중장기 : TSMC N3 공정 장기계약 리스크 헤지 후 투자; 메모리 모듈업체(Micron, Samsung) 관심 ============================================================

📷 이미지 (5장)

📄

원문

https://newsletter.semianalysis.com/p/ai-value-capture-the-shift-to-model AI Value Capture - The Shift To Model Labs A day in AI now feels like a year in any other industry. TSMC, Vera Rubin VR NVL72: V for Value newsletter.semianalysis.com ​ ​ 1. 결론 ​ “the unique phenomenon is that the AI labs are capturing all the value now, from almost none last year.” ​ → 2023~2025년에는 Nvidia, 전력, 메모리 등 인프라 레이어가 AI 가치 대부분을 가져갔다. → 2026년 현재는 Agentic AI가 실제 생산성을 만들기 시작하면서 Anthropic 같은 모델랩이 매출·마진을 동시에 흡수하고 있다. ​ ​ 2. Agentic AI가 게임을 바꿈 ​ “The world changed in December 2025, when Agentic AI began to really work.” ​ → 단순 챗봇이 아니라 코드 작성, 엑셀 모델 전환, 대시보드 제작, 차트 생성, 기업 실적 분석까지 수행. → 토큰이 단순 검색 보조가 아니라 노동을 대체·증폭하는 경제 단위가 됐다. ​ ​ “tasks that used to take tens of person-hours costing thousands of dollars can now be accomplished in minutes with a just a few dollars’ worth of tokens.” ​ → 토큰 소비자의 ROI가 압도적으로 커짐. → 그래서 토큰 수요는 가격 민감도가 낮고, 사용량은 폭발적으로 증가 . ​ 3. 모델랩 마진 구조가 바뀜 ​ “Anthropic’s ARR has exploded from $9B to over $44B today, their gross margins on their inference infrastructure have increased from 38% to over 70%.” ​ ​ → 핵심은 매출만 오른 것이 아니라 추론 인프라 마진도 급등했다는 점. → 토큰 가격은 내려갔지만, Blackwell 전환·소프트웨어 최적화·캐시 히트율 상승으로 토큰 생산 원가가 더 빠르게 하락. ​ “The age of low gross margins for frontier model providers is over.” ​ → Frontier 모델 제공자는 이제 저마진 사업자가 아니라, 고마진 소프트웨어/플랫폼 사업자로 재평가될 수 있다는 주장. ​ 4. 토큰 생산비는 급락 중 ​ “One can 14x throughput with software improvements alone.” ​ → 같은 B300 하드웨어에서도 wideEP, disagg, MTP 같은 최적화로 처리량이 크게 달라짐. → 하드웨어 세대교체뿐 아니라 소프트웨어 최적화가 추론 원가 하락의 핵심 변수. ​ “the most optimized GB300 NVL72 configuration achieves ~17x higher throughput than the most optimized H100 configuration in FP8… the difference jumps to 32x.” ​ → GB300은 H100 대비 TCO가 70% 높을 뿐인데 처리량은 17~32배 증가. ​ → 따라서 달러당 토큰 생산량은 급증하고, 이 차익이 모델랩과 추론 사업자 마진으로 흘러간다 . ​ ​ 5. Nvidia와 TSMC는 아직 가격을 충분히 올리지 않음 ​ “TSMC and Nvidia have not reacted to the recent boom in value generation of AI models.” ​ → 모델랩·네오클라우드·메모리 업체는 AI 가치 증가를 흡수 중인데, 정작 병목을 쥔 Nvidia와 TSMC는 아직 충분히 가격을 올리지 않았다는 주장. ​ ​ “Nvidia is still operating within a framework shaped by prior assumptions, where the willingness to pay per unit of compute declines over time. That assumption no longer holds.” ​ → 과거에는 세대가 바뀌면 컴퓨트 단가는 하락해야 했다. → 하지만 Agentic AI 이후에는 토큰의 경제 가치가 급등했기 때문에, 컴퓨트 단가가 내려가야 한다는 전제가 깨졌다. ​ ​ 6. SOCAMM이 Nvidia의 다음 마진 레버 ​ “SOCAMM is designed for Nvidia’s rack-scale systems, enabling higher capacity, modularity, power efficiency, and independent pricing of memory alongside compute.” ​ → Rubin의 SOCAMM은 소켓형 LPDDR 기반 메모리 모듈. → 기존처럼 보드에 묶인 부품이 아니라 별도 가격 책정이 가능하다. → Nvidia가 메모리를 독립적인 마진 레버로 사용할 수 있다. ​ ​ “we view ~$10/GB as a reasonable assumption for Nvidia’s SOCAMM cost.” ​ “We think it is reasonable for Nvidia to charge 60% margin on SOCAMM.” ​ → Nvidia는 SOCAMM을 낮은 조달가로 확보하고, 고객에게는 높은 마진을 붙여 팔 가능성이 있다. → 메모리 병목이 심할수록 Nvidia의 공급망 장악력이 가격 결정력으로 전환된다. ​ ​ 7. Nvidia는 ‘AI 중앙은행’처럼 행동 중 ​ “Nvidia is actively supporting the development of the broader ecosystem, ensuring long-term demand expansion rather than maximizing near-term extraction.” ​ → Nvidia가 가격을 과도하게 올리지 않는 이유는 단기 이익 극대화보다 생태계 확장을 우선하기 때문. ​ → 또한 독점 규제 리스크와 고객의 대체칩 전환을 자극하지 않으려는 전략적 절제도 있음. ​ “By taking the oxygen out of the room – Nvidia aims to ensure it remains the main protagonist in the AI era for the foreseeable future.” ​ → Nvidia는 지금 모든 가치를 당장 흡수하기보다, 생태계 전체를 키우면서 장기 지배력을 유지하려는 포지션. ​ ​ 8. TSMC도 가치 일부를 남겨두고 있음 ​ “TSMC is certainly leaving value on the table.” ​ → N3 공정은 Nvidia, Broadcom, AMD, Annapurna, MediaTek 모두가 원하는 병목 자산. → 그런데 TSMC는 희소성만큼 가격을 올리지 않고 있다. ​ “TSMC can also take a position of longer term agreements with guaranteed capacity commitments and prepayments in lieu of major price increases.” ​ → TSMC는 가격 급등보다 장기계약·선급금·물량 보장 방식으로 가치를 회수할 가능성이 높다. ​ ​ ​ AI 가치는 1차로 인프라, 2차로 메모리, 3차로 모델랩으로 이동하고있다. 하지만 다음 구간에서는 Nvidia와 TSMC가 가격을 재조정하며 다시 더 많은 가치를 회수할 가능성이 있다. ​ 모델랩 : Agentic AI로 토큰의 경제 가치가 급등하면서 ARR·마진 동시 상승 ​ 메모리 벤더 : SOCAMM, LPDDR, HBM 등 공급 병목으로 가격 결정력 확대 ​ Nvidia/TSMC : 아직 충분히 가격을 올리지 않았고, Rubin/N3 병목을 통해 추가 가치 포착 여지 존재 ​