AI 基礎設施五層堆疊

核心框架

AI五層蛋糕 把 AI 浪潮拆成五個互相拉動的層級:

  1. 能源層Constellation EnergyVistra Corp 等供應 baseload power、核能、氣電與資料中心用電。
  2. 晶片層NVIDIAAdvanced Micro DevicesMicron Technology 等把能源轉成算力與記憶體頻寬。
  3. 基礎設施層Microsoft Corporation / Azure、Amazon Web ServicesVertiv Holdings 等把晶片、電力、冷卻與網路組成 AI factories。
  4. 模型層Microsoft CorporationGoogleMeta PlatformsOpenAIAnthropic 等把算力轉成模型能力。
  5. 應用層TeslaSalesforceMicrosoft Copilot 等把模型能力變成可付費 workflow、機器人、自動駕駛或企業生產力。

需求傳導

應用 monetization
        ↓ 拉動
模型訓練 / 推論需求
        ↓ 拉動
AI factories / cloud capex
        ↓ 拉動
GPU / HBM / interconnect / cooling
        ↓ 拉動
電力 / 核能 / 氣電 / 電網 / PPA

這個框架補強 美股大市風險雷達:AI 不是只影響半導體,而是同時影響 utilities、datacenter equipment、cloud capex、software monetization 與應用端估值。

代表公司分層觀察

主要張力

  • 能源瓶頸:若 power interconnection、PPA、核能重啟、transmission upgrade 進展慢,晶片供給再多也不能轉成可上線 AI capacity。
  • Capex 回收:基礎設施層投入最大,但利潤可能由晶片供應商或應用層攫取。
  • 模型商品化:open-source models 可擴大下層需求,但也可能壓縮模型層定價。
  • 應用驗證:若 Tesla / Salesforce / Copilot 等應用無法證明 productivity ROI,五層堆疊的正循環會減弱。

需要觀察的證據

  • Data center PPA、核能重啟、電網 interconnection queue 與電力價格。
  • GPU / HBM / liquid cooling / power equipment 訂單、交期與毛利率。
  • Cloud AI revenue、RPO、gross margin、capex intensity 與 utilization。
  • 模型 API / enterprise agent / Copilot / Gemini / Llama adoption 與 monetization。
  • 應用層是否創造可衡量 ROI,而非只拉動試用與實驗性支出。

晶片層的三層細分

新增來源把五層堆疊中的 Chips 層細分為 compute、3D integration、photonics。這表示 AI infrastructure 不只需要更多 GPU,也需要先進製程、CoWoS / SoIC、HBM、CPO、光學網路與設備/OSAT/光通訊供應鏈共同成熟。

Token Economics Flywheel 補充

新來源補充 AI 五層堆疊的需求飛輪:推論 token 若帶來 productivity、value creation 與 revenue,會拉動更多 compute demand,再向下拉動晶片、封裝、光互連、資料中心與能源。這與五層中的 Applications → Models → Infrastructure → Chips → Energy 需求傳導相互呼應。

COUPE 連接 Chips 與 Infrastructure 層

COUPE 來源補充了五層堆疊中 Chips 與 Infrastructure 層的交界:它既是晶片/封裝/光子引擎技術,也會影響資料中心內 switch、GPU interconnect 與 cluster networking 的功耗與延遲。若 COUPE-based CPO 成熟,AI infrastructure 的網路能耗與延遲瓶頸可能被重新定價。

CoWoS/COUPE 連接晶片與基礎設施

新來源讓五層堆疊中的 Chips 層更細:CoWoS 支撐晶片層內部的 memory bandwidth,COUPE/CPO 則連接 Chips 與 Infrastructure 層的資料中心網路。這說明 AI infrastructure 不是只買 GPU,而是同時受封裝、HBM、switch、optical I/O 與資料中心互連制約。

COUPE 連接 Chips 與 Infrastructure 的上市公司地圖

新來源把 COUPE 放在 Chips 與 Infrastructure 的交界:TSM 的製造/封裝平台連到 NVIDIA/Broadcom networking systems,再連到光學元件與 EDA 工具。這讓 AI infrastructure stack 的投資觀察從 GPU 延伸到 CPO / optical interconnect ecosystem。

三層晶片策略連回五層基礎設施

新來源說明 Chips 層內部本身也分成 compute、advanced packaging、photonics 三個放大環節。這讓 AI infrastructure 五層中的 Chips 不只是 GPU,而是先進製程、HBM/CoWoS、COUPE/CPO 的複合供應鏈。

Chips 層內部的利潤池

新來源把 AI infrastructure 的 Chips 層再拆為台積電三層:目前 profit pool 在 advanced process / foundry,growth driver 在 advanced packaging / CoWoS,long-duration optionality 在 photonics / COUPE。

Chips 層內部成長率

新來源補充 AI infrastructure Chips 層內部不只看當前收入,也要看增速:CoWoS/advanced packaging 可能是台積電近期 fastest-growing sub-layer,photonics/CPO 是 longer-duration growth vector。

模型推論與晶片記憶體層連結

新來源把 Models 層的推論行為連回 Chips/Infrastructure:decode phase 的 memory bandwidth 與 KV Cache 壓力會向上影響使用者延遲,向下拉動 HBM、封裝、記憶體階層與 serving infrastructure 需求。

Inference optimization 對五層堆疊的連結

新來源補充 Models/Applications 層需求會透過 serving optimization 反饋到 Chips/Infrastructure:更低單位成本可能推高 token usage,進一步影響 GPU/HBM、雲端 capex、資料中心記憶體與軟體引擎價值。

利潤池與成長率分離

2026-05-18-LLM推論生態系利潤率與成長性比較 補充五層堆疊中的價值分配:基礎設施層如雲端平台可能承擔最大 capex,但最高絕對利潤與利潤率可能先集中在晶片平台;記憶體層則可能在供需緊張時取得最高百分比成長。這強化既有張力:AI demand 從應用層傳導到能源層,但 profit pool、margin pool 與 growth pool 不一定落在同一層。

推論 roadmap 對五層堆疊的影響

新來源補充 2026-2027 推論 roadmap 會把 Chips、Infrastructure、Models、Applications 層更緊密連接:agentic applications 拉高 long-context 需求,反推 chip/memory/network/serving engine 升級。

Situational Awareness LP 13F 作為市場映射

2026-05-18-Situational-Awareness-LP-2025Q4-13F持倉筆記 補充了一個市場資金如何映射 AI infrastructure bottleneck 的案例:來源主張 Situational Awareness LP 的 2025Q4 13F 不是只集中在模型或大型 GPU 平台,而是分散押注能源、AI compute hosting、光互連、半導體與儲存。這使五層堆疊可從技術框架延伸為公開市場持倉觀察,但因來源未附 SEC 原始 URL,所有持倉、value、shares、options 與集中度仍待核驗。