AI 基礎設施五層堆疊

核心框架

AI五層蛋糕把 AI 浪潮拆成五個互相拉動的層級：

能源層：Constellation Energy、Vistra Corp 等供應 baseload power、核能、氣電與資料中心用電。
晶片層：NVIDIA、Advanced Micro Devices、Micron Technology 等把能源轉成算力與記憶體頻寬。
基礎設施層：Microsoft Corporation / Azure、Amazon Web Services、Vertiv Holdings 等把晶片、電力、冷卻與網路組成 AI factories。
模型層：Microsoft Corporation、Google、Meta Platforms、OpenAI、Anthropic 等把算力轉成模型能力。
應用層：Tesla、Salesforce、Microsoft Copilot 等把模型能力變成可付費 workflow、機器人、自動駕駛或企業生產力。

需求傳導

應用 monetization
        ↓ 拉動
模型訓練 / 推論需求
        ↓ 拉動
AI factories / cloud capex
        ↓ 拉動
GPU / HBM / interconnect / cooling
        ↓ 拉動
電力 / 核能 / 氣電 / 電網 / PPA

這個框架補強美股大市風險雷達：AI 不是只影響半導體，而是同時影響 utilities、datacenter equipment、cloud capex、software monetization 與應用端估值。

代表公司分層觀察

能源：若 AI datacenter electricity demand 持續超出電網供給，Constellation Energy、Vistra Corp 等具 dispatchable / baseload power 的公司可能受益。
晶片：NVIDIA 受益於 GPU + CUDA + system platform，Advanced Micro Devices 代表替代 accelerator / CPU 供應，Micron Technology 代表 HBM / DRAM / NAND 供應瓶頸。
基礎設施：Microsoft Corporation 與 Amazon Web Services 承擔 AI capex 與雲端 monetization 壓力；Vertiv Holdings 受益於 power / thermal management。
模型：Google、Meta Platforms、Microsoft / OpenAI / Anthropic 形成 proprietary vs open-source vs multi-model competition。
應用：Tesla 的 FSD / Optimus 與 Salesforce 的 Einstein / CRM agents 是應用層能否證明 ROI 的觀察點。

主要張力

能源瓶頸：若 power interconnection、PPA、核能重啟、transmission upgrade 進展慢，晶片供給再多也不能轉成可上線 AI capacity。
Capex 回收：基礎設施層投入最大，但利潤可能由晶片供應商或應用層攫取。
模型商品化：open-source models 可擴大下層需求，但也可能壓縮模型層定價。
應用驗證：若 Tesla / Salesforce / Copilot 等應用無法證明 productivity ROI，五層堆疊的正循環會減弱。

需要觀察的證據

Data center PPA、核能重啟、電網 interconnection queue 與電力價格。
GPU / HBM / liquid cooling / power equipment 訂單、交期與毛利率。
Cloud AI revenue、RPO、gross margin、capex intensity 與 utilization。
模型 API / enterprise agent / Copilot / Gemini / Llama adoption 與 monetization。
應用層是否創造可衡量 ROI，而非只拉動試用與實驗性支出。

晶片層的三層細分

新增來源把五層堆疊中的 Chips 層細分為 compute、3D integration、photonics。這表示 AI infrastructure 不只需要更多 GPU，也需要先進製程、CoWoS / SoIC、HBM、CPO、光學網路與設備/OSAT/光通訊供應鏈共同成熟。

Token Economics Flywheel 補充

新來源補充 AI 五層堆疊的需求飛輪：推論 token 若帶來 productivity、value creation 與 revenue，會拉動更多 compute demand，再向下拉動晶片、封裝、光互連、資料中心與能源。這與五層中的 Applications → Models → Infrastructure → Chips → Energy 需求傳導相互呼應。

COUPE 連接 Chips 與 Infrastructure 層

COUPE 來源補充了五層堆疊中 Chips 與 Infrastructure 層的交界：它既是晶片/封裝/光子引擎技術，也會影響資料中心內 switch、GPU interconnect 與 cluster networking 的功耗與延遲。若 COUPE-based CPO 成熟，AI infrastructure 的網路能耗與延遲瓶頸可能被重新定價。

CoWoS/COUPE 連接晶片與基礎設施

新來源讓五層堆疊中的 Chips 層更細：CoWoS 支撐晶片層內部的 memory bandwidth，COUPE/CPO 則連接 Chips 與 Infrastructure 層的資料中心網路。這說明 AI infrastructure 不是只買 GPU，而是同時受封裝、HBM、switch、optical I/O 與資料中心互連制約。

COUPE 連接 Chips 與 Infrastructure 的上市公司地圖

新來源把 COUPE 放在 Chips 與 Infrastructure 的交界：TSM 的製造/封裝平台連到 NVIDIA/Broadcom networking systems，再連到光學元件與 EDA 工具。這讓 AI infrastructure stack 的投資觀察從 GPU 延伸到 CPO / optical interconnect ecosystem。

三層晶片策略連回五層基礎設施

新來源說明 Chips 層內部本身也分成 compute、advanced packaging、photonics 三個放大環節。這讓 AI infrastructure 五層中的 Chips 不只是 GPU，而是先進製程、HBM/CoWoS、COUPE/CPO 的複合供應鏈。

Chips 層內部的利潤池

新來源把 AI infrastructure 的 Chips 層再拆為台積電三層：目前 profit pool 在 advanced process / foundry，growth driver 在 advanced packaging / CoWoS，long-duration optionality 在 photonics / COUPE。

Chips 層內部成長率

新來源補充 AI infrastructure Chips 層內部不只看當前收入，也要看增速：CoWoS/advanced packaging 可能是台積電近期 fastest-growing sub-layer，photonics/CPO 是 longer-duration growth vector。

模型推論與晶片記憶體層連結

新來源把 Models 層的推論行為連回 Chips/Infrastructure：decode phase 的 memory bandwidth 與 KV Cache 壓力會向上影響使用者延遲，向下拉動 HBM、封裝、記憶體階層與 serving infrastructure 需求。

Inference optimization 對五層堆疊的連結

新來源補充 Models/Applications 層需求會透過 serving optimization 反饋到 Chips/Infrastructure：更低單位成本可能推高 token usage，進一步影響 GPU/HBM、雲端 capex、資料中心記憶體與軟體引擎價值。

利潤池與成長率分離

2026-05-18-LLM推論生態系利潤率與成長性比較補充五層堆疊中的價值分配：基礎設施層如雲端平台可能承擔最大 capex，但最高絕對利潤與利潤率可能先集中在晶片平台；記憶體層則可能在供需緊張時取得最高百分比成長。這強化既有張力：AI demand 從應用層傳導到能源層，但 profit pool、margin pool 與 growth pool 不一定落在同一層。

推論 roadmap 對五層堆疊的影響

新來源補充 2026-2027 推論 roadmap 會把 Chips、Infrastructure、Models、Applications 層更緊密連接：agentic applications 拉高 long-context 需求，反推 chip/memory/network/serving engine 升級。

Situational Awareness LP 13F 作為市場映射

2026-05-18-Situational-Awareness-LP-2025Q4-13F持倉筆記補充了一個市場資金如何映射 AI infrastructure bottleneck 的案例：來源主張 Situational Awareness LP 的 2025Q4 13F 不是只集中在模型或大型 GPU 平台，而是分散押注能源、AI compute hosting、光互連、半導體與儲存。這使五層堆疊可從技術框架延伸為公開市場持倉觀察，但因來源未附 SEC 原始 URL，所有持倉、value、shares、options 與集中度仍待核驗。

SFLAB Brain

Explorer

AI基礎設施五層堆疊