AI 基礎設施五層堆疊
核心框架
AI五層蛋糕 把 AI 浪潮拆成五個互相拉動的層級:
- 能源層:Constellation Energy、Vistra Corp 等供應 baseload power、核能、氣電與資料中心用電。
- 晶片層:NVIDIA、Advanced Micro Devices、Micron Technology 等把能源轉成算力與記憶體頻寬。
- 基礎設施層:Microsoft Corporation / Azure、Amazon Web Services、Vertiv Holdings 等把晶片、電力、冷卻與網路組成 AI factories。
- 模型層:Microsoft Corporation、Google、Meta Platforms、OpenAI、Anthropic 等把算力轉成模型能力。
- 應用層:Tesla、Salesforce、Microsoft Copilot 等把模型能力變成可付費 workflow、機器人、自動駕駛或企業生產力。
需求傳導
應用 monetization
↓ 拉動
模型訓練 / 推論需求
↓ 拉動
AI factories / cloud capex
↓ 拉動
GPU / HBM / interconnect / cooling
↓ 拉動
電力 / 核能 / 氣電 / 電網 / PPA這個框架補強 美股大市風險雷達:AI 不是只影響半導體,而是同時影響 utilities、datacenter equipment、cloud capex、software monetization 與應用端估值。
代表公司分層觀察
- 能源:若 AI datacenter electricity demand 持續超出電網供給,Constellation Energy、Vistra Corp 等具 dispatchable / baseload power 的公司可能受益。
- 晶片:NVIDIA 受益於 GPU + CUDA + system platform,Advanced Micro Devices 代表替代 accelerator / CPU 供應,Micron Technology 代表 HBM / DRAM / NAND 供應瓶頸。
- 基礎設施:Microsoft Corporation 與 Amazon Web Services 承擔 AI capex 與雲端 monetization 壓力;Vertiv Holdings 受益於 power / thermal management。
- 模型:Google、Meta Platforms、Microsoft / OpenAI / Anthropic 形成 proprietary vs open-source vs multi-model competition。
- 應用:Tesla 的 FSD / Optimus 與 Salesforce 的 Einstein / CRM agents 是應用層能否證明 ROI 的觀察點。
主要張力
- 能源瓶頸:若 power interconnection、PPA、核能重啟、transmission upgrade 進展慢,晶片供給再多也不能轉成可上線 AI capacity。
- Capex 回收:基礎設施層投入最大,但利潤可能由晶片供應商或應用層攫取。
- 模型商品化:open-source models 可擴大下層需求,但也可能壓縮模型層定價。
- 應用驗證:若 Tesla / Salesforce / Copilot 等應用無法證明 productivity ROI,五層堆疊的正循環會減弱。
需要觀察的證據
- Data center PPA、核能重啟、電網 interconnection queue 與電力價格。
- GPU / HBM / liquid cooling / power equipment 訂單、交期與毛利率。
- Cloud AI revenue、RPO、gross margin、capex intensity 與 utilization。
- 模型 API / enterprise agent / Copilot / Gemini / Llama adoption 與 monetization。
- 應用層是否創造可衡量 ROI,而非只拉動試用與實驗性支出。
晶片層的三層細分
新增來源把五層堆疊中的 Chips 層細分為 compute、3D integration、photonics。這表示 AI infrastructure 不只需要更多 GPU,也需要先進製程、CoWoS / SoIC、HBM、CPO、光學網路與設備/OSAT/光通訊供應鏈共同成熟。
Token Economics Flywheel 補充
新來源補充 AI 五層堆疊的需求飛輪:推論 token 若帶來 productivity、value creation 與 revenue,會拉動更多 compute demand,再向下拉動晶片、封裝、光互連、資料中心與能源。這與五層中的 Applications → Models → Infrastructure → Chips → Energy 需求傳導相互呼應。
COUPE 連接 Chips 與 Infrastructure 層
COUPE 來源補充了五層堆疊中 Chips 與 Infrastructure 層的交界:它既是晶片/封裝/光子引擎技術,也會影響資料中心內 switch、GPU interconnect 與 cluster networking 的功耗與延遲。若 COUPE-based CPO 成熟,AI infrastructure 的網路能耗與延遲瓶頸可能被重新定價。
CoWoS/COUPE 連接晶片與基礎設施
新來源讓五層堆疊中的 Chips 層更細:CoWoS 支撐晶片層內部的 memory bandwidth,COUPE/CPO 則連接 Chips 與 Infrastructure 層的資料中心網路。這說明 AI infrastructure 不是只買 GPU,而是同時受封裝、HBM、switch、optical I/O 與資料中心互連制約。
COUPE 連接 Chips 與 Infrastructure 的上市公司地圖
新來源把 COUPE 放在 Chips 與 Infrastructure 的交界:TSM 的製造/封裝平台連到 NVIDIA/Broadcom networking systems,再連到光學元件與 EDA 工具。這讓 AI infrastructure stack 的投資觀察從 GPU 延伸到 CPO / optical interconnect ecosystem。
三層晶片策略連回五層基礎設施
新來源說明 Chips 層內部本身也分成 compute、advanced packaging、photonics 三個放大環節。這讓 AI infrastructure 五層中的 Chips 不只是 GPU,而是先進製程、HBM/CoWoS、COUPE/CPO 的複合供應鏈。
Chips 層內部的利潤池
新來源把 AI infrastructure 的 Chips 層再拆為台積電三層:目前 profit pool 在 advanced process / foundry,growth driver 在 advanced packaging / CoWoS,long-duration optionality 在 photonics / COUPE。
Chips 層內部成長率
新來源補充 AI infrastructure Chips 層內部不只看當前收入,也要看增速:CoWoS/advanced packaging 可能是台積電近期 fastest-growing sub-layer,photonics/CPO 是 longer-duration growth vector。
模型推論與晶片記憶體層連結
新來源把 Models 層的推論行為連回 Chips/Infrastructure:decode phase 的 memory bandwidth 與 KV Cache 壓力會向上影響使用者延遲,向下拉動 HBM、封裝、記憶體階層與 serving infrastructure 需求。
Inference optimization 對五層堆疊的連結
新來源補充 Models/Applications 層需求會透過 serving optimization 反饋到 Chips/Infrastructure:更低單位成本可能推高 token usage,進一步影響 GPU/HBM、雲端 capex、資料中心記憶體與軟體引擎價值。
利潤池與成長率分離
2026-05-18-LLM推論生態系利潤率與成長性比較 補充五層堆疊中的價值分配:基礎設施層如雲端平台可能承擔最大 capex,但最高絕對利潤與利潤率可能先集中在晶片平台;記憶體層則可能在供需緊張時取得最高百分比成長。這強化既有張力:AI demand 從應用層傳導到能源層,但 profit pool、margin pool 與 growth pool 不一定落在同一層。
推論 roadmap 對五層堆疊的影響
新來源補充 2026-2027 推論 roadmap 會把 Chips、Infrastructure、Models、Applications 層更緊密連接:agentic applications 拉高 long-context 需求,反推 chip/memory/network/serving engine 升級。
Situational Awareness LP 13F 作為市場映射
2026-05-18-Situational-Awareness-LP-2025Q4-13F持倉筆記 補充了一個市場資金如何映射 AI infrastructure bottleneck 的案例:來源主張 Situational Awareness LP 的 2025Q4 13F 不是只集中在模型或大型 GPU 平台,而是分散押注能源、AI compute hosting、光互連、半導體與儲存。這使五層堆疊可從技術框架延伸為公開市場持倉觀察,但因來源未附 SEC 原始 URL,所有持倉、value、shares、options 與集中度仍待核驗。