引發這場零售市場與華爾街雙重恐慌的元凶,是 Google Research 發表的 LLM 快取壓縮演算法 TurboQuant。 市場的第一層思維發作:既然軟體能把記憶體空間壓縮 6 倍,那 AI 伺服器就不需要買這麼多記憶體了,#MU 這些大廠準備喝西北風了! 雖然 Google 把記憶體需求壓縮了 6 倍,但這其實會立刻把空出來的算力與記憶體頻寬吃乾抹淨,用來運行更龐大、更複雜的 AI 系統。 而且接下來不要忘了我們還有下一波的需求,這將會推升更多需求。
Agentic AI 當你給 Agentic AI 下達一個任務,它會在背景自主拆解成幾十個子任務,進行搜尋 ➡️ 評估 ➡️ 修正 ➡️ 再搜尋的無限循環。使用者只花了一次提示詞的錢,但在雲端伺服器裡,GPU 和記憶體卻跑了 50 倍以上的推理消耗。 為了支撐這種背景狂跑的 AI,伺服器需要極度龐大的 Context Window。這就是為什麼高階記憶體(HBM、DDR5)與矽光子高速傳輸(CPO)的需求沒有見頂。能提供這些基建的廠商,將牢牢掌握漲價話語權。
Physical AI NVIDIA 黃仁勳強調的下一波工業革命—Physical AI(具身智能/實體 AI)。 無論是人形機器人,還是自動化重裝工程車,Physical AI 解決的是全球人口老化、缺工以及高危險環境(如戰場、礦區)的痛點。這種能取代實體勞動力、甚至保家衛國的機器。
最後也許我們該考慮調整跟思考未來的下一步。
汰弱留強:那些缺乏核心技術、護城河極淺的 SaaS 應用公司,很快就會被 Agentic AI 取代,請務必避開。