垂直整合的綜效：Kachaka 母集團 PFN，把「找最適推論方式」交給軟體

機器人底盤 Kachaka Pro，出自 Preferred Robotics——日本深度學習公司 Preferred Networks(PFN)旗下的機器人子公司。一家機器人公司，母集團連晶片和編譯器都自己做，這在全球機器人產業裡相當罕見。而把晶片、機器人、應用層這條線串起來的，是同一個目標：做出更便宜、更穩定的機器人應用。這次想引用的，是 PFN 的 Preferred Computing Platform(PFCP)——官方的說法是「誰もが MN-Core を利用できる AI クラウドサービス」，一個讓任何人都能用上 PFN 自行研發的加速器 MN-Core 系列的 AI 雲端服務。

PFN 做了什麼

依 PFCP 官網與 PFN 2024 年 10 月的新聞稿，這套東西有三層：

晶片。 MN-Core 2 是 PFN 與神戶大學共同開發的處理器，專為深度學習的核心——矩陣運算——最佳化。它的設計哲學很激進：把網路控制、快取控制、指令排程這些傳統上由硬體電路負責的功能，整個搬進編譯器軟體，好讓晶片面積盡可能塞滿運算單元。前代晶片驅動的 MN-3 超級電腦，曾三度拿下 Green500（全球節能超算排行）世界第一。

編譯器。 硬體功能搬進軟體之後，「怎麼把一個 AI 模型跑得最快、最省」就變成編譯器的工作：它接收 PyTorch、JAX 等高階框架定義的計算圖，自動產生最適的指令排程與資料搬移，使用者不需要大改既有的工作負載。

這裡值得說清楚：與其說 PFN「用 AI 尋找最適推論模型」，更精確的描述是——他們把「為每個模型尋找最適執行方式」這件事，從工程師手上交給了自家軟體自動完成。搜尋最適解的主體是編譯器，被優化的對象是推論與訓練工作負載。

雲端服務。 PFCP 於 2024 年 10 月上線，由 PFN 自己構建營運，以全託管 Kubernetes 跑互動式開發、定期任務、分散式訓練到推論伺服器等多種工作負載，是目前唯一能使用 MN-Core 系列的平台。

下一步走得更深：依 PFN 2024 年 11 月的發布，專為生成式 AI「推論」設計的 MN-Core L1000 已在開發中，用 3D 堆疊 DRAM 直接疊在邏輯電路上方來突破記憶體頻寬瓶頸——PFN 預期它對比 GPU 等傳統處理器最高有 10 倍運算速度，同時大幅降低功耗，計畫 2026 年投入市場（以上均為 PFN 官方的預期宣稱）。

為什麼 Sigma 在意

因為這是同一件事，只是發生在不同樓層。

PFN 在晶片與編譯器層回答的問題是：「同樣一次推論，怎麼用最少的電、最少的運算效能、最短的時間跑完？」答案是讓軟體自動找最適執行方式，而不是堆更多通用算力。

Sigma 在應用層回答的是同一個問題：「同樣一次巡檢判讀，怎麼用最少的雲端費用跑完？」我們的答案是邊緣+雲端分層——持續性影像留在邊緣，雲端只判讀有意義的單張畫面，問題收斂到夠窄，輕量模型就夠用。

換句話說：上游有人在矽和編譯器裡把「推論該多便宜」這條路鋪得更深，下游的我們在場域裡用架構把同一條曲線往下壓。推論成本每降一個量級，就有一批原本不划算的機器人應用變得划算——這是我們一同前行、努力讓機器人應用有更高 CP 值的方法。

出處：Preferred Computing Platform 官網、PFN 新聞稿：PFCP 提供開始(2024-10-21)、PFN 新聞稿：MN-Core L1000 開發(2024-11-15)