依 autoflow-agent workspace v2 設計把 PRD / 設計 / 架構 / 交付類 共享文件從個人層 .autoflow/(ignored)搬到 docs/autoflow/(進 git), 讓團隊可共享產品與架構文件,個人層只留 progress / review / testing 等 per-branch 筆記。 - 02-prd/ 21 個檔(PRD、features、market-analysis 等) - 03-design/ 18 個檔(design-spec、wireframes、flows 等) - 04-architecture/ 31 個檔(TDD、design-doc、ADR×14、API 規格等) - 07-delivery/ 3 個檔(project-summary、phase-0.6-handover、stage-deployment-setup) 合計 73 檔。原檔已從 .autoflow/ 移除(migration 工具執行 git mv, 但因 .autoflow/ 在 .gitignore 中、git 將此操作視為新增、無 rename history)。
7.6 KiB
1. 產品策略 — visionA Cloud
父文件:PRD.md
1.1 產品願景(模擬新聞稿)
標題:visionA Cloud 正式推出 — 讓 Kneron 邊緣 AI 裝置「人在家中坐,推論千里來」
副標題:為 Kneron FAE 與生態系開發者打造的雲端操作平台,瀏覽器即能遠端管理、監控、推論自己的 Kneron 裝置
問題背景
Kneron KL520 / KL720 是強大的邊緣 AI 推論晶片,但開發者與 FAE 在實際使用時有三個痛點:
- demo 現場得帶筆電:目前唯一穩定的開發工具是 local-tool 離線版,demo 必須把整台筆電搬去客戶那。
- 多裝置難以集中管理:一個 SI 客戶可能同時在不同分店佈署 5 台 Kneron,沒有統一的遠端介面。
- 叢集推論只有 POC:edge-ai-platform POC 展示了多裝置加權 round-robin 的潛力,但沒有正式產品化。
visionA Cloud 的解法
visionA Cloud 是一個雲端 SaaS。使用者在自己的筆電、工廠機台、店頭機裝上「local agent」(即現有 local-tool),透過 Pairing Token 把裝置配對到雲端帳號。之後在任何瀏覽器開啟 visionA Cloud,就能看到自己所有裝置、上傳模型、啟動推論,跟操作本機一樣流暢 — 但人不用在裝置旁邊。
典型用戶體驗引述
「以前去客戶做 POC,要帶一整個後背包裝筆電。現在我筆電放辦公室,裝置留在客戶現場,我在咖啡廳開瀏覽器就能跑推論給客戶看 Teams 螢幕分享。體驗完全不同。」
— 阿哲,Kneron FAE
如何開始使用
- 在 visionA Cloud 註冊帳號
- 筆電上安裝 visionA local agent(即 local-tool,未來會內建 Pairing 功能)
- 從雲端頁面取得 Pairing Token,貼進 local agent
- 刷新雲端頁面,裝置自動出現,開始推論
FAQ
-
Q:這跟 local-tool 有什麼不同? A:local-tool 是離線桌面 app,適合網路鎖死的 demo 場景;visionA Cloud 是雲端 SaaS,適合需要遠端操作、跨裝置管理的場景。兩者共用同一套 UI 與核心功能,使用者可以自由選擇或同時使用。
-
Q:和 Edge Impulse、SenseCraft 比? A:他們是「訓練模型 + 部署到裝置」的通用平台,我們是「Kneron 專用 + 雲端遠端存取」的操作平台。我們不做模型訓練,只做已訓練好的
.nef模型的部署與推論操作(但有提供對接 kneron_model_converter 的介面)。 -
Q:定價如何? A:Phase 0 雛形階段免費內部使用。商業模式(訂閱 / 按推論次數 / freemium)在 Phase 2 規劃,Phase 0 只定介面不接金流。
-
Q:什麼時候可以用? A:Phase 0 雛形目標 2026 Q2 完成(架構跑得動、基本頁面可用、in-memory auth)。Phase 1 MVP 目標 2026 Q3(接真 Auth/DB/Storage)。
1.2 目標用戶
主要用戶群(Phase 0 / Phase 1)
-
Kneron 內部 FAE 與 Innovedus 業務(~50 人)
- 最熟悉 Kneron 裝置的人,常跑客戶現場
- 容忍雛形不穩,會給詳細回饋
-
Kneron 生態系 ISV / SI 開發者(~數百人)
- 已經在用 local-tool 或 edge-ai-platform POC 的現有用戶
- 痛點明確:多客戶多裝置要集中管理
次要用戶群(Phase 2)
- 試用 Kneron 晶片的新開發者(長尾)
- 從 visionA Cloud 這個「門面」第一次接觸 Kneron
- 對他們而言,雲端門檻比離線桌面 app 低
非目標用戶(明確排除)
- ❌ 想做模型訓練的人 — 他們應該用 Edge Impulse 或 kneron_model_converter
- ❌ 想部署非 Kneron 硬體的人 — 不在產品範圍
- ❌ 企業級 MLOps / 大規模 inference production — 我們不是 NVIDIA Triton 競品
1.3 核心問題與價值主張
問題(用戶視角)
| 問題 | 現況 |
|---|---|
| P1:Kneron 裝置必須連實體筆電才能操作 | local-tool 是桌面 app,使用者人不在時沒辦法用 |
| P2:多裝置沒有集中式管理 | 一個 FAE 手上可能有 3-5 台機台,要一台一台開 local-tool |
| P3:POC 的叢集推論沒產品化 | 加權 round-robin 很好用,但 POC 的 auth / 多租戶 / token 都沒做 |
| P4:非 Kneron 格式的模型要手動轉檔 | kneron_model_converter 目前是獨立網站,使用者體驗斷裂 |
價值主張
對開發者:用瀏覽器就能操作 Kneron 裝置,不用被綁在實體機器旁。
對 SI / FAE:一個帳號管所有客戶現場的裝置,一個畫面看到全貌。
對 Kneron 生態系:降低 Kneron 的使用門檻,讓「試用 Kneron」不用裝一堆東西。
為什麼是現在做
- local-tool 已穩定:UI 與業務邏輯成熟,前端可以直接搬
- edge-ai-platform POC 驗證了核心技術:WebSocket + yamux tunnel、叢集推論都跑得動
- Kneron 生態系正在成長:需要一個「雲端門面」承接新用戶
- kneron_model_converter 團隊要整合:visionA Cloud 是整合入口
1.4 OKR(Phase 0 雛形階段)
Objective(O):建立 visionA Cloud 的技術基座與產品框架
- KR1:Phase 0 雛形 2026 Q2 完成,包含以下可驗收產出
- visionA-frontend 所有 P0 頁面可打開、可操作(接 mock 或真 API)
- visionA-backend 兩個 binary(api-server + remote-proxy)可起得來
- 至少一個 local-tool 可透過 Pairing Token 連上 visionA Cloud,並跑通一次端到端推論
- KR2:Phase 0 內部測試,至少 5 位 Kneron FAE 完成 Pairing + 推論測試
- KR3:介面契約文件(interface-contracts.md)完成,與 converter 團隊對齊一次 API spec
Objective(O):為 Phase 1 MVP 打好基礎
- KR1:所有 TODO 項目(Auth / DB / Storage / Converter)有明確的「替換點」與介面定義
- KR2:文件完整度 — PRD / Design Spec / TDD 三方交叉審閱通過
- KR3:避免 local-tool 被破壞 — local-tool 的所有既有測試持續通過(0 regression)
1.5 北極星指標與指標體系
北極星指標(長期)
每週活躍裝置數(Weekly Active Devices, WAD)
定義:過去 7 天內,至少成功完成一次推論的已 pairing 裝置數。
為什麼選這個:
- 對 B2B / 開發者工具,WAU(User)容易膨脹(人來註冊就算),但 WAD(Device)代表真正在用
- Kneron 裝置本身是硬體投資,裝置被使用 = 用戶正在從中獲得價值
- 一個用戶多個裝置 / 多個用戶共用一個裝置都反映在這個指標
指標體系
WAD(每週活躍裝置數)
├── 驅動指標:新 Pairing 數、每週人均推論次數、裝置留存率
│ ├── 輸入指標:註冊到 Pairing 的轉換率
│ ├── 輸入指標:Pairing 後 24 小時內首次推論率
│ ├── 輸入指標:每週上傳模型數
│ └── 輸入指標:叢集建立數
└── 護欄指標(不能惡化的):
├── 推論端到端延遲 P95 < 500ms(比 local-tool 多 ~300ms tunnel overhead)
├── Tunnel session uptime > 99%
├── API 錯誤率 < 1%
└── local-tool regression bug 數 = 0
Phase 0 可追蹤的指標(簡化版)
Phase 0 雛形只追蹤最小集:
| 指標 | 目標值 | 追蹤方式 |
|---|---|---|
| Pairing 成功率 | > 90% | Server log |
| 端到端推論可跑 | Yes | 手動測試 |
| API Server 崩潰 | 0 次 / 週 | Log / Monitoring |
| local-tool 測試全過 | 100% | CI |
其他指標等 Phase 1 接 DB 後才開始埋點追蹤。