visionA/docs/autoflow/02-prd/strategy.md
jim800121chen fb7da5d180 chore(autoflow): migrate .autoflow/ 共享層文件至 docs/autoflow/
依 autoflow-agent workspace v2 設計把 PRD / 設計 / 架構 / 交付類
共享文件從個人層 .autoflow/(ignored)搬到 docs/autoflow/(進 git),
讓團隊可共享產品與架構文件,個人層只留 progress / review / testing 等
per-branch 筆記。

- 02-prd/        21 個檔(PRD、features、market-analysis 等)
- 03-design/     18 個檔(design-spec、wireframes、flows 等)
- 04-architecture/ 31 個檔(TDD、design-doc、ADR×14、API 規格等)
- 07-delivery/   3 個檔(project-summary、phase-0.6-handover、stage-deployment-setup)

合計 73 檔。原檔已從 .autoflow/ 移除(migration 工具執行 git mv,
但因 .autoflow/ 在 .gitignore 中、git 將此操作視為新增、無 rename history)。
2026-05-04 16:55:55 +08:00

7.6 KiB
Raw Blame History

1. 產品策略 — visionA Cloud

父文件:PRD.md


1.1 產品願景(模擬新聞稿)

標題visionA Cloud 正式推出 — 讓 Kneron 邊緣 AI 裝置「人在家中坐,推論千里來」

副標題:為 Kneron FAE 與生態系開發者打造的雲端操作平台,瀏覽器即能遠端管理、監控、推論自己的 Kneron 裝置

問題背景

Kneron KL520 / KL720 是強大的邊緣 AI 推論晶片,但開發者與 FAE 在實際使用時有三個痛點:

  1. demo 現場得帶筆電:目前唯一穩定的開發工具是 local-tool 離線版demo 必須把整台筆電搬去客戶那。
  2. 多裝置難以集中管理:一個 SI 客戶可能同時在不同分店佈署 5 台 Kneron沒有統一的遠端介面。
  3. 叢集推論只有 POCedge-ai-platform POC 展示了多裝置加權 round-robin 的潛力,但沒有正式產品化。

visionA Cloud 的解法

visionA Cloud 是一個雲端 SaaS。使用者在自己的筆電、工廠機台、店頭機裝上「local agent」即現有 local-tool透過 Pairing Token 把裝置配對到雲端帳號。之後在任何瀏覽器開啟 visionA Cloud就能看到自己所有裝置、上傳模型、啟動推論跟操作本機一樣流暢 — 但人不用在裝置旁邊

典型用戶體驗引述

「以前去客戶做 POC要帶一整個後背包裝筆電。現在我筆電放辦公室裝置留在客戶現場我在咖啡廳開瀏覽器就能跑推論給客戶看 Teams 螢幕分享。體驗完全不同。」

— 阿哲Kneron FAE

如何開始使用

  1. 在 visionA Cloud 註冊帳號
  2. 筆電上安裝 visionA local agent即 local-tool未來會內建 Pairing 功能)
  3. 從雲端頁面取得 Pairing Token貼進 local agent
  4. 刷新雲端頁面,裝置自動出現,開始推論

FAQ

  • Q這跟 local-tool 有什麼不同? Alocal-tool 是離線桌面 app適合網路鎖死的 demo 場景visionA Cloud 是雲端 SaaS適合需要遠端操作、跨裝置管理的場景。兩者共用同一套 UI 與核心功能,使用者可以自由選擇或同時使用。

  • Q和 Edge Impulse、SenseCraft 比? A他們是「訓練模型 + 部署到裝置」的通用平台我們是「Kneron 專用 + 雲端遠端存取」的操作平台。我們不做模型訓練,只做已訓練好的 .nef 模型的部署與推論操作(但有提供對接 kneron_model_converter 的介面)。

  • Q定價如何 APhase 0 雛形階段免費內部使用。商業模式(訂閱 / 按推論次數 / freemium在 Phase 2 規劃Phase 0 只定介面不接金流。

  • Q什麼時候可以用 APhase 0 雛形目標 2026 Q2 完成架構跑得動、基本頁面可用、in-memory auth。Phase 1 MVP 目標 2026 Q3接真 Auth/DB/Storage


1.2 目標用戶

主要用戶群Phase 0 / Phase 1

  1. Kneron 內部 FAE 與 Innovedus 業務~50 人)

    • 最熟悉 Kneron 裝置的人,常跑客戶現場
    • 容忍雛形不穩,會給詳細回饋
  2. Kneron 生態系 ISV / SI 開發者~數百人)

    • 已經在用 local-tool 或 edge-ai-platform POC 的現有用戶
    • 痛點明確:多客戶多裝置要集中管理

次要用戶群Phase 2

  1. 試用 Kneron 晶片的新開發者(長尾)
    • 從 visionA Cloud 這個「門面」第一次接觸 Kneron
    • 對他們而言,雲端門檻比離線桌面 app 低

非目標用戶(明確排除)

  • 想做模型訓練的人 — 他們應該用 Edge Impulse 或 kneron_model_converter
  • 想部署非 Kneron 硬體的人 — 不在產品範圍
  • 企業級 MLOps / 大規模 inference production — 我們不是 NVIDIA Triton 競品

1.3 核心問題與價值主張

問題(用戶視角)

問題 現況
P1Kneron 裝置必須連實體筆電才能操作 local-tool 是桌面 app使用者人不在時沒辦法用
P2多裝置沒有集中式管理 一個 FAE 手上可能有 3-5 台機台,要一台一台開 local-tool
P3POC 的叢集推論沒產品化 加權 round-robin 很好用,但 POC 的 auth / 多租戶 / token 都沒做
P4非 Kneron 格式的模型要手動轉檔 kneron_model_converter 目前是獨立網站,使用者體驗斷裂

價值主張

對開發者:用瀏覽器就能操作 Kneron 裝置,不用被綁在實體機器旁。

對 SI / FAE:一個帳號管所有客戶現場的裝置,一個畫面看到全貌。

對 Kneron 生態系:降低 Kneron 的使用門檻,讓「試用 Kneron」不用裝一堆東西。

為什麼是現在做

  1. local-tool 已穩定UI 與業務邏輯成熟,前端可以直接搬
  2. edge-ai-platform POC 驗證了核心技術WebSocket + yamux tunnel、叢集推論都跑得動
  3. Kneron 生態系正在成長:需要一個「雲端門面」承接新用戶
  4. kneron_model_converter 團隊要整合visionA Cloud 是整合入口

1.4 OKRPhase 0 雛形階段)

ObjectiveO建立 visionA Cloud 的技術基座與產品框架

  • KR1Phase 0 雛形 2026 Q2 完成,包含以下可驗收產出
    • visionA-frontend 所有 P0 頁面可打開、可操作(接 mock 或真 API
    • visionA-backend 兩個 binaryapi-server + remote-proxy可起得來
    • 至少一個 local-tool 可透過 Pairing Token 連上 visionA Cloud並跑通一次端到端推論
  • KR2Phase 0 內部測試,至少 5 位 Kneron FAE 完成 Pairing + 推論測試
  • KR3介面契約文件interface-contracts.md完成與 converter 團隊對齊一次 API spec

ObjectiveO為 Phase 1 MVP 打好基礎

  • KR1:所有 TODO 項目Auth / DB / Storage / Converter有明確的「替換點」與介面定義
  • KR2:文件完整度 — PRD / Design Spec / TDD 三方交叉審閱通過
  • KR3:避免 local-tool 被破壞 — local-tool 的所有既有測試持續通過0 regression

1.5 北極星指標與指標體系

北極星指標(長期)

每週活躍裝置數Weekly Active Devices, WAD

定義:過去 7 天內,至少成功完成一次推論的已 pairing 裝置數。

為什麼選這個:

  • 對 B2B / 開發者工具WAUUser容易膨脹人來註冊就算但 WADDevice代表真正在用
  • Kneron 裝置本身是硬體投資,裝置被使用 = 用戶正在從中獲得價值
  • 一個用戶多個裝置 / 多個用戶共用一個裝置都反映在這個指標

指標體系

WAD每週活躍裝置數
  ├── 驅動指標:新 Pairing 數、每週人均推論次數、裝置留存率
  │     ├── 輸入指標:註冊到 Pairing 的轉換率
  │     ├── 輸入指標Pairing 後 24 小時內首次推論率
  │     ├── 輸入指標:每週上傳模型數
  │     └── 輸入指標:叢集建立數
  └── 護欄指標(不能惡化的):
        ├── 推論端到端延遲 P95 < 500ms比 local-tool 多 ~300ms tunnel overhead
        ├── Tunnel session uptime > 99%
        ├── API 錯誤率 < 1%
        └── local-tool regression bug 數 = 0

Phase 0 可追蹤的指標(簡化版)

Phase 0 雛形只追蹤最小集:

指標 目標值 追蹤方式
Pairing 成功率 > 90% Server log
端到端推論可跑 Yes 手動測試
API Server 崩潰 0 次 / 週 Log / Monitoring
local-tool 測試全過 100% CI

其他指標等 Phase 1 接 DB 後才開始埋點追蹤。


連結