最佳的 Polymarket 訂單簿數據,以及該如何挑選
你能找到的多數 Polymarket 數據,都只是每小時取樣一次的最後成交價——拿來畫圖還行,拿來回測卻毫無用處。以下說明,到底是什麼把「能拿來實際交易」的 Polymarket 數據來源,和「只是看起來像數據」的來源區分開來。
決定數據能否回測的五大標準
1. 解析度:事件驅動,而非按固定間隔取樣
按固定時鐘擷取的快照——每小時、每分鐘、每幾百毫秒——會錯過每兩次取樣之間發生的一切。Polymarket 的短天期市場在 5 到 60 分鐘內結算,因此間隔取樣在一個市場的整個生命週期裡,只能擷取到寥寥幾個畫面。
DepthFeedDepthFeed 在每一筆訂單簿與價格變動事件發生的當下就予以記錄——Polymarket 上的傳輸延遲中位數約 10ms,Kalshi 上則是持續不斷的全深度輪詢——因此取樣之間的任何變化都不會遺漏。
2. 深度,而非最後成交價
最後成交價(或單一中間價)會隱藏買賣價差,以及掛在每一檔位上的數量。沒有完整的價格階梯,你就無法衡量滑價;而一個假設你以中間價成交的回測,是一個會說謊的回測。
DepthFeedDepthFeed 提供完整的買賣訂單簿、雙邊、每一檔位——Kalshi 上每邊最多達 100 levels——因此成交是針對當時真正存在的流動性來計算數量。
3. 覆蓋範圍:一套 schema,涵蓋每個場館與每種資產
單一場館的數據集,會逼你為每個市場拼湊出不同的格式,每多接一個就得重寫一次載入器。資產覆蓋不全,更會悄悄地限縮你究竟能測試哪些策略。
DepthFeedDepthFeed 以一套穩定的欄式 schema 提供 Polymarket、Kalshi 與 Limitless,橫跨七種資產——BTC、ETH、SOL、XRP、DOGE、BNB、HYPE——因此同一套程式碼就能讀取每一個場館。
4. 傳輸方式:即時 API 與串流,而非靜態檔案
可下載的 CSV 或 Parquet 檔,是一張凍結的快照——它會過時,你得重新下載,而且它永遠不會變成你真正用來交易的東西。研究用的格式和正式環境用的格式最終各不相同,於是你得把一切重接一遍才能上線。
DepthFeedDepthFeed 是供歷史查詢的計量式 REST API,也是供當下使用的即時 WebSocket 串流,兩者輸出完全相同的 JSON。先回測,再把同一套程式碼指向即時數據流去交易。
5. 你能信任的真實成交
回測的全部意義,就在於知道一個策略當初是否會成交、又會以什麼價格成交。唯有當你重播該策略當時真正會交易到的那本訂單簿,且時間戳精細到足以對齊驅動行情的那一波變動時,這個答案才存在。
DepthFeed每一張 DepthFeed 快照都帶有以 epoch-millis 表示的交易所與接收時間戳,並接合到一個高頻的標的價格,因此訂單簿狀態能與現貨變動逐筆對齊。
常見選項的不足之處
當人們想找 Polymarket 數據時,通常會伸手抓住以下四種之一。每一種都有它的用途——但沒有任何一種,是你拿來回測的那本訂單簿。
問題,一一解答。
最佳的來源,是那種會記錄每一筆訂單簿變動(而非固定間隔取樣)、提供雙邊完整買賣價格階梯(而非只有最後成交價)、以一套 schema 涵蓋你所交易的場館與資產,並以相同格式提供歷史與即時數據、讓你能用回測過的同一套程式碼上線交易的來源。DepthFeed 正是為了在 Polymarket 上做到這一切而打造,Polymarket 上的即時傳輸延遲中位數約 10ms,並對 Kalshi 進行持續不斷的全深度擷取。