以真金白銀操盤的「AI 加密貨幣交易對決」上周登場後,立刻在幣圈掀起熱議,如今初步戰績出爐,馬斯克(Elon Musk)的 Grok 、具有中資背景的 DeepSeek,以及 Anthropic 的 Claude Sonnet 4.5 成為首輪最大贏家,各自實現超過 25% 的報酬率;而 OpenAI 的 GPT-5 、 Google 的 Gemini 2.5 Pro 則表現慘烈,雙雙錄得逾 28% 的虧損。
1 萬美元本金實彈對決,由 AI 自主操盤
這場名為「Alpha Arena」的實驗性競賽,不僅是人工智慧(AI)首次完全自主在真實市場中下單操作,更讓各大科技巨頭的旗艦語言模型,直接在加密貨幣市場一較高下,而競賽的既定目標,是將風險調整後的報酬最大化。
每個 AI 模型皆獲得 1 萬美元本金,在去中心化交易所 Hyperliquid 上交易加密貨幣永續合約,標的涵蓋比特幣、狗狗幣(DOGE)和 Solana(SOL)等主流幣種,交易決策、倉位大小、操作策略、進出場時機、槓桿控制,全由 AI 模型自主決策、無人干預,且所有操作紀錄與模型輸出,皆公開透明。
這場競賽自 10 月 17 日開跑,將持續至 11 月 3 日。目前榜單隨時變動,仍屬初步結果。不過,主辦方 Nof1 創辦人 Jay Azhang 表示,他對目前的戰況並不意外:
最終的贏家,通常就在 Grok 和 DeepSeek 之間,有時也會出現 Gemini 或 GPT 奪冠的爆冷賽果。
據 Nof1 公布,GPT-5 在同期間報酬率下跌約 29% 。該模型採取極為謹慎的「防禦型策略」,與贏家積極押多的操作迥異,也與虧損者的高頻錯誤交易形成鮮明對比。 GPT-5 幾乎未大舉進出,只下了少數幾筆單。這使它避開了對手遭遇的災難性回撤,卻也因此錯失可觀收益 —— 最終成為「穩定但不賺錢」的安全派代表。
相較之下,Claude Sonnet 4.5 目前穩居第三名,表現穩健。
華爾街的十字路口:AI 操盤的兩種未來
這場競賽的初步結果,正向華爾街傳遞著一個複雜的訊號,揭示了 AI 金融應用 2 種截然不同的未來:
- DeepSeek: 據悉,DeepSeek 背後有中國量化避險基金的支持,而其成功,可能源於專業的金融數據和專家級的精細化調校,這對於當今數據驅動型的公司來說,是一次革命性的進步。
- Grok: 相比之下,Grok 的強勢表現,則暗示著一個強大的「通用型」AI,或許有能力憑一己之力,成功駕馭複雜的金融市場—— 這對整個行業而言,無疑是顛覆性的發展。
AI 交易的支持者認為,大型語言模型能快速分析龐雜的非結構化資訊 —— 包括即時新聞、社群輿情與總經變數,這正是「下一代交易策略」的關鍵優勢。他們期待 AI 不僅能創造新的超額報酬(alpha),更能讓高度專業的市場分析更普及化。
然而,Gemini 的災難性表現,卻為這場夢想潑了冷水。據悉,Gemini 在賽中頻繁進行毫無章法的「情緒化交易」,不斷在看多與看空之間來回切換,最終以巨額虧損收場,成為「AI 黑箱交易風險」的最佳寫照。
黑箱風險與潛在系統性隱憂
如今,金融機構對 AI 交易的最大疑慮之一,正是其「黑箱特性」—— 模型決策缺乏透明度,無法清楚解釋買賣背後的邏輯,這對監管合規與風險管理是一大挑戰。
更深層的問題是「可靠性」,眾所周知,這些模型容易製造「幻覺」,也就是生成看似合理卻完全錯誤的資訊。在即時交易環境中,這樣的錯誤恐造成災難性後果。
2024 年一篇探討大型語言模型對金融市場影響的研究報告更警告:若多個 AI 交易系統皆建立在相同基礎模型之上,當市場波動時,這些看似獨立的 AI 可能同時觸發類似反應,放大市場不穩定性,甚至引發閃崩。
免責聲明:本文只為提供市場訊息,所有內容及觀點僅供參考,不構成投資建議,不代表區塊客觀點和立場。投資者應自行決策與交易,對投資者交易形成的直接或間接損失,作者及區塊客將不承擔任何責任。