加密數據服務平台 Dune 用上 AI,LLM 會成為其護城河嗎?

原文作者:月之暗面

原文來源:PANews


近日,加密數據查詢網站 Dune 宣布更新其 LLM(大型語言模型,Large language model)路線圖,首期上線 GPT-4 支持的查詢解釋(Query Explanations)功能,後期將會逐漸增加更多功能,比如自然語言查詢(Natural Language Querying)、 SQL 語句轉義(Query Translations)和優化搜索等。

不同於其他數據分析網站付費查詢商業化路線,Dune 在上線後始終對普通用戶免費開放,因此在上輪的牛市週期沉澱了足夠多的用戶量,而 LLM 的加入,則有望使其沉澱的數據查詢語句、看板轉化為實際的殺手鐧,並且引導普通用戶加入創作者行列。

Dune 的數據查詢鴻溝

得益於區塊鏈數據的公開性和透明度,任何人都可直接訪問區塊鏈數據,但是原始數據(Raw Data)往往難以辨認,非專業程序員很難看懂其含義,但是其上的數據蘊藏著巨大的經濟價值,因此各類數據分析工具便應運而生,為各類分析師、研究員和普通散戶提供間接訪問和深度分析的工具。

Dune 在其中最為引人注目,因為其提供了真正自由且強大的分析工具,任何人都可通過 SQL 語句進行對數據的查詢、分享和展示,甚至部分項目直接選擇 Dune 作為官方信息展示平台。

但是 Dune 的 SQL 查詢功能,表面看是 UGC 模式,平等的賦予每一個用戶權限去執行查詢任務,但實際上 Dune 採納的 SQL 模式存在兩個問題,其一是門檻過高,SQL 是(結構化查詢語言,Structured Query Language)的簡寫,比如查詢 Uniswap 上以 DAI 作為交易對的數量,僅僅需要 5 行代碼即可完成。但是一旦執行查詢的邏輯變得複雜,其代碼量可能會大幅增加,非專業程序員很難自行寫出,這導致大量用戶只能成為看客。

例如,官方進行簡化後的「nft.trades」查詢流程,包含了近 20 萬行的 SQL 語句轉換、 10 萬行的測試代碼,並且由 55 個社群成員參與其中,單個用戶無法處理如此大規模的任務。

其二是 Dune 的 V1 和 V2 版本的之間支持的 SQL 標準並不統一,V1 和 V2 分別使用的 Po stgreSQL 和 Spark SQL,後續計劃由 Dune SQL 完成統一。

在本次升級 LLM 功能之前,Dune 已經在準備統一查詢引擎,計劃在今年 7 月份之後全部遷移至 Dune SQL,以保證產品邏輯的統一性。更新後的 Dune SQL 是基於開源查詢引擎 Trino 的實現,Dune 對其進行優化,以適配 Dune 自身的需求,與流行的 Spark SQL 並無本質上的差異,更多是在具體函數和語法上的改進。比如 Dune SQL 提供了更多的運算符,方便快速對日期和時間進行計算,以及對管理權限進行限制,所有涉及對原始數據本身的刪除、更新等操作均無法執行,以保證數據的安全性。

但是 SQL 查詢門檻過高的問題,依舊無法通過更改 SQL 範式得到解決,這意味著大多數用戶和程序員都要去適應新的語法格式,比如說針對具體的查詢語句,新用戶和程序員都要去適應。而對自動化工具的需求,不僅對於普通用戶具備現實意義,對不熟悉新語法的程序員也大有裨益。

實際上,在遷移 Dune SQL 路線圖中,Dune 已經在嘗試實驗自動化工具,可以將不同的語法格式統一轉化為 Dune SQL 語句,而在 GPT-4 使用 LLM 顯示人機交互方面的威力後,Dune 也順勢推出自己的 LLM 計劃。

LLM:解鎖普通用戶的參與感

Dune 的典型流程是解構鏈上數據,專業用戶通過 SQL 執行查詢,隨後將看板(Dashboard)分享給有需要的用戶。在這個流程中,最關鍵的是執行查詢,而大多數用戶因為缺乏代碼知識而無法使用查詢功能。

而在引入查詢解釋功能後,上述流程發生一些微調,在專業用戶寫的 SQL 查詢界面,會出現解釋頁面,以自然語言的格式直觀地告訴查看用戶代碼的具體作用,相當於給 SQL 查詢添加一個解釋說明的補丁,並不會改變當前的工作流程,這也是團隊在吸取合併 SQL 語句時的教訓,即降低對用戶既有習慣的干擾,而是盡可能在現有流程優化體驗。

在 LLM 加入後,一定程度上抹去了專業用戶和普通用戶的能力差異。借助 GPT-4 對代碼的理解能力,可以讓普通用戶直觀的理解查詢語句的作用,而無需掌握 SQL 知識。在此功能引入前,用戶只能被動的在看板頁面閱讀圖表,而在引入查詢解釋功能後,普通用戶也可以理解 SQL 代碼是發揮作用的具體含義。

比如說 Alice 想要查詢 LayerZero 交易的相關信息,那麼她可以直接找到 Bob 已經製作好的 Dune 看板,可以發現 49.4% 的用戶都集中在 1 次,那麼 Alice 有理由推斷說明這是為了潛在的經濟刺激而進行的虛假交易,但是無法一錘定音,因此 Alice 決定去翻閱代碼檢查結論是否可靠。

但是 Alice 發現雖然結果只有 5 行數據,但是查詢代碼足足有 150 行,Alice 的 SQL 水平不足以確認每個語句的正確性,而此時查詢解釋功能則會「翻譯」代碼的具體說明,如圖所示,查詢分成了 3 個部分:收集數據涵蓋了 Arbitrum 、 Avalanche 、 BNB 、 Ethereum 、 Optimism 、 Polygon 和 Fantom 等多條鏈,並且第二部分是計算每個用戶(`sender`)的交易數量。第三部是針對數量設置閾值對用戶進行分類:1 Tx’, ‘2 ~ 5 Tx’, ‘5 ~ 10 Tx’, ’10 ~ 20 Tx’, 和’>= 20 Tx’ 。

那麼此時 Alice 可以在不理解 Bob 寫的代碼含義基礎上去進行分析和判斷。本質上,查詢解釋的功能相當於給代碼和人類之間進行了一次轉義和翻譯,那麼反過來,也可以將人類語言翻譯成 SQL 語句,在 LLM 加持下,得益於 Dune 攢下的海量查詢語句數據,這並不難實現。

自然語言查詢(Natural Language Querying)就是 Dune 後續 LLM 改進的重要方向。自然語言查詢可以讓用戶以傳達指令的方式去執行圖表生成任務,這比使用 SQL 語句、拖曳生成等模式更為符合普通人的思維方式,免去對實現細節的關注。

並且,自然語言查詢並不是對專業用戶,如分析師群體的替代功能,而是一種補強,現存的 Dune 有將近 70 萬個圖表,相當一部分的分析任務是重疊和衝突的,而使用自然語言查詢,也有助於系統去理解圖表之間的關聯,從而進一步提升整個分析工作的效率。

在 LLM 加入後,現存圖表、 SpellBook 和文檔數據也將被重新整合,效仿 OpenAI 的聊天機器人,Dune 也會開發對話機器人,幫助用戶以更簡易的方式去理解和利用現存的知識體系,而不需要受到不相關信息的干擾。

比如,Alice 可以將上述查詢 LayerZero 用戶交易量分佈的情況逆置,先用英語發出查詢指令,並且交代好每一步的工作流程,隨後 Dune 會幫助 Alice 寫好 150 行代碼,隨後生成圖表。

結語:人人都能當數據分析師

Dune 的目標並不是建立一個單純的鏈上數據分析平台,而是希望打造一個可以使信息自由流動的數據管道,允許用戶抓取、轉換、管理、查詢、可視化以及利用數據去採取行動。

數據流動的前提是必須進行模塊化,可任意組合和配置,最終建造社群共享的數據集,而不是集中在復雜的 SQL 語句或者付費 API 之內,最終達到人人都可和數據進行交互的平權圖景。

概要而言,Dune 的 LLM 計劃是「翻譯」和助手,目標是讓普通用戶讀懂數據所代表的一切,不僅是最終結果的展示,而是深入到生成過程之中,最終人人都可進行鏈上數據分析。


(以上內容獲合作夥伴 PANews 授權節錄及轉載,原文連結

聲明:文章僅代表作者個人觀點意見,不代表區塊客觀點和立場,所有內容及觀點僅供參考,不構成投資建議。投資者應自行決策與交易,對投資者交易形成的直接間接損失作者及區塊客將不承擔任何責任。

延伸閱讀


「區塊鏈應用法律高峰論壇 2023」

由區塊客與奧果區塊顧問 Argoblocks 主辦、 KryptoGO 共同主辦的年度產業論壇活動 —「區塊鏈應用法律高峰論壇 2023」— 將於 4 月 7 日盛大登場。區塊鏈應用法律高峰論壇為亞洲區塊鏈法律頂尖論壇品牌,每年蒐集業界最迫切的關鍵議題,邀請產官學代表進行討論,論壇旨在集合金融科技法規之法律從業者及產業人士,共同探討區塊鏈應用的適法性,期盼在科技發展之初,提供一個法律友善的創業發展環境予全球業者,進而落腳台灣,帶動科技法律新時代。

詳細請至https://blockchainlegalforum.com/

早鳥門票現正開賣http://bit.ly/3mgULzD

免責聲明:本文只為提供市場訊息,所有內容及觀點僅供參考,不構成投資建議,不代表區塊客觀點和立場。投資者應自行決策與交易,對投資者交易形成的直接或間接損失,作者及區塊客將不承擔任何責任。

下一篇