前言
ChatGPT 引發的AI熱潮也蔓延到了金融行業。
彭博於3月30日發布了一篇研究論文,詳細介紹了 BloombergGPT 的開發,這是一種新的大規模生成人工智能 (AI) 模型。彭博表示由於金融領域複雜且具許多專業術語,因此有必要有專屬 AI 模型。
這種大型語言模型 (LLM) 專門針對各種金融數據進行了訓練,支持金融行業內的各種自然語言處理 (NLP) 任務。BloombergGPT和OpenAI開發的ChatGPT一樣,將從根本上顛覆書面交流,BloombergGPT 也將徹底改變金融行業。
本文就來介紹 BloombergGPT 到底是什麼?以及它到底有多厲害。
BloombergGPT/圖彭博
BloombergGPT 介紹
美國財經資訊公司彭博(Bloomberg)近日宣布研發自有的AI智慧聊天機器人 BloombergGPT,盼推出專屬於金融領域的人工智慧AI資訊處理應用,提供客戶更好的功能與服務。
根據彭博公告,BloombergGPT 大語言模型(LLM)專門針對各類金融數據進行訓練,從而全方位地支持金融領域的各種自然語言處理(NLP)任務。這些任務可能包括但不限於快速地分析財務數據、協助進行風險評估,以及自動執行會計和審計任務等。
該模型將幫助彭博改進現有的金融NLP任務,例如:市場情緒分析、實名實體識別、新聞分類和問題回答等。除此之外,BloombergGPT 還可以調動、整理 Bloomberg Terminal 上可用的大量數據,更好地幫助公司的客戶,並將人工智能的全部潛力應用到金融領域。
BloombergGPT 透過研究人員開創的混合訓練法,將金融數據與通用數據集結合起來訓練模型,既可以在金融基礎上取得最佳結果,同時也可以在通用LLM基礎上保有足夠的競爭力。
BloombergGPT 龐大資料庫
擁有彭博在數據創建、收集和整理方面的資源,BloombergGPT 是迄今為止規模最大的專業領域數據集之一。
40多年間,彭博積累了充斥大量金融用語的文檔,其開發團隊從這個由大量英文金融文檔組成的數據庫中提取並創建了一個包含3,630億詞例(token)的金融數據集。該數據集又與另外一個包含3,450億詞例的公共數據集疊加,形成一個包含超7,000億詞例的大型訓練語料庫。相比之下,OpenAI 在2020年推出的ChatGPT-3 的模型,訓練語料庫約有5000億個token。
BloombergGPT 測試結果
彭博的研發團隊利用BloombergGPT 語料庫的一部分內容訓練了純解碼器(decoder-only)因果語言模型,包含500億個參數,並對訓練出的模型進行了基準測試。
金融領域的NLP任務採用了彭博的自有基準,各類通用NLP任務則採用了市面上流行的基準,如BIG-bench Hard、 知識評估、閱讀理解以及語言任務。測試結果顯示,BloombergGPT 在金融任務上的表現遠超其他規模相似的開發模型,同時在一般 NLP 基準測試中的表現仍持平,甚至達到更好的水平。
BloombergGPT 在兩大類NLP任務中進行測試,分別是:金融特定任務和通用任務/圖彭博
BloobbergGPT 功能
由於 BloombergGPT 的訓練基礎與其他大型語言模型相同, BloombergGPT 具有類似 ChatGPT 的功能,但此外也能處理與彭博需求更相關的任務,例如將自然語言指令翻譯成彭博查詢語言(Bloomberg Query Language)終端機的使用者偏好功能,此外也能寫出 Bloomberg 風格的新聞標題。
總結
彭博表示,基於大型語言模型的人工智能在許多領域都已經展示出了應用潛力,然而金融領域的複雜性和獨特的術語,意味著需要有一個專攻金融專業的智慧模型模型。BloombergGPT 的推出意味著,金融行業在基於LLM的人工智能開發和應用方面已經邁出了第一步。
雖然彭博並沒有明說未來打算用 BloombergGPT 做什麼,但隨著持續的訓練,BloombergGPT 可能會超出今日我們所想像的,就讓我們繼續期待 BloonbergGPT 後續的運用及發展吧!