前言
亞馬遜網路服務(AWS)在最近的年度活動中宣布推出了一系列引人注目的半導體技術,
包括專為機器學習而設的Trainium2和伺服器CPU Graviton4。這標誌著IT巨頭競相發展獨特半導體,
以提升效能和挑戰NVIDIA GPU供應短缺。同時,AWS還推出了生成AI服務Amazon Q,
為企業提供業務支援。此外,亞馬遜與Anthropic的合作,以40億美元投資生成AI技術,預示著未來AI領域的深度合作。

正文
在最近的年度活動中,亞馬遜的雲端運算業務部門,
亞馬遜網路服務(Amazon Web Services,AWS)宣布推出了自家研發的新型半導體。
這次發表包括機器學習(Machine Learning)專用的「Trainium2(特訓2)」半導體
以及伺服器中央處理器(CPU)的「Graviton4(重力子4)」,
客戶將能透過亞馬遜的雲端服務使用這些新技術。
據AWS首席執行官亞當·塞利普斯基(Adam Selipsky)表示,
Trainium2相較於傳統的Trainium,電力消耗減半,而處理速度最多提高4倍。
Graviton4相較於Graviton3,性能提升了30%。
亞馬遜計劃在2024年開始提供基於這些新型半導體的商業服務。
最近,亞馬遜、谷歌、微軟等美國IT巨頭加速推動獨特的人工智慧(AI)半導體開發。
微軟最近宣布推出用於資料中心的AI半導體「Maia」以及雲端服務用半導體「Cobalt」。
谷歌則在其雲端服務「Google Cloud Platform(GCP)」上
提供針對機器學習訓練和推論的「Tensor Processing Unit(TPU)」。
由於NVIDIA的GPU供應短缺,這也是IT巨頭開發獨特半導體的背後原因之一。
一方面,由於CPU性能提升速度減緩,各公司需要找到自家的改進方案。
另一方面,近來的生成AI熱潮導致許多公司,包括初創企業,紛紛進入這一領域。
這使得生成AI所需的NVIDIA製GPU(圖形處理半導體)供應緊張。
亞馬遜則採取擴大與NVIDIA合作的措施。在這次的活動中,
NVIDIA首席執行官黃仁勳(Jensen Huang)登台宣布將在AWS的數據中心引入最新的GPU「H200」。
AWS還將引入結合NVIDIA CPU和GPU的「GH200 Grace Hopper Superchip」。
此外,AWS在這次活動中宣布推出企業級生成AI服務「Amazon Q」。
這是一種類似於美國OpenAI的「Chat GPT」的對話式AI系統,特別針對企業業務進行了優化。
Amazon Q將與Google、Microsoft和Salesforce等業務軟體整合數據,
支援文件摘要、電子郵件起草和會議議程制定等工作。
初始版本僅支援英語,月費從每人20美元(約2950日元)起,
價格低於Microsoft和Google的服務(每月30美元)。
在2023年9月,亞馬遜宣布與生成AI開發的美國初創公司Anthropic進行戰略合作,
投資高達40億美元(約5900億日元)。這使Anthropic能夠利用亞馬遜的AI半導體來構建和部署AI軟體。
亞馬遜將在AWS上提供Anthropic的技術,使客戶公司能夠將生成AI整合到其自家服務中。
Anthropic致力於生成AI「Claude」,並在此次活動中透露將使用亞馬遜的Trainium2進行該AI模型的訓練。
總結
在本次活動中,亞馬遜展示了其對半導體技術和AI領域的承諾。
Trainium2和Graviton4的推出將帶來更高效的機器學習,
而Amazon Q的生成AI服務將為企業提供強大的支援。
同時,與Anthropic的合作將進一步推動AI技術的發展。
這標誌著IT行業在半導體和人工智慧領域的不斷創新,為未來數年的科技進步奠定了基礎。