經濟導報記者 劉勇
在5月28日舉辦的中關村論壇人工智能大模型發展分論壇上,由中國科學技術信息研究所、科技部新一代人工智能發展研究中心聯合相關研究機構編寫的《中國人工智能大模型地圖研究報告》(下稱《報告》)正式發布。
《報告》顯示,對全球大模型技術發展脈絡進行梳理發現,自谷歌2017年發布的Transformer網絡結構以來,僅用五年多時間全球已迅速成長出龐大的大模型技術群,衍生出涵蓋各種技術架構、各種模態、各種場景的大模型家族。

《報告》分析發現,美國谷歌、OpenAI等機構不斷引領大模型技術前沿。歐洲、俄羅斯、以色列、韓國等國地越來越多的研發團隊也在投入大模型的研發。從全球已發布的大模型分布來看,中國和美國大幅領先,超過全球總數的80%,美國在大模型數量方面始終居全球最高。

中國自2020年進入大模型快速發展期,目前與美國保持同步增長態勢。在自然語言處理、機器視覺和多模態等各技術分支上均在同步跟進、迅速發展,涌現出盤古、悟道、文心一言、通義千問、星火認知等一批具有行業影響力的預訓練大模型,形成了緊跟世界前沿的大模型技術群。

報告基于公開信息梳理分析了中國已發布的79個大模型,分析結果顯示,目前中國在14個省市/地區均有團隊在開展大模型研發,北京、廣東兩地最多,地域集中度相對較高。從領域分布來看,自然語言處理仍是目前大模型研發最為活躍的重點領域,其次是多模態領域,在計算機視覺和智能語音等領域的大模型還較少。國內大學、科研機構、企業等不同創新主體都在積極參與大模型研發,學術界與產業界之間的聯合開發相對較少。

報告通過調研全國范圍內的算力基礎設施分布情況發現,北京、廣東、浙江、上海等地的大模型數量最多,同時這4個地方也是近三年人工智能服務器采購數量最高的地區,表現出非常明顯的強相關性,為大模型研發應用提供了重要支撐。同時,各地也在通過提供公共算力方式補充快速增長的人工智能算力需求,為大模型研發提供更多算力支撐。

從模型影響力方面看,清華大學與阿里和百度聯合開發的CogView模型論文引用數最高,華為的FILIP、百度的ERNIE3.0以及阿里的M6-OFA引用數也位居國內前列,在大模型領域形成了較好的學術影響力,但與國外領先大模型的學術影響力相比差距仍然較大。

