編輯|王博
2020年,北京市最后一座煤礦——隸屬京煤集團的大臺煤礦正式關閉。
鼎盛時期,京煤集團在北京擁有10座煤礦,為北京市民提供日常燒火、取暖用煤。2007年之前,北京煤炭年平均消費總量的60%來自京西的門頭溝。
大臺煤礦的關閉,標志著門頭溝近千年來“烏金遍地下,百寶滿山川”的歷史畫上句號。
在“大炮一響,黃金萬兩”的資源型產業逐步退出后,門頭溝區經過漫長艱辛的產業轉型探索,最終將轉型重點鎖定在“人工智能”“超高清數字視聽”“心血管領域醫療器械”三大細分領域,并集聚起近百家專精特新企業,昔日的“礦山”經濟已經蝶變為高精尖的“智慧”經濟。
作為門頭溝區的三大產業之首,人工智能產業是門頭溝區探索高質量發展的縮影,“京西智谷”成為了門頭溝區的新名片。
打造“京西智谷”,離不開算力的支持。今年6月,京西智谷人工智能計算中心(以下簡稱“智算中心”)正式上線。7月,科技部正式批復京西智谷人工智能計算中心為“國家新一代人工智能公共算力開放創新平臺”,這標志著該中心作為華北地區首個獲批“國智牌照”的人工智能公共算力開放平臺,被納入全國人工智能算力發展戰略體系。9月14日,依托智算中心的算力支撐,北京算法交易服務中心正式成立。
門頭溝一直在為北京的發展提供動力——過去是煤,現在是算力。
而算力技術,來自昇騰。借助昇騰計算底座的技術能力,智算中心首批算力規模已達到100P(1P約等于每秒1000萬億次的計算速度),今年算力規模將達到400P,并將持續擴容至1000P。
北京各區并不缺科創的沃土,為什么昇騰會選擇門頭溝?
「甲子光年」近期走進了“京西智谷”,采訪了產業相關方,試圖揭開這座“北方算力樞紐”的神秘面紗。
京西智谷,圖片來源:「甲子光年」拍攝
1.破局點:智能算力
近年來,門頭溝區關閉了區屬全部270多家鄉鎮煤礦,500多家非煤礦山、砂石廠,但隨之而來的是,京西地區經濟總量和財政收入大幅下降,填補產業空心化迫在眉睫。
如何破局?
盡管現在人們已經知道答案是“三大產業”,但翻看過往的規劃,「甲子光年」發現門頭溝區在人工智能領域早有布局。
在2019年獲批的門頭溝區分區規劃(2017年—2035年)中,新城南部片區就被定義為“創新發展軸”,位于這里的中關村門頭溝園,其主導產業就有人工智能。
門頭溝分區規劃(國土空間規劃)(2017年—2035年),門頭溝區政府官網
中關村門頭溝園管委會相關負責人表示,在人工智能產業發展熱潮中,算力跟基礎設施是一樣的,大企業有自己的算力,而對于中小企業來說,算力非常寶貴,為中小企業提供普惠的算力服務,在北京市范圍內,門頭溝區是第一個破題的。“我們破解了這個難題,同時也解決了門頭溝自身發展的難題,找到了破局點。”
「甲子光年」智庫管理分析師劉瑤認為,在現代人工智能領域,算力扮演著推動創新、實現突破的核心驅動力。算力、算法、數據和系統架構等多個方面的綜合優化對于大模型訓練至關重要。
去年11月底,ChatGPT在人工智能領域點亮全新的科技樹。僅半年后,北京便推出《北京市促進通用人工智能創新發展的若干措施》(以下簡稱《措施》),《措施》的第一項便是“提升算力資源統籌供給能力”。
全球各國的科技巨頭都為英偉達的H100搶破了頭,算力告急。對中國AI企業而言,由于眾所周知的原因,獲取算力資源面臨重重限制。但無論如何,國內的大模型研發不能停,找到英偉達“平替”是整個產業鏈上下游都為之努力的事。
IDC預測2021年到2026年期間中國智能算力規模年復合增長率為52.3%,遠高于同期預測的基礎算力的增長率。《2022—2023全球計算力指數評估報告》顯示,計算力指數平均每提高1點,國家的數字經濟和GDP將分別增長3.6‰和1.7‰。
「甲子光年」智庫在《中國AIGC產業算力發展報告》中指出,智能算力持續增長,未來需求增加,進一步加快了智算中心建設及相關設備增長。
《中國AIGC產業算力發展報告》,圖片來源:「甲子光年」智庫
由此看來,門頭溝區以智算中心為抓手,布局人工智能產業,其背后有著深入的行業洞察。
京西智谷人工智能計算中心目前已與50多家單位開展商務合作,對接了300多家北京市人工智能相關機構。從三個層面來看:
基礎算力層,智算中心將不斷擴大算力規模。100P算力集群內置320張卡,400P算力集群將有1200多張卡,1000P集群卡數達3200張;
框架層,智算中心正在引入華為、百度等國產開源框架生態,同時也擁抱國際主流使用的Pytorch、Tensorflow;
模型層,智算中心支持開源大模型的服務,幫助企業在大模型時代加快業務創新,已適配并提供ChatGLM-6B、華為開源盤古、Baichuan-7B/13B等多個開源大模型。同時還適配多個業界主流開源模型,包含自然語言處理、計算機視覺等多個領域,已有幾十家人工智能企業在此孵化基礎大模型、行業大模型和應用模型。
這一切成果,都來自于一場雙向奔赴。
2.昇騰和門頭溝的雙向奔赴
當前人工智能技術快速發展,對產業影響逐步加深,為了抓住這一歷史性戰略機遇,華為提出全面智能化(All Intelligence)戰略。華為副董事長、輪值董事長、CFO孟晚舟9月20日在華為全聯接大會2023上表示,“華為致力于打造中國堅實的算力底座,為世界構建第二選擇。我們將持續提升‘軟硬芯邊端云’的融合能力,做厚‘黑土地’,滿足各行各業多樣性的AI算力需求。”
華為副董事長、輪值董事長、CFO 孟晚舟發表主題演講,圖片來源:華為
在全國算力基礎設施領域,昇騰是一個不可忽視的存在。此前,昇騰人工智能計算中心已經在深圳、武漢、西安、許昌、廣州、青島等城市落地。
為什么昇騰會選擇在北京門頭溝“落下一子”?
對于人工智能這樣的高精尖產業而言,門頭溝其實有一定區位優勢。
很多人印象中的門頭溝是山區,但其實門頭溝新城距離天安門以及海淀區的高校開車僅需30-40分鐘,且快速路免費通行;作為長安街延長線區域,門頭溝區有充沛的產業空間,可承載足夠多的人工智能初創企業;由于近幾年內門頭溝重點建設生態,沒有工業聚集,使得門頭溝的土地成本及生活成本較低,比較宜居;另外,生態建設也為門頭溝積累了充分的能耗指標,足以支持智算中心的運作。
不過,除了本身的區位優勢外,昇騰來到門頭溝還有著某種“歷史必然性”。
建設智算中心是一個需要消耗人力、物力、財力的大工程,政府通常先要算一筆“經濟賬”,嚴格考量智算中心給區域帶來的產業價值。對于一些人工智能產業集群成熟的地區而言,區域內頭部企業可以用自有資金建設人工智能計算中心,政府便不會再出資建設集中化的智算中心。
作為歷史悠久的資源依賴型地區,門頭溝區的產業結構十分單一,缺少發展各類工業的制造基礎。也正因如此,面對顛覆性的技術浪潮,門頭溝區沒有太多沉重的包袱,能夠更加專注地投入人工智能這樣對制造基礎沒有過高要求的高精尖產業。
這種“力出一孔”的篤定,讓門頭溝區能夠更加包容中小企業。
“人工智能企業早期是很燒錢的,可能很長時間才能看到成果,通用大模型慢慢走向行業大模型,形成集成化應用后才能變現。一些產業集群比較成熟的大區,對這些人員規模不大、無法產生上量稅收的中小型企業可能關注比較少。”北京昇騰人工智能生態創新中心COO李天哲告訴「甲子光年」,“但他們來到門頭溝會很受重視,門頭溝區政府非常親民,給了企業大量支持。”
昇騰也被這種氛圍所感染。“我們是被門頭溝區領導的激情給點燃的,我說的是‘激情’,而不是‘熱情’。他們發展人工智能產業的決心點燃了我們。”回憶起當初合作的過程,華為北京戰略與Marketing部部長劉海濤依然很激動。這種決心,讓昇騰落地門頭溝,與各方共同打造“京西智谷”,成為了水到渠成之事。
或許有人會疑惑,在算力基礎設施方面,已經有傳統IDC、公有云IDC等模式,為什么各地還要建設人工智能計算中心?
對此,北京昇騰人工智能生態創新中心CTO楊光解釋,相比于傳統IDC,智算中心的液冷設計使得其PUE值(能量使用效率)等能耗指標更低,從而提高機柜整體的算力密度;相比于公有云,智算中心的服務更加敏捷,智算中心由政府投資建設并由區屬國企運營,相對于飄忽不定的云節點,智算中心也更能保障數據安全。
目前,全新的大模型技術范式給智算中心提出了更高的要求。
訓練大模型所需的算力集群已經達到千卡、萬卡級別,這個數字還會隨著模型規模的擴大而繼續擴大。智算中心需要每天24小時不間斷運行,算力集群的能耗將隨之暴漲。
此外,如果大模型訓練已經完成99%,智算中心突然斷電或死機,前期努力將付之東流。因此,運作如此大規模的算力,智算中心的能耗和穩定性都直接影響著其可用性。
昇騰人工智能計算中心已經在全國多地的實踐中積累了許多經驗。
能耗方面,智算中心已經實現全液冷設計。近年來,傳統IDC單機柜功率達到8千瓦,一些高端計算甚至達到20、30千瓦,但液冷技術加持的服務器單機柜密度已經超過100千瓦。單機柜密度越大,占地面積越小,設備管理成本越低。
也正因如此,京西智谷人工智能計算中心才能在僅50平方米的房間內,“裝下”100P的算力。100P大約相當于五萬臺高性能電腦的算力集合。實際置身北京機房,幾乎聽不到太大噪聲,這里只有一臺Atlas 900 AI 集群( Atlas 900 PoD )。
京西智谷人工智能計算中心機房,圖片來源:受訪者提供
在系統可用性方面,昇騰智算中心不僅在硬件上不斷優化,也相應地對軟件進行調優升級,從而保證機器的高可用性。
這些經驗已經被帶入“京西智谷”。
昇騰與門頭溝區、中關村發展集團合作打造的京西智谷人工智能計算中心,正是瞄準了中小企業訓練行業大模型對算力的渴求。
對于還在起步階段的中小企業而言,算力無疑是稀缺資源。他們沒有足夠的財力和大廠爭奪GPU或自建算力中心,但同時又希望抓住大模型浪潮大干一場。尋求政府扶持并與大企業合作無疑是一條性價比最高的路。
“京西智谷”聯合北京市知識產權局打造的專利中心,讓中小企業的模型訓練過程更加可售、可管、可控。“整個智算中心的數據就全部保存在京西智谷人工智能科技園中,園區企業使用智算中心的速率會更快也更安全。”楊光表示。
同時,本地化部署算力也能幫中小企業節省大量時間成本,中小企業使用模型算法會更便利。“我們依托門頭溝的智算中心建立了一個無形的技術交流圈。園區企業或是京西人才培養基地的開發者在做算法或技術遷移的過程中遇到任何問題,都能隨時到我們辦公室一起討論。”楊光分享道。很多時候,把握時間優勢,是決定初創企業成敗的重要因素。
不過,要發展人工智能產業,只有算力顯然不夠。模型算法設計上的工程創新,很大程度上成為點亮大模型魔法的最后一把火。
要繁榮算法,就要有強勢的人才儲備。
3.人才是算法的“源動力”
從DeepMind的Alpha系列,到OpenAI的GPT系列,再到Meta的Llama系列,每一個點亮AI魔法樹的模型背后,都有一個足夠硬核的研發團隊。
過去半年,在“撲朔迷離”的大模型刷榜熱潮中,投資者或普通用戶要判斷大模型的能力,很重要的一個側面也是看大模型研發團隊的構成。
今年5月,北京市門頭溝區頒布首個人工智能算法領域專門人才政策——《關于實施算法人才集聚行動 打造“京西智谷”的若干支持措施》。目前北京人工智能領域核心技術人才超4萬人,人工智能論文發表量居全國第一。在專利授權數量全球排名前100的機構中,北京總部機構30家。
「甲子光年」梳理發現,這份人才政策最大的亮點在于,將算法人才支持拓展到產業細分領域關鍵要素上,在創業空間、算力支持、算法交易、融資保障等10個方面為人工智能算法人才創新創業提供精準支持。
比如,對算法人才創辦企業的,前3年免費入駐“算法創客空間”,并提供算力補貼;建立“算法交易所”“京西智谷融資服務平臺”,支持算法人才將算法產品上市交易,并為算法人才在創辦企業、科學研發等方面提供便捷的融資服務;對在科研平臺建設、科研成果研發等方面有突出貢獻的人才,最高獎勵500萬元;同時為算法人才提供引進落戶、人才租賃住房、就診綠色通道、適齡子女入學入園等方面的服務保障。
“作為北京人工智能重點布局地區,門頭溝區將結合此次人才政策的出臺,進一步貫徹重才、愛才、用才、興才的理念,不斷優化‘京西智谷’人才發展生態體系,形成創新創業的獨特優勢。”門頭溝區委組織部相關負責人表示。
要培養人才離不開高校的參與,但門頭溝所在的京西地區整體不具備人才優勢,唯一一所高校是位于石景山區的北方工業大學。為盤活人才資源,門頭溝區決定聯動周邊高校資源。
那么,如何吸引高校與門頭溝合作呢?
在今年8月舉辦的中國計算機學會(CCF)人工智能會議上,多所高校提到的算力需求問題。“對高校而言,算力存在非常大的約束。”在西安電子科技大學教授苗啟廣看來,面對算力不足的現狀,如何充分利用好外界提供的算力,是高校需要思考的問題。煙臺大學計算機與控制學院教授王瑩潔也表示,對高校來說,使用算力是一件需要“砸錢”的事。
如何更好地利用算力平臺為科研服務,也是高校的需求。
據了解,教育部、華為在2020年底就聯合發起“智能基座”產教融合協同育人基地,首批布局72所高校。旨在深化信息技術領域人才培養模式改革和協同創新,構建以信息技術領域關鍵核心技術為基礎的產業與人才生態。
看到這一契機,今年2月,門頭溝區便開始于北京市教委接觸,商討合作。5月,雙方達成共識,開始在北京各大高校推廣昇騰的教學課程。上文提到的首個人工智能算法領域專門人才政策便在此基礎上逐漸成型。
目前,北京航空航天大學、北方工業大學、北京工商大學等高校均已參與到這輪人才培養計劃中。具體的合作形式和內容則根據學校自身教學特色有所差異。
其中,北京航空航天大學與昇騰的合作更多建立在其自研的根技術之上。2020年,北航與華為簽訂戰略合作協議。目前,雙方已經完成四期合作培養,每一期教學都會有華為的技術專家到場授課,課后還會有華為的工程師團隊指導學生的實踐項目。
北方工業大學則以培養應用型人才為主。去年,北方工業大學成立了“數字產業學院”,希望建立一個產教融合的平臺,并為此設立了相應的產業教育項目,面向所有專業同學開放。
北方工業大學數字產業學院副院長徐繼寧對「甲子光年」說:“我們在京西,也要服務京西,我們和門頭溝人工智能園區的合作是全方位的,我們自己的老師也和華為在自主創新技術方面進行了科研方面的合作。”
北京工商大學與門頭溝的合作節奏也很快——今年4月開始與門頭溝區接觸,5月便簽訂校企合作協議,7月便有7名教師參加了昇騰組織的培訓課程,學習昇騰AI的軟硬件平臺。今年10月,學校將與昇騰共建新的課程體系,在機器學習、深度學習、圖像處理、模式識別等方向與昇騰密切合作。同時,北京工商大學也購買了部分昇騰算力用于教學和科研。
事實上,無論是校企合作,還是建設人才實訓基地,都不同程度服務于一個共同目的——為產業園區“聚人氣”。依托智能算力的支持,各方希望在門頭溝共同建立一個人工智能算法領域的“黃埔軍校”,而算法的發展和迭代又能拉動算力的需求。
《中國AIGC產業算力發展報告》,圖片來源:「甲子光年」智庫
計算是個生態型產業。在英偉達創立之初,工程師們更多會扮演“學生”的角色,奔波于各地,聯合高校、企業共同創新。建立技術壁壘后,英偉達才逐步向高端算力發展。這個進化過程中,英偉達也逐步形成了自己的生態。
“我們積極與北京各大高校開展科研聯創和人才培養活動。希望從培養學生開始,讓更多開發者會用昇騰和昇思,并逐漸圍繞昇騰技術路線培養一批技術骨干,這些技術人才未來進入產業界,能夠更好地支持企業基于昇騰和昇思打造有行業競爭力的AI解決方案。”說這句話時,楊光的眼中閃著光。
未來,門頭溝區也將持續與北京各大高校建立合作,后續或將與20多所高校陸續建立合作。同時,高校學生可以在門頭溝區內的實訓基地切身感受到昇騰技術底座的迭代,也將與園區內企業對接,為高校學生提供更多實訓、實習機會。
4.“黑煤”已成“黑土”
在人工智能產業發展過程中,算力和算法是必不可少的技術“骨架”,而多元的應用生態則真正為人工智能產業注入“血肉”。
目前,京西智谷人工智能計算中心已經與多家企業在應用層展開合作。
中科視語(北京)科技有限公司是中國科學院自動化研究所科技成果轉化企業,2018年就來到了門頭溝。可以說,中科視語一路見證了“京西智谷”從無到有的蛻變。
Transformer時代開啟后,中科視語便開始探索人工智能大模型的基礎建設。“自建算力中心成本對我們來講非常巨大,”中科視語聯合創始人張臘說,“智算中心建成后,中科視語成為了第一批享受到紅利的企業。”中科視語的“視語坤川”通用視覺大模型就是在昇騰910和智算中心算力的加持下所訓練而出的專門針對道路病害識別的大模型。
全自動多功能無人駕駛道面病害檢測車,圖片來源:受訪者提供
目前,雙方的合作模式也比較靈活。智算中心會根據中科視語的實際需求簽訂月租或年包服務,合作過程中,也會根據實際需求靈活調配算力。除提供算力外,智算中心也會提供昇騰配套的工具鏈,支持行業模型的訓練部署和調試,降低了企業適配整體計算環境的時間成本。
格靈深瞳也正在與智算中心洽談合作。
格靈深瞳副總經理周瑞介紹,公司內部原本有一個小型機房,但公司并不希望管理大規模的固定資產,機房運維、升級等工作十分繁雜。
因此,面對當前大模型所迫切需要的大規模算力支持,格靈深瞳更希望尋求成熟算力系統的支持。“每次我們內部聊起這個機房的時候,我總說能不能把這個機房‘處理掉’。”周瑞開玩笑道。
目前,格靈深瞳的智慧體育、人機交互、軌道交通等業務線所涉及到的機器識別、三維重建算法,均來自于對內部圖像預訓練大模型的蒸餾和量化。公司會根據大模型設計下游任務,并生產規模更小的行業模型,應用在實際場景中。
格靈深瞳智能列車巡檢機器人,圖片來源:「甲子光年」拍攝
可以看到,從算力、算法、數據到應用生態的建設,門頭溝聯合各方幾乎在傾盡所能發展人工智能產業,打造“京西智谷”。目前,已有幾十家人工智能企業在此孵化基礎大模型、行業大模型和應用模型,這里成為了人工智能產業的“黑土地”。
現在只是通用人工智能時代的序幕,“京西智谷”最終能在通用人工智能時代扮演什么樣的角色,還需要時間來證明。
但對于門頭溝而言,它注定已經成為區域產業轉型中濃墨重彩的一筆。
(封面圖來源:受訪者提供)