由ChatGPT掀起的大模型浪潮仍在繼續。被譽“AI第一城”的北京,率先將重點落在了政策上。《北京市促進通用人工智能創新發展的若干措施(2023-2025年)(徵求意見稿)》(以下簡稱《若干措施》)5月12日起向社會公開徵求意見,5方面21條措施涵蓋了算力、數據要素、大模型技術、應用場景等諸多受到廣泛關注的領域。而在AI“新基建”領域,《若干措施》也畫出了一條涵蓋算力、算法以及數據訓練的清晰圖譜。作為“人工智能實現的基礎之一”,教育、自動駕駛和醫療等領域都是大模型的應用場景,未來大模型或將改變短期內“碎片化的協助作用”,帶來全流程的個性、精準化服務。,算力、算法與數據,數據、算力和算法,號稱人工智能的“三駕馬車”,缺一不可。而眼下的重點在於,這場始於AI領域的全球競賽,卻先在算力上引起了一波“焦慮”。上個月,OpenAI停止ChatGPT Plus的銷售,便讓人猜測是因為需求量過大,計算資源供不應求,隨着國內大模型相繼入局,對於算力緊張的猜測也自然蔓延至國內。,《若干措施》的第一條正發力在這一領域,在組織商業算力定向滿足本市緊迫需求、高效推動新增算力基礎設施建設以及高效推動新增算力基礎設施建設三個方面提出了具體的舉措。,具體而言,《若干措施》提到,將加強與頭部公有雲廠商等市場主體合作,實施算力夥伴計劃,並確定首批夥伴計劃成員,新增算力建設項目納入算力夥伴計劃,加快推動海淀區“北京人工智能公共算力平台”,朝陽區“北京数字經濟算力中心”等項目建設,快速形成規模化先進算力供給能力,支撐千億級參數量的大型語言模型、多模態大模型、大規模精細神經網絡模擬仿真模型、腦啟發神經網絡等研發。,在算法方面,《若干措施》提到,要開展大模型創新算法及關鍵技術研究,在數據方面,則更聚焦在“高質量”這一關鍵詞。例如針對目前大模型訓練高質量中文語料佔比過少,不利於中文語境表達及產業應用的問題,《若干措施》便提到,整合現有開源中文預訓練數據集和高質量互聯網中文數據並進行合規清洗等。,高質量的數據需要“國家隊”的護航,在這一領域,《若干措施》表示,加快推動數據要素高水平開放的“國家數據基礎制度先行先試示範區”建設,爭創國家級數據訓練基地,提升北京人工智能數據標註庫規模和質量等。,“《若干措施》相當於一個非常明確的專項政策,用以統籌全市資源,更好地賦能、促進人工智能的發展,這種調集全市之力制定專門的政策規劃推動一件事的情況,在全國範圍內都是相對比較少見的。”北京社科院研究院王鵬如此評價道。,深度科技研究院院長張孝榮也認為,《若干措施》的亮點在於對人工智能產業三要素以及應用與監管方面都做了比較全面的部署和指導。“不過,在算法研究和基礎軟硬件研發方面,缺少可執行措施,有較大提升空間;在對於數據質量提升和建立統一算力調度平台方面,有些措施可以商榷,有的可以進一步完善。”張孝榮說。,立足首都帶動全國,早在ChatGPT走紅之前,人工智能便已成為世界科技競爭的焦點。2017年7月,國務院發布的《新一代人工智能發展規劃》將人工智能提升至國家戰略層面,其中提到,2030年人工智能核心產業規模要超過1萬億元,並將帶動相關產業規模超過10萬億元。,數據显示,截至2022年,我國人工智能產業規模已達到5080億元,相較於2018年的2288億元,增長了122.05%,連續五年保持穩定增長。,首都北京的科技底色更濃。5月15日的2023中關村論壇新聞發布會介紹,2022年北京研發投入經費佔比在6.5%以上,達到全國平均水平的2.7倍。在京國家實驗室高質量入軌運行,全國重點實驗室目前達到了80家,在全國排在第一位。2022年,北京平均每天新創辦的科技型企業293家,不到5分鐘就誕生一家科技型企業,獨角獸企業102家,居全球第三。,中國數實融合50人論壇智庫專家洪勇認為,北京人工智能產業發展擁有優質的科研與教育資源、濃厚的創新創業氛圍、豐富的產業生態系統以及完善的政策支持等優勢。,在他看來,《若干措施》對北京發展人工智能產業具有重要意義,它將促進創新發展,提升北京在算力資源和高質量數據方面的供給能力,推動創新技術的湧現。同時,它還將強化北京的核心競爭力,鞏固其作為人工智能產業核心城市的地位。,此外,《若干措施》也將促進產業生態發展,形成完善的人工智能產業生態系統,推動合作與交流。最重要的是,它將帶動經濟發展,成為北京經濟增長的重要引擎,促進北京在人工智能領域的引領地位。,王鵬也提到,在一系列優勢的基礎上,未來北京人工智能產業鏈布局可能會朝三個主要方向發展,首先是基礎設施;其次是與数字化、城市轉型升級等方面的融合;最後,北京的人工智能不僅是服務北京,還要立足北京,輻射京津冀,服務全中國甚至輻射全世界,這才是北京作為首都,擁有如此多的積累后,應該達到的目標。,“換句話說,北京的人工智能一定處於我國人工智能的第一梯隊,那麼北京的目標就不單單是服務中國,而是要更好地走出去。”王鵬總結稱。,離生活漸行漸近,“為搶抓大模型發展機遇,重視通用人工智能發展,充分發揮政府引導作用和創新平台催化作用……”在《若干措施》中,首句即是這樣一句話。,其中提到的“大模型”是什麼?科技部國家科技專家庫專家周迪向北京商報記者介紹,大模型是指具有數億或數十億個參數的深度神經網絡模型,這種模型經過專門的訓練過程,能夠對大規模數據進行複雜的處理和任務處理,是人工智能實現的基礎之一。,關於大模型的作用,中國民營科技實業家協會元宇宙工作委員會創辦人、秘書長吳高斌告訴北京商報記者,其作用在於通過對大量數據的分析和學習,建立出一個龐大的模型,使得機器能夠更好地理解和處理人類語言、圖像、聲音等信息。“這種技術的應用範圍非常廣泛,包括自然語言處理、計算機視覺、語音識別等領域”。,目前,“大模型”這個詞聽起來似乎離消費者還很遙遠,但事實上,它已在現實生活中展現過自己的“能力”。“大模型基於大數據,背後需要極大算力支持。”張孝榮向北京商報記者介紹,大模型是大規模預訓練模型的簡稱,其中的大規模又主要指參數量大。“比如ChatGPT模型參數高達1750億,而與之類似的模型,參數也從數百億到數千億不等。”張孝榮表示,“從ChatGPT開始,大模型對文字生成、文本理解、自動問答等任務有顯著的改善,現在正在向圖片、視頻和聲音等應用領域延伸。”,場景創新已在路上,作為“人工智能實現的基礎之一”,大模型的場景應用創新也在不斷推進。《若干措施》中提到,將推動通用人工智能技術創新場景應用,其中包括探索在政務服務、科學研究、金融、城市治理、自動駕駛和醫療等領域的示範應用。,其中,在自動駕駛領域,將支持自動駕駛企業研發多模態自動駕駛技術,發揮大型語言模型高維語義理解和泛化優勢,基於車路協同數據和車輛行駛多傳感器融合數據,提高自動駕駛模型多維感知和預測性能,有效解決複雜場景長尾問題,輔助提高車載自動駕駛模型泛化能力。同時,支持在北京市高級別自動駕駛示範區3.0建設中,構建車路協同數據庫,引導企業開展基於真實場景的自動駕駛模型訓練迭代。探索基於低時延通訊的雲控自動駕駛模型測試,發展自動駕駛新技術路徑。,在醫療領域,將支持北京有條件的研究型醫療機構提煉智能導診、輔助診斷、智能治療等場景需求,充分挖掘醫學文獻、醫學知識圖譜、醫學影像等多模態醫療數據,構建基於醫療領域通用數據與專業數據的智能應用,實現對各種疾病和癥狀的準確識別和預測,輔助醫療機構提高疾病診斷、治療和預防的決策水平。,“智能醫療和自動駕駛等技術的應用已經有好多年的探索了。”周迪指出,其普及將對普通群眾帶來重大影響。“以醫療為例,目前醫生少患者多,患者排不上隊掛不上號是常態。依託人工智能,醫療診斷、影像分析、治療方案選擇等都可以藉助人工智能的協助,大大降低人力成本,改善患者看病難的問題。”周迪說。,動態發展中求解難題,事實上,自4月11日國家互聯網信息辦公室起草《生成式人工智能服務管理辦法(徵求意見稿)》以來,包括《若干措施》在內的各類文件接連出台,充分體現國家對推進通用人工智能大模型發展的高度重視,有望加速大模型走向千家萬戶。,而在大模型“飛入尋常百姓家”的過程中,推動大模型的場景應用創新僅是一個開端。由此開端向外延伸,便可看到大模型對於普通群眾的實際效用。例如,吳高斌指出,在自動駕駛領域,一個顯而易見的效用便是提高車輛的自主駕駛能力,減少交通事故的發生。,此外,周迪介紹,在醫療領域,大模型帶來的前述各項作用僅是相對短期的效用,長期看來,大模型可能使生活中的各類服務更趨全流程的個性化。“比如要去看醫生的話,中間存在很多流程,但是大模型訓練好之後,就可以給出一整套個性化的就醫服務方案。相對而言,目前比較着眼於在各種碎片化功能上的協助作用,未來各類服務則可能達到更加整體更加個性化的程度。”周迪表示。,“全流程的個性化”不止於醫療領域。“在教育方面,大模型可以用於個性化教育,根據學生的學習情況和需求,提供個性化的學習資源和指導。”全聯併購公會信用管理委員會專家安光勇向北京商報記者表示,“它還可以用於智能輔助教育,例如智能導師或智能助教系統,提供實時的問題解答和學習建議。”,吳高斌認為,總體來說,使用大數據訓練得到的大模型對於實際應用、提高工業生產力和促進社會發展具有巨大的前景。“大模型的出現為人工智能的發展提供了新的思路和方法。它的應用將會為我們的生活帶來更多的便利和改變。”,不過,在張孝榮看來,教育、醫療、自動駕駛等領域雖然對AI有廣闊的潛在需求,但行業數據源封閉,孤島化嚴重,難以提供訓練大模型所需的大數據,“因此大模型若要滿足這些行業的AI需求,仍需要經過很長的時間去探索,逐步地解決在動態發展中遇到的各種行業難題”。,《若干措施》的第一條正發力在這一領域,在組織商業算力定向滿足本市緊迫需求、高效推動新增算力基礎設施建設以及高效推動新增算力基礎設施建設三個方面提出了具體的舉措。,由ChatGPT掀起的大模型浪潮仍在繼續。被譽“AI第一城”的北京,率先將重點落在了政策上。《北京市促進通用人工智能創新發展的若干措施(2023-2025年)(徵求意見稿)》(以下簡稱《若干措施》)5月12日起向社會公開徵求意見,5方面21條措施涵蓋了算力、數據要素、大模型技術、應用場景等諸多受到廣泛關注的領域。而在AI“新基建”領域,《若干措施》也畫出了一條涵蓋算力、算法以及數據訓練的清晰圖譜。作為“人工智能實現的基礎之一”,教育、自動駕駛和醫療等領域都是大模型的應用場景,未來大模型或將改變短期內“碎片化的協助作用”,帶來全流程的個性、精準化服務。,