杏鑫總代理_硅谷押注,生成式AI火了,讓你把簡單文字變成圖像甚至視頻
10月9日消息,最近幾年興起的所謂“生成式人工智能(generative AI)”正吸引硅谷科技巨頭和風投機構的興趣,這種AI可以依據少量詞彙在幾秒鐘內生成與之相匹配的圖像。分析師預計,這種技術將被廣泛用於各行各業,併產生數萬億美元的經濟價值。,雖然這些計算機程序生成的圖像並不完美,比如手上出現多餘的手指,四肢不自然的彎曲等。同時,圖像生成器在處理文本時也會遇到問題,例如生成無意義的符號等。然而,這些圖像生成程序可能是一場科技熱潮的開始。硅穀風投機構NextView Ventures的投資人大衛・貝塞爾(David Beisel)說:“在過去的三個月里,‘生成式人工智能’這個詞已經變成了流行語。”,從2021年開始,生成式AI技術取得了巨大進步,甚至激勵許多人辭掉工作去創辦新公司,夢想着AI將來可以為新一代科技巨頭提供動力。,在過去五年左右的時間里,AI領域始終處於蓬勃發展階段,但這些進步大多與理解現有數據有關。AI模型已經變得足夠高效,可以識別人們剛剛用手機拍攝的照片中是否有一隻貓。此外,這些模型也足夠可靠,每天可以為谷歌搜索引擎提供數十億次搜索結果。不過,生成式AI模型可以生成以前沒有的全新東西。換句話說,它們是在創造,而不僅僅是在分析數據。,AI與機器學習平台Craiyon Productive AI的創建者鮑里斯・戴瑪(Boris Dayma)說:“最令人感到印象深刻的是,生成式AI也能創作新的東西。它們不僅僅是創造類似的舊有圖像,還可以創造與以前完全不同的新事物。”,硅谷知名風投公司紅杉資本(Sequoia Capital)在其網站上發文表示:“從遊戲到廣告再到法律方面,生成式AI可能會改變所有需要人類創造力發揮作用的領域。這種技術有可能產生數萬億美元的經濟價值。”更為有趣的是,紅杉資本還在帖子中指出,其上述文章部分是由GPT-3撰寫的,後者本身就是能夠生成文本的生成式AI。,生成式AI的工作原理,圖像生成使用的技術來自機器學習的一個子集,稱為深度學習。自從2012年一篇關於圖像分類的里程碑式論文重新點燃人們對這項技術的興趣以來,深度學習推動了AI領域的大部分進步。深度學習使用在大數據集上訓練的模型,直到該程序理解這些數據中的關係。然後,該模型可以用於應用程序,如識別圖片中是否有狗或翻譯文本等。,圖像生成器的工作原理就是逆轉這個過程。它們不是將英語翻譯成法語,而是將英語短語轉換成圖像。它們通常有兩個主要部分組成,一個是處理初始短語的部分,另一個是將數據轉換成圖像的部分。,第一部分生成式AI基於名為Generative Adversarial Networks(生成式對抗網絡,簡稱GAN)的方法。此前,這些GAN通常被用於生成不存在的人的照片。本質上,它們的工作方式是讓兩個AI模型相互競爭,以更好地創建符合預定目標的圖像。,而較新的方法通常使用轉換器,這是谷歌於2017年論文中首次提出的概念。這是一項新興技術,可以利用更大的數據集,儘管其培訓成本可能高達數百萬美元。,第一個獲得大量關注的圖像生成器是Dall-E,它是硅谷初創公司OpenAI於2021年推出的項目。OpenAI今年發布了功能更強大的更新版本。專註於生成式AI的開發者克里斯蒂安・坎特雷爾(Christian Cantrell)說:“有了Dall-E 2,這真的是我們跨越恐怖谷效應(Uncanny Valley)的時刻。”,另一個常用的、基於AI的圖像生成器是Craiyon,以前被稱為Dall-E Mini,它可以在網絡上買到。用戶輸入短語后,可以幾分鐘內在瀏覽器中看到其給出的繪圖。,據AI與機器學習平台Craiyon Productive AI的創建者戴瑪稱,自2021年7月推出以來,Craiyon現在每天生成約1000萬張圖片,總計生成10億張以前從未見過的圖片。在今年早些時候使用量飆升后,戴瑪開始將全部精力投入到Craiyon上。他說,他專註於使用廣告來保持用戶免費使用,因為該網站的服務器成本很高。Craiyon上有個推特賬號,專門發布最奇怪、最有創意的圖片,它擁有超過100萬名粉絲。,但最能激發人們熱情的項目是Stable Diffusion,該項目於今年8月向公眾發布。它的代碼可以在GitHub上獲得,可以在電腦上運行,也可以在雲端或通過編程接口運行。這讓用戶可以根據自己的目的調整程序代碼,或者在其基礎上構建新程序。,舉例來說,Stable Diffusion通過一個插件集成到Adobe Photoshop中,允許用戶生成背景和圖像的其他部分,然後他們可以使用圖層和其他PS工具直接在應用中操作,將生成式AI從生成成品圖像的技術變成了專業人士可以使用的工具。,該插件的開發者坎特雷爾在Adobe工作了20年,今年辭職專註於生成式AI。這位資深人士表示,該插件已被下載數萬次。藝術家們告訴他,他們把它用在了無數他意想不到的地方,比如製作哥斯拉的動畫,或者以藝術家可以想象的任何姿勢創作蜘蛛俠的圖像。,使用生成式AI的一種新興藝術是如何構建“提示”,即生成圖像的短語。名為Lexica的搜索引擎可以將Stable Diffusion的圖像和可用於生成它們的確切單詞字符串聯起來。Reddit和Discord等平台上,都有如何引導人們輸入想要生成圖像的短語技巧。,創企、雲服務提供商和芯片製造商或受益最大,許多投資者將生成式AI視為一種潛在的變革性平台,就像智能手機或互聯網的早期一樣。這種轉變極大地擴大了可能能夠使用這項技術的潛在市場規模。,坎特雷爾認為,生成式AI類似於一種更基礎的技術,即數據庫。他說:“生成式AI有點兒像數據庫,數據庫幫助解鎖了應用程序的巨大潛力。我們生活中使用過的幾乎每款應用都是建立在數據庫之上的,但沒有人關心數據庫是如何工作的,他們只知道如何使用它。”,Compound VC管理合伙人邁克爾・鄧普西(Michael Dempsey)表示,以前僅限於實驗室的技術進入主流的時刻“非常罕見”,吸引了風險投資者的大量關注,他們喜歡在潛力巨大的領域下注。但他警告說,生成式AI目前處於更接近炒作周期頂峰的“好奇心階段”。處於這個階段的公司可能會倒閉,因為它們沒有專註於企業或消費者願意付費的特定用途。,該領域的其他人認為,今天開創這些技術的初創公司最終可能會挑戰目前主導AI領域的軟件巨頭,包括谷歌、Facebook母公司Meta以及微軟,併為下一代科技巨頭的崛起鋪平道路。,Hugging Face首席執行官克萊門特・德蘭格(Clement Delangue)說:“將會有一大批價值萬億美元的新公司誕生,這些初創公司將以這種新的技術為基礎。”Hugging Face是個與GitHub類似的開發者平台,託管着預先培訓的AI模型,包括Craiyon和Stable Diffusio。它的目標是讓程序員更容易構建AI技術。,有些公司已經獲得了大量投資。Huging Face在今年早些時候從Lux Capital和紅杉資本等投資者那裡籌集了資金后,估值達到20億美元。該領域最著名的初創公司OpenAI已經從微軟和Khosla Ventures獲得了超過10億美元的資金。與此同時,Stable Diffusion開發商Stability AI正在洽談以高達10億美元的估值籌集風險資金。,亞馬遜、微軟和谷歌等雲服務提供商也可能受益,因為生成式AI可能是計算密集型技術。Meta和谷歌已經聘請了該領域諸多傑出人才,希望將這種先進技術整合到公司的產品中。今年9月,Meta宣布了名為“Make-A-Video”的AI計劃,通過生成視頻而不僅僅是圖像,使這項技術更上一層樓。,Meta首席執行官馬克・扎克伯格(Mark Zuckerberg)在他的Facebook頁面上發帖稱:“這是一個令人驚嘆的進步。生成視頻比生成照片難得多,因為除了正確生成每個像素之外,系統還必須預測它們會隨着時間的推移發生怎樣的變化。”最近,谷歌也發布了名為Phenaki的程序代碼,可以將文本轉換為時長几分鐘的視頻。,這股熱潮也可能給英偉達、AMD和英特爾等芯片製造商帶來提振,他們的圖形處理器是訓練和部署AI模型的理想選擇。在上周的會議上,英偉達首席執行官黃仁勛強調,生成式AI是該公司最新芯片的關鍵用途,並稱這類技術可能很快就會給通信領域帶來革命性的變化。,不過,生成式AI為終端用戶帶來的好處依然有限。如今許多令人興奮的事情都圍繞着免費或低成本的實驗進行。例如,有些作者已經嘗試使用圖像生成器為文章製作插圖。英偉達正嘗試使用模型來生成新的人、動物、車輛或傢具的3D圖像,這些圖像可以填充到虛擬遊戲世界中。,倫理問題難應對,最終,每個開發生成式AI的人都將不得不努力解決圖像生成器帶來的倫理問題。,首先是就業問題。儘管許多程序需要強大的圖形處理器,但計算機生成的內容仍然比專業插畫家的時間成本便宜得多,後者每小時的報酬可能高達數百美元。生成式AI可能會給藝術家、視頻製作人和其他以創作作品為生的人帶來大麻煩。Compound VC管理合伙人邁克爾・鄧普西說:“事實證明,機器學習模型可能會變得比人類工作得更好、更快、更便宜。”,圍繞原創性和所有權,生成式AI也會帶來更複雜的挑戰。這種AI模型是利用大量現有圖像進行培訓的,原始圖像的創建者是否對以原創風格生成的圖像擁有版權仍在爭論中。一位藝術家最近在美國科羅拉多州的藝術比賽中獲勝,他使用的圖像主要是由名為MidJourney的生成式AI創作的。他在獲勝後接受採訪時表示,他從自己生成的數百張圖像中選擇了一張,然後在PS中對其進行了調整和處理。,由Stable Diffusion生成的一些圖像似乎留有水印,這表明原始數據集的一部分受到版權保護。有些提示指南建議用戶使用特定的、在世藝術家的名字,以便在模仿該藝術家創作風格的過程中獲得更好的結果。上個月,Getty Images禁止用戶將生成式AI圖像上傳到其庫存圖像數據庫中,因為其擔心引發侵權糾紛。,圖像生成器還可以用來創建商標人物或目標的新圖像,如小黃人、漫威角色或《權力的遊戲》中的王座。隨着圖像生成軟件變得越來越好,它也有可能欺騙用戶,讓他們相信虛假信息,或者显示從未發生過的事件的圖像或視頻。,開發者還必須努力應對這樣一種可能,即基於大量數據訓練的AI模型可能會在數據中包含與性別、種族或文化相關的偏見,這可能會導致模型在輸出中展示這種偏見。Huging Face已經發布了有關倫理問題的材料,並就以負責任態度開發AI模型的問題進行了討論。,Hugging Face首席執行官克萊門特・德蘭格說:“我們在這些模型上看到了短期和當前挑戰,因為它們屬於概率模型,在大數據集上訓練,往往會吸收很多偏見。”他舉例稱,生成式AI曾被要求繪製“軟件工程師”的畫像,結果其生成了白人男性的圖像。,在過去五年左右的時間里,AI領域始終處於蓬勃發展階段,但這些進步大多與理解現有數據有關。AI模型已經變得足夠高效,可以識別人們剛剛用手機拍攝的照片中是否有一隻貓。此外,這些模型也足夠可靠,每天可以為谷歌搜索引擎提供數十億次搜索結果。不過,生成式AI模型可以生成以前沒有的全新東西。換句話說,它們是在創造,而不僅僅是在分析數據。,10月9日消息,最近幾年興起的所謂“生成式人工智能(generative AI)”正吸引硅谷科技巨頭和風投機構的興趣,這種AI可以依據少量詞彙在幾秒鐘內生成與之相匹配的圖像。分析師預計,這種技術將被廣泛用於各行各業,併產生數萬億美元的經濟價值。,