瑜伽常識 /MANUAL
谷歌硬剛OpenAI硅谷大戰(zhàn)繼續(xù)升級
谷歌硬剛OpenAI硅谷大戰(zhàn)繼續(xù)升級5月15日,谷歌舉辦了2024年I/O開發(fā)者大會,AI是全場的主題,谷歌CEO桑達(dá)爾·皮查伊和他的同事們發(fā)布了Gemini 1.5 Pro的新版本,在100萬Tokens的窗口能力上,進(jìn)一步擴大至200萬Tokens,它們的最終目標(biāo)是無限上下文。
谷歌還展示了新的搜索產(chǎn)品,比如從本周開始,谷歌搜索引擎將在美國推出“AI概覽”(AI Overviews)的功能,搜索引擎會直接歸納總結(jié)搜索結(jié)果。此外,谷歌還推出了新的TPU,第六代TPU芯片Trillium,較上一代芯片的算力表現(xiàn)翻4.7倍。
就在這場發(fā)布會前一天,OpenAI舉行了春季發(fā)布會,發(fā)布最新GPT-4o多模態(tài)大模型,相較于GPT-4 Trubo速度更快、價格也更便宜。接下來的一個月里,硅谷還將迎來兩家科技巨頭的重磅大會——5月21日左右,微軟將舉行Build年度開發(fā)者大會;6月10日左右,蘋果將舉辦全球開發(fā)者大會。一場有關(guān)AI的拼在大洋彼岸開賽。
伴隨著OpenAI的崛起,以及谷歌在AR眼鏡等失利,外界一度評價谷歌已經(jīng)成為一家為“賺錢”打造的機器,失去了創(chuàng)新。
不過,谷歌仍然擁有谷歌搜索、YouTube、云服務(wù)、Gmail、Android以及自動駕駛Waymo等業(yè)務(wù),僅YouTube就有20億月活用戶,Android也擁有20億月活用戶,可以說,谷歌掌握著全球最多的用戶場景、數(shù)據(jù)以及設(shè)備接口。
谷歌發(fā)布更新產(chǎn)品后,谷歌-C股價微漲0.6%,收盤價為171.93美元,市值2.12萬億美元,股價較2024年開年上漲了23%。
在剛剛過去的財季,谷歌展現(xiàn)出強有力的競爭力。2024年第一季度,谷歌實現(xiàn)營收805.39億美元,同比增長15%,非美國通用會計準(zhǔn)則下凈利潤為236.62億美元,同比增長57%。
大會一開場,皮查伊就介紹說,現(xiàn)在已經(jīng)有超過150萬開發(fā)者正在使用谷歌的原生多模態(tài)大模型Gemini。Gemini在2023年12月上線,它被認(rèn)為超過了GPT-4。
皮查伊宣布,Gemini 1.5 Pro向全球所有開發(fā)者開放,并支持200萬Tokens的Gemini 1.5 Pro模型的預(yù)覽,他們的目標(biāo)是“無限上下文”。
此次開發(fā)者大會,谷歌著墨最多的是搜索,這是谷歌的起家業(yè)務(wù),現(xiàn)在谷歌要重新定義搜索,它要把搜索做成多輪對話的推理,用戶只需要問就可以了。
皮查伊以“重新定義搜索”的架勢,連續(xù)上線多款基于Gemini的產(chǎn)品,比如總結(jié)谷歌搜索引擎結(jié)果的“AI概覽”功能,支持用戶存儲圖片的AI搜索Ask Photos。
以練瑜伽為例,谷歌會幫用戶找到排名更靠前的工作室,并介紹他們的服務(wù),可以看到每個門店的距離JN江南·體育。谷歌搜索會把更大的問題分解成各個部分的問題,比如排名、評論、營業(yè)時間以及其他更多的研究。
但“重新定義搜索”的最大主動權(quán)可能不在谷歌手里,而在OpenAI這邊。今年年初有傳言說,OpenAI計劃上線日OpenAI的發(fā)布會上,并沒有展現(xiàn)該業(yè)務(wù),這可能與算力成本有關(guān)系。
在此次發(fā)布會上,谷歌還展示了一個名為Astra的項目,這是谷歌開發(fā)的通用人工助理,在演示視頻中,Astra通過手機攝像頭能識別真實環(huán)境中的物體,實現(xiàn)了能看、能說、能聽。這與前一天OpenAI上線o功能類似,都實現(xiàn)了人機交互的新形式。但谷歌似乎不滿足于此,Astra更強調(diào)指向人、機器與現(xiàn)實世界的三重交互。
大模型最大的挑戰(zhàn)是解決響應(yīng)時間的問題。谷歌介紹說,它們在Gemini模型的基礎(chǔ)上,開發(fā)了通過連續(xù)編碼視頻幀,更快地處理信息的代理,同時,將視頻和語音輸入組合到事件的時間線中,捕捉并有效記憶。這些代理可以更好地理解用戶所處的環(huán)境,并在對話中快速響應(yīng),使交互的速度和質(zhì)量更加自然。
Gemini也將支持語音實時交互,同時今年晚些時候還將上線實時視頻交互功能。未來幾個月內(nèi),谷歌也將推出類似于GPTs的自定義AI助手Gems。它將能與“谷歌全家桶”進(jìn)行交互。
“Gems易于創(chuàng)建,它們可以充當(dāng)你的瑜伽閨蜜、你的私人副主廚、聰明的微積分導(dǎo)師、代碼的同行評審員?!惫雀璧南嚓P(guān)負(fù)責(zé)人說。
谷歌發(fā)布會上還宣布了安卓生態(tài)的AI新進(jìn)展,今年晚些時候,能夠在本地運行的多模態(tài)Gemini Nano模型將登陸Pixel手機,它更智能,更注重隱私保護(hù),比如,如果用戶接到電話,將會提醒用戶。
在發(fā)布會上,谷歌只提到一家科技大公司,那就是英偉達(dá)。皮查伊發(fā)布了第六代TPU(張量處理器,谷歌為機器學(xué)習(xí)定制的專用芯片)芯片Trillium,較上一代芯片的算力表現(xiàn)翻4.7倍,TPU是谷歌自己研發(fā)的GPU芯片。
同時,皮查伊說,谷歌云將在2025年初,用上英偉達(dá)的最新Blackwell架構(gòu)GPU。在過去數(shù)年,谷歌投資了200萬英里的地面和海底光纖。
今年3月,英偉達(dá)發(fā)布了基于“Blackwell”架構(gòu)的B100芯片與B200 GPU加速器,英偉達(dá)創(chuàng)始人黃仁勛說,這是迄今為止,英偉達(dá)最強大的GPU芯片,在生產(chǎn)出首批服務(wù)器之后,黃仁勛將一臺服務(wù)器送給了OpenAI。
GPU在過去一年多時間成為堪比黃金的硬通貨,各大科技公司不得不排隊數(shù)月來等貨,這讓黃仁勛成為硅谷最受歡迎的CEO,人們爭相排隊和他見面,英偉達(dá)也是所有科技公司的合作伙伴。
2022年底,OpenAI發(fā)布ChatGPT開始,整個硅谷進(jìn)入亢奮狀態(tài),這里甚至誕生了AI一條街,五六個人就可以組建一個公司,依靠一個想法獲得融資,比如斯坦福博士生郭文景和同學(xué)創(chuàng)辦的Pika,短短數(shù)月間就完成5500萬美元融資,并推出了視頻生成器Pika1.0。
微軟重新盯上了搜索,扶持Bing發(fā)展;Meta向第三方硬件制造商開放VR頭顯操作系統(tǒng)Meta Horizon OS,進(jìn)一步蠶食蘋果生態(tài);為應(yīng)對OpenAI的崛起,蘋果不得不放棄數(shù)十年的造車計劃,集中資源搞AI。
蘋果公司計劃和OpenAI合作,將OpenAI的技術(shù)引入iPhone之中,但微軟是OpenAI的最大出資方;谷歌正和OpenAI酣戰(zhàn),支持其開源系統(tǒng)Android的AI進(jìn)化,以展開和蘋果iOS系統(tǒng)之間的競爭。
席卷全球的這次科技競賽浪潮頗有點20世紀(jì)七八十年代硅谷的意味。那時,原生技術(shù)層出不窮,1968年,英特爾成立;1969年,AMD成立;1976年,喬布斯創(chuàng)辦蘋果電腦;1977年,甲骨文成立;1984年,思科公司成立。
只不過,50年前,是芯片等硬件造就了創(chuàng)業(yè)潮,創(chuàng)造了財富;現(xiàn)在,AI以及產(chǎn)品化則是最新的動力。
在AI時代,中國互聯(lián)網(wǎng)同樣也迎來了新發(fā)展機會,但正如大部分中國AI創(chuàng)業(yè)者所說,雖然一家又一家公司會在這次浪潮中轉(zhuǎn)型甚至退場,但是千萬不要低估中國創(chuàng)業(yè)者的生命力。