本地視角記錄硅谷,全球視野關注創(chuàng)新
別忘了把 “硅星人”加上星標
(資料圖)
2023
新技術追蹤
BUSINESS
新的變革已經到來
文| 油醋 VickyXiao 編輯| VickyXiao
??面對ChatGPT的來勢洶洶,谷歌徹底慌了。
OpenAI發(fā)布ChatGPT也不過是4個月之前。但是在這4個月里,已經有不少預言,稱ChatGPT帶來的變革,將會顛覆谷歌的現有搜索產品和商業(yè)模式。
于是,谷歌CEO桑達爾·皮柴(Sundar Pichai) 開啟“戰(zhàn)備”狀態(tài):先是在ChatGPT問世兩周內就拉起了“紅色警報”,然后創(chuàng)始人拉里·佩奇和謝爾蓋·布林時隔3年再度被緊急喚回。
今天皮柴更是在官網上稱,谷歌一直在研發(fā)一款名為Bard的實驗性對話AI服務,今天起,谷歌將把它對信任的開發(fā)者開放,然后將在接下來的幾周內,把它向更廣泛的受眾開放。
谷歌終于加入了這場智能聊天機器人對搜索引擎發(fā)動的大戰(zhàn)。
01 谷歌宣戰(zhàn)
谷歌的第23號員工,Gmail的締造者保羅·布赫海特在2月1號發(fā)推悲觀表示,谷歌將會在一兩年內被徹底顛覆——當人們的搜索需求能夠被封裝好的、語義清晰的答案滿足,搜索廣告將會沒有生存余地。而占據全球接近84%搜索市場的谷歌,到現在仍然是一家50%營收直接來自搜索廣告的公司。
圖源:推特
眼看ChatGPT引起的戰(zhàn)火燒到了自家主場,谷歌終于反應過來,在今天宣布推出類ChatGPT產品——一款實驗性的對話AI服務Bard。
皮柴在今天發(fā)出的博文里稱,谷歌一直希望通過大語言模型,把這些深度研究和突破變成產品來幫助人們。兩年前,谷歌推出了大語言模型LaMDA,此后,谷歌就在LaMDA的基礎上,開發(fā)出了Bard。
今天,谷歌將先對信任的開發(fā)者開放這項服務,然后將在接下來的幾周內,把它向更廣泛的受眾開放。
谷歌強調,巴德會把世界上的信息知識和谷歌的大語言模型所帶來的能力和智能相結合,它會獲取網絡上的信息,來提供新鮮的、高質量的回復。這意味著和ChatGPT受限于2021年以前的數據不同,巴德會是基于實時網絡數據的,谷歌將把它與LaMDA的輕量級模型版本一起發(fā)布。
從博文里的圖片來看,Bard也是和ChatGPT類似的聊天框形態(tài),能做的事除了簡化復雜的主題,比如”向9歲的孩子解釋NASA的韋伯望遠鏡帶來的新發(fā)現“,還能幫助人們做一些復雜的任務,包括”計劃朋友的新生兒派對“、”比較兩部奧斯卡提名的電影“和”根據冰箱里的食物給出一些午餐點子”等。
圖源:谷歌
在谷歌看來,這個小得多的模型需要更少的算力,從而可以擴展到更多的用戶,獲得更多的反饋。他們會將外部反饋與自己的內部測試相結合,以確保 Bard 的回答在質量、安全性和真實信息的基礎性方面達到高標準。谷歌希望通過這一階段的測試,來提高 Bard 的質量和速度。
皮柴還在博文里稱,很快,谷歌還將很快在搜索中整合基于AI的功能。除了像ChatGPT一樣會將復雜的信息和多個視角提煉成易于理解的回答,谷歌還將進一步提供更多網頁信息的選擇。
不過,根據硅星人獲得的消息,Bard大部分由華人團隊開發(fā),而且這次Bard的發(fā)布有點趕,在內部算不上完全準備好,所以才在現在以面向有限開發(fā)者的形式推出,而非像ChatGPT一樣,一開始便開放給大眾使用。
同時,谷歌內部對ChatGPT感到恐懼的另外一層原因,是人才的流失。和很多公司一樣,谷歌內部也采用賽馬制,有好幾個做類似模型的團隊,但內部其它大語言模型團隊向OpenAI流失人才的情況比較嚴重。
當然,不管內里如何焦慮,皮柴至少在博文里信心滿滿地宣布,下個月,谷歌將開始讓個人開發(fā)者、創(chuàng)作者和企業(yè)嘗試自家的生成語言 API (Generative Language API),該 API 最初會由 LaMDA 提供支持,并有一系列模型可供選擇?!半S著時間的推移,我們打算創(chuàng)建一套工具和 API,讓其他人可以輕松地使用 AI 構建更具創(chuàng)新性的應用程序。”
與此同時,ChatGPT開發(fā)者OpenAI背后的金主微軟,也在緊鑼密鼓地想要把ChatGPT整合進自己產品中。
微軟正在與OpenAI洽談一筆100億美元的投資,并在年初傳出計劃將ChatGPT添加到自己的搜索引擎Bing中,搜索結果將首次顯示為帶有信息來源的完整句子,這個新的版本會在3月左右發(fā)布。
而就在皮柴的博文發(fā)出不久,微軟就宣布,將在明天召開一場發(fā)布會,主要就是關于微軟和OpenAI的合作,以及ChatGPT和微軟Bing搜索的整合。
與此前的危機都不同的是,這是谷歌的搜索根基在20多年后第一次受到挑戰(zhàn)。幾年以后“Google it.”會不會讓位給“ChatGPT it.”?這是讓人興奮的地方。Bing和百度們想追上谷歌,谷歌不想變成雅虎。
谷歌的搜索霸權會在今年被動搖嗎?
02 停滯的搜索
讓我們的目光先回到谷歌誕生之初。
拉里·佩奇和謝爾蓋·布林在千禧年前夕嗅到了互聯網繁榮在即與信息檢索陳舊邏輯之間的間隙,貫穿谷歌生命的算法Page Rank由此誕生。
20世紀90年代,互聯網僅僅是一個為全球2%的人受用的先鋒概念。網絡資源匱乏,雅虎甚至以手工錄入的方式就足夠建立起最初的互聯網搜索概念。1995年Alta Vista出現,互聯網歷史上有了第一個全網頁內容的索引工具,后者第一次設計出爬蟲技術(web crawl),并在1995年8月完整完成了第一次網絡爬取。
圖源:源于網絡
但以Alta Vista為首的搜索工具對搜索關鍵詞與索引結果之間的關聯分析仍然十分薄弱,這很大程度源于搜索工具最初的受用人群。在互聯網普及之前,信息搜索只是服務于文獻查找的工具,其框架長久建立在學術圈以關鍵詞加權平均為信息搜索基礎的邏輯上。
極度理性且表達精確的學術內容搜索邏輯并不適用于互聯網的信息抓取。反映在Alta Vista上,就是它能搜索到大量信息,但準確性卻非常低。
只有拉里·佩奇注意到了互聯網信息之間關聯性的利用潛力。
他將互聯網想象成一個多節(jié)點的矩陣,每一個網頁都是“點”,網頁之間的超鏈接關系則是“邊”。指向一個網頁的超鏈接越多,則這個網頁被判斷為越重要,這個過程中每個網頁都可以找到統(tǒng)一標尺下的重要性參數。
圖源:推特
這個這是日后知識圖譜技術甚至圖計算的最初想象,也是算法作為一種思維第一次進入搜索領域。
受制于互聯網的發(fā)展階段,雅虎和Alta Vista是不可能產生算法思維的,而Page Rank對Alta Vista的取代則成為“搜索”歷史上最閃耀的時刻。
但至今關于“搜索”的所有變革,也在24年前Page Rank誕生那一刻就宣告結束了。
無論是2001年出現的百度,2009年出現的Bing(當然也包括使用Bing核心搜索技術的雅虎),都再也沒有逃出以Page Rank所建立起的邏輯框架,即把用戶的開放性問題轉換成互聯網信息圖譜上具有關聯性優(yōu)先級的、一個更具體的選項擴列,再還給用戶去甄別。
2021年新興的搜索引擎You.com,最大的賣點僅僅是集成式的把推特等其他平臺的搜索結果分門類得納入到了信息搜索結果中,并且賦予用戶對于信息來源平臺一定的權重設計能力。
在搜索的發(fā)展停滯中,這樣一個“谷歌的挑戰(zhàn)者”就足夠獲得2000萬美元的種子輪融資。
中文互聯網世界里沒有另一個綜合搜索引擎獲得長期繁榮,反倒是在移動互聯網信息孤島的壓迫下,微信和字節(jié)跳動提供的更垂直的搜索服務開始占領百度的內容盲區(qū)。
類似You.com的搜索引擎短期內仍然不會在國內出現,這是百度遺憾的地方。而無論抖音搜索或是微信搜一搜,也都沒有從搜索技術效率上取代百度的野心。一個自有生態(tài)內的內容連接器角色已是這類垂直搜索服務的上限,這本質上是新的互聯網巨頭們適應各自商業(yè)邏輯所做的模式創(chuàng)新,而非技術創(chuàng)新。
所以抖音搜索們對抖音重要,對“搜索”卻不重要。
2002年加入谷歌并主導設計了后者日中韓文搜索算法的吳軍在2012年出版的《浪潮之巔》中這樣描述Page Rank:
“雖然今天Google和其他搜索引擎相比當初的Google已有了長足的進步,但是這種進步基本上屬于量變。搜索引擎領域迄今為止的質變只有Page Rank取代Alta Vista那一次。”
這個判斷到現在仍不過時,直到ChatGPT帶著生成式搜索的面目出現。
03 未必顛覆一切
ChatGPT可以寫代碼、需求文檔甚至初步實現所有辦公軟件的AI化,但大部分人用不著這些——就像大部分搜索引擎的用戶只是簡單的提問,然后要一個答案。
于是撇開這些,ChatGPT與谷歌(或者百度)相比最大的優(yōu)勢,是它可以——幾乎是畢其功于一役的——生成一個極高質量的首條信息結果。
康乃爾大學的研究人員曾經通過眼部追蹤實驗獲得了精確的谷歌搜索結果的用戶行為分析。分析結果顯示,首條結果獲得了 56.38% 的搜索流量,第二條和第三條結果的排名依次降低,但遠低于排名第一的結果。
圖源:Search Engine Journal
這十分考驗ChatGPT生成內容的準確性,而這個大型語言模型背后是一個信息來源與即時性的黑盒。
由于ChatGPT的回答中并不展示信息來源,用戶目前無法從回答中分辨信息真?zhèn)巍?/p>
在即時性上,ChatGPT無論是以頻繁增加標注數據并一次次重新對模型進行預訓練的方式,還是用Fine-Ture的思路來修改現成的訓練結果,都會遇到新的問題。前者是極大的算力成本,后者是新知識對原有知識的過度覆蓋隱患。
ChatGPT是搜索領域苦等的一次效率革命,被認為是一種“導彈”對“弓箭”的降維打擊。但如果說Page Rank是算法邏輯第一次進入搜索領域,ChatGPT也并沒有背離這個技術原點。
ChatGPT的成功基于一場以1萬個英偉達V100 GPU支撐、用深度學習和人工智能對人類信息歷史反復咀嚼的苦功。從這個角度上看,它仍然是漸進式的,并非一個完全的顛覆者。
而哪怕谷歌本身,也并不意外ChatGPT在技術層面所實現的東西,
去年開發(fā)者大會 I/O 上,谷歌展示了大語言模型LaMDA如何以冥王星作為對話主體來與人進行交流,這種回答是即時生成的,并不是學習了大量預定義的結果。大語言模型LaMDA和多模態(tài)多任務模型MUM所表現出來的素質,意味著谷歌已經具備與ChatGPT相近的AI能力。
而讓皮柴感到緊張的是,ChatGPT在上線五天就成功吸引了超過100萬的用戶,這個數字在兩個月后漲到1億。
OpenAI做了第一個吃螃蟹的人,而大眾接受了它。
而一家市值超過1.4萬億美元的大公司注定比小型創(chuàng)業(yè)公司更保守。
谷歌人工智能負責人杰夫·迪恩在幾個月前對員工表示,倘若通過(ChatGPT)這樣的服務提供錯誤信息,會給谷歌帶來更大的“聲譽風險”。
谷歌的一位高級工程師曾在去年公開表示大語言模型LaMDA“有意識,有靈魂”,隨即被勒令停職。他在被停職的前一天把一些包含谷歌及其技術涉嫌宗教歧視的證據交到了一名美國參議員的辦公室。
種種困擾,讓谷歌即使有了大語言模型LaMDA,也無法輕易拋出一個可能會亂說話,又容易動搖自己商業(yè)化根基的聊天機器人。
但Open AI可以冒這樣的風險。
這看起來就像曾經拉里·佩奇和謝爾蓋·布林在對雅虎所做的事?,F在時隔多年再次因為搜索業(yè)務現身谷歌硅谷辦公室所需要面對的,是一個神奇,卻仍然算力成本困擾籠罩,生成內容充滿漏洞的ChatGPT,兩人或許在Open AI的莽撞中看到了曾經的自己。
1997年,拉里·佩奇和謝爾蓋·布林在買下google.com域名后,提著窮的叮當響的西裝口袋為谷歌找了一年的投資,最后終于在1998年遇到了斯坦福校友、太陽公司創(chuàng)始人安迪·貝托謝姆的一張10萬美元的支票。
今時已不同往日,根據CB Insights提供的市場情報,與生成式AI概念相關的初創(chuàng)公司已經達到250家以上,其中有接近7成已經拿到至少天使輪的融資,其中11%的公司已經走到B輪以上。在這眾多初創(chuàng)公司中,價值最高的就是OpenAI。
那張陳年的10萬美元支票打開了一扇互聯網搜索引擎的門,而人們現在對于ChatGPT的信心和期望,也幾乎是從那個成功的谷歌延續(xù)而來。
谷歌也在近日拿出了3億美元提前布局與OpenAI的攻守戰(zhàn)。這筆投資給到了Anthropic——一家以前OpenAI核心員工為骨干,同樣做生成式AI,并且此前估值已高達50億美元的人工智能公司——換取了后者10%的股份,以及一個獨家云提供商的身份。
此外,谷歌選擇對內部的類ChatGPT項目Bard壓下重注。
與ChatGPT不同的是,Bard在描述中可以涉及當下的時事,這意味著其可以解決ChatGPT所欠缺的信息即時性問題。
百度的“ChatGPT計劃”也將以生成式搜索的形式出現。目前在內部“高度機密”,甚至不可以被公開討論,最終這項會融入目前的百度搜索引擎中。
李彥宏在去年年底的一次內部講話中表示,AIGC和ChatGPT這些新的技術進展會變成什么樣的AI產品,
仍然有很多不確定性,但這件事“百度必須做”。對于這個即將在下個月面世的項目,李彥宏給出的定位是“引領搜索體驗的代際變革”。
現在無論主動還是被動的,蝴蝶效應已起。
“搜索”這片已經平靜20多年的湖面,一顆石子久違地拋下了。
*參考資料:
《浪潮之巔》,吳軍
《百度將推出類似ChatGPT服務》,財經網
注:封面圖來自于Pexels,版權屬于原作者。如果不同意使用,請盡快聯系我們,我們會立即刪除。
2)分享到你的朋友圈和微信群
3)趕快關注硅星人吧!
關注硅星人,帶你用本地視角看硅谷,全球視野看創(chuàng)新
關鍵詞: 搜索引擎