編者按:本文來(lái)自微信公眾號(hào) 新硅NewGeek(ID:XinguiNewgeek),作者:劉白,編輯:張澤一,視覺(jué)設(shè)計(jì):疏睿,創(chuàng)業(yè)邦經(jīng)授權(quán)轉(zhuǎn)載。
前兩天,谷歌Gemini又雙叒叕公布了些新動(dòng)向,給自家的Bard聊天機(jī)器人更新了文生圖功能。
說(shuō)實(shí)話,硅基君是有些失望的,Gemini一向在對(duì)抗OpenAI這事上被看做“全村的希望”,可這文生圖功能去年10月就被整合進(jìn)ChatGPT了。
五個(gè)月時(shí)間過(guò)去,谷歌又慢了一大步。
不過(guò)咱們還是先試試效果如何。
相比ChatGPT要開(kāi)會(huì)員才能用上的DALLE-3,Bard可以免費(fèi)用。
白嫖當(dāng)然要第一時(shí)間趕到現(xiàn)場(chǎng),可是沒(méi)想到出師未捷直接被Bard原地拒絕了。
原因是春節(jié)加班屬于不安全或者有風(fēng)險(xiǎn)的場(chǎng)景。
不能加班,只能幫我生成一個(gè)“喜慶”或“中立”的工作環(huán)境圖片,結(jié)果就來(lái)了下面這圖:
嗯,除了喜慶,其它的關(guān)鍵詞那是八竿子打不著。
同樣的話術(shù)交給GPT4試試。
不僅生圖質(zhì)量離譜,拒絕用戶的理由還五花八門(mén)。
Bard覺(jué)得新年加班工作是不存在的,大家都應(yīng)該在享受假期…它要努力做一個(gè)尊重各種文化和傳統(tǒng)的機(jī)器人。
來(lái)源:微博
所以谷歌到底更新了個(gè)啥?
2月1日,谷歌官方博客連發(fā)兩篇文章,一篇介紹了它們最新的文生圖模型Imagen 2,不僅對(duì)生圖質(zhì)量和提示詞理解進(jìn)行了優(yōu)化,還特別加上了肖像隱私保護(hù)和低俗內(nèi)容限制。
而且針對(duì)外媒最近熱論的AI造假風(fēng)波,谷歌還特貼心的給自己的生圖模型加上了SynthID技術(shù)。
也就是在不影響人肉眼看圖的前提下,給生成的圖片加一個(gè)數(shù)字水印,用來(lái)判斷圖片來(lái)源。
另一篇介紹了Bard的兩大更新:Bard使用的模型Gemini Pro從只支持英語(yǔ)擴(kuò)展到支持40多種語(yǔ)言、Bard可以用Imagen 2生成圖片了。
多語(yǔ)言支持終于來(lái)了,語(yǔ)言門(mén)檻消除。
然而當(dāng)網(wǎng)友興沖沖跑去找Bard生圖時(shí),卻發(fā)現(xiàn)它聽(tīng)不懂中文的提示詞。
來(lái)源:小紅書(shū)
不過(guò)這里的原因還真不是敏感詞也不是歧視,是因?yàn)锽ard目前只能通過(guò)英文的提示詞生圖…
谷歌這波更新真的迷惑性很強(qiáng),因?yàn)榇蠹铱吹降闹卮蟾戮褪侵С指嗾Z(yǔ)言(包括中文)和文生圖。
但是誰(shuí)能想到Bard的聊天功能是Gemini Pro提供的,畫(huà)圖功能是Imagen 2提供的,增加多語(yǔ)言支持的只有前者,后者還是只能用英文。
多加一個(gè)提示詞自動(dòng)翻譯成英文再喂給Imagen 2很難嗎?非要用這么不順暢的體驗(yàn)來(lái)折磨用戶…
有了前車之鑒,我們直接用中文要求Bard寫(xiě)英文提示詞,然后再?gòu)?fù)制粘貼測(cè)試生圖效果。
首先是獨(dú)自吃年夜飯:李獨(dú)自坐在餐桌前,周圍擺放著本應(yīng)為家庭盛宴準(zhǔn)備的未動(dòng)過(guò)的菜肴,她看著電視上的春節(jié)聯(lián)歡晚會(huì),節(jié)日的氛圍反而更加凸顯了她的孤獨(dú)。
內(nèi)容和情緒捕捉的還算到位,把那種不甘的苦悶都刻在了臉上。
但是能看出來(lái)文字還是沒(méi)優(yōu)化過(guò)的,春聯(lián)上的字跟亂碼沒(méi)區(qū)別,而且畫(huà)風(fēng)從照片到寫(xiě)實(shí)油畫(huà)到像素風(fēng)跳躍有點(diǎn)大。
還有右上這位老人家,就算是風(fēng)吹日曬膚色也太深了…
獨(dú)自看春晚:王坐在沙發(fā)上,周圍是空啤酒罐和外賣盒子,他帶著勉強(qiáng)的笑容看著春節(jié)聯(lián)歡晚會(huì),試圖用這種方式淹沒(méi)獨(dú)自度過(guò)假期的空虛感。
提示詞里性別明明是男,Bard生成出來(lái)兩男兩女,而且明顯有一個(gè)人種已經(jīng)不同了。
開(kāi)始合理懷疑第一輪里右上的老人家,難道血統(tǒng)不同?
還有奇怪的一點(diǎn)是女性人物的臉部細(xì)節(jié)明顯處理得更好,而男性的兩只眼睛總朝著不同的方向看。
獨(dú)自辭舊迎新:陳站在陽(yáng)臺(tái)上,看著煙花點(diǎn)亮夜空,淚水在她的眼中涌動(dòng),她渴望與親人分享這一刻,而她周圍的寂靜與其他地方正在進(jìn)行的歡樂(lè)慶典形成了鮮明對(duì)比。
這次性別倒是都對(duì)了,但是等等,怎么出現(xiàn)了陳姓的黑人姐妹?
雖然有可能是中非混血,爸爸是姓陳的中國(guó)人…Bard的內(nèi)心戲是不是也太多了點(diǎn)。
現(xiàn)在大概實(shí)錘了,第一輪里右上膚色異常深的老人家應(yīng)該是非洲血統(tǒng)。
獨(dú)自許下新年愿望:曉坐在昏暗的房間里,借著燭光寫(xiě)下她的新年決心,搖曳的火焰在墻上投下跳躍的陰影,這鮮明地提醒著她孤獨(dú)的狀態(tài),但同時(shí)也為即將到來(lái)的一年提供了一線希望。
看著前三張生成完我們的內(nèi)心是放松和喜悅的,場(chǎng)景、人物、情緒、氛圍都很到位,細(xì)節(jié)也不錯(cuò)。
直到第四張畫(huà)風(fēng)明顯不同的黑妹子出現(xiàn)……不得不說(shuō)Bard在讓非洲人過(guò)上中國(guó)年這件事情上,是有點(diǎn)執(zhí)念的。
reddit網(wǎng)友同樣碰到了Bard生圖的人種問(wèn)題,只不過(guò)跟上面恰恰相反。
所以說(shuō)只要明確提到種族就是涉嫌歧視,然而在人家特定文化背景下混入其他種族就是可以的。
這網(wǎng)飛無(wú)視歷史背景和原著跨種族選角的本領(lǐng),被Bard偷師了。
不過(guò)谷歌向來(lái)在聊天機(jī)器人的言論傾向上格外謹(jǐn)慎,早早在內(nèi)部設(shè)立了“AI倫理部”,專門(mén)用來(lái)審核機(jī)器人是否會(huì)在跟人類溝通時(shí)產(chǎn)生歧視性語(yǔ)言或仇恨言論。
謹(jǐn)慎小心可以理解,畢竟機(jī)器人要是說(shuō)錯(cuò)了話,受損的是公司形象和市值。
但是謹(jǐn)慎過(guò)頭變成功能閹割了就很讓用戶惱火。
最后忍不住讓Bard畫(huà)了一下春運(yùn)火車站的場(chǎng)景,它還真抓住了“人多”這個(gè)精髓。
但是人一多作畫(huà)就完全崩壞了,所有人的臉都不能看。
不看大圖,猛一看小圖跟這幾天虹橋的盛況也蠻相似。
來(lái)源:微博
谷歌也知道自己做的不夠好,于是拼命的小步快跑。
2月3日,網(wǎng)友在推特上爆料谷歌將在2月7日正式把Bard改名為Gemini。
來(lái)源:推特
一同傳出來(lái)的更新還包括:
Gemini將推出一個(gè)高級(jí)的付費(fèi)版本Gemini Advanced
會(huì)率先推出Gemini安卓App,跟郵件、地圖、YouTube等應(yīng)用打通,提供更好的AI手機(jī)體驗(yàn)
加拿大地區(qū)的用戶終于也能用上Gemini了
推特網(wǎng)友對(duì)谷歌把安卓放在第一很激動(dòng)……然而這擺明了是谷歌給自己親兒子Pixel系列準(zhǔn)備的。
來(lái)源:推特
reddit網(wǎng)友則表示谷歌你終于開(kāi)竅了。
來(lái)源:reddit
ChatGPT雖然算不上什么好名字,但是ChatGPT作為應(yīng)用名稱,模型以GPT-X格式來(lái)命名,大家都比較好懂。
而B(niǎo)ard背后的模型已經(jīng)徹徹底底換過(guò)三次:LaMDA、PaLM 2、Gemini。
23年2月谷歌匆匆推出Bard,首秀時(shí)只被問(wèn)了一個(gè)問(wèn)題:韋伯望遠(yuǎn)鏡有什么新發(fā)現(xiàn)嗎?
NASA出面證實(shí)它答案中的最后一點(diǎn)“韋伯望遠(yuǎn)鏡拍攝到了第一張系外行星的照片”是錯(cuò)誤的。
第一張系外行星照片早在2004年就被歐洲南方天文臺(tái)的超大望遠(yuǎn)鏡捕捉到了,韋伯望遠(yuǎn)鏡2021年才發(fā)射升空。
有這種黑歷史,谷歌想把Bard改成Gemini也好理解,畢竟誰(shuí)也不想自家產(chǎn)品永世背著翻車的典故,改頭換面重新開(kāi)始得了。
Bard只是谷歌看ChatGPT殺瘋了之后快速推出的競(jìng)品,實(shí)際上谷歌著手AI要早于現(xiàn)在所有能叫的上名字來(lái)的玩家。
早在2015年谷歌就開(kāi)始自研用于加速機(jī)器學(xué)習(xí)的張量處理單元(TPU),遙遙突出這周才宣布入局自研芯片的Meta。
2017年,谷歌團(tuán)隊(duì)搗鼓出來(lái)了奠定現(xiàn)在GPT底層架構(gòu)的Transformer。
隨后幾年谷歌推出了BERT、T5-xxl、Transformer-X幾個(gè)模型,以及被自家工程師認(rèn)為擁有了自我意識(shí)的聊天機(jī)器人LaMDA。
據(jù)內(nèi)部員工透露,2013至2020年間,谷歌就研發(fā)出了類似ChatGPT的對(duì)話機(jī)器人Meena,但是公司高管多次拒絕了將產(chǎn)品公之于眾的提議。
原因是聊天機(jī)器人不符合谷歌關(guān)于安全和公平的AI原則。
所以說(shuō)底層技術(shù)不是不能打,是谷歌端著硅谷巨頭小心駛得萬(wàn)年船的謹(jǐn)慎態(tài)度,被Open AI這種沒(méi)有歷史包袱的初創(chuàng)公司給彎道超車了。
谷歌和Open AI的廝殺愈演愈烈,最近谷歌頗有后來(lái)者居上的態(tài)勢(shì)。
今年一月底,Bard(Gemini Pro)在UC伯克利的LLM榜單中一度沖到第二,結(jié)束了GPT-4系列長(zhǎng)期霸榜前三的局面。
來(lái)源:推特
但是谷歌在第二的位置還沒(méi)坐熱乎,又很快被Open AI連夜更新的新模型給頂下來(lái)了。
雖然這次Bard更新的生圖體驗(yàn)下來(lái)平平無(wú)奇甚至有點(diǎn)失望,但是谷歌在AI應(yīng)用上明顯開(kāi)始加速了。
如果推特網(wǎng)友的爆料是真的,Gemini Advanced7號(hào)上線以后,能不能順利沖回榜二呢?
參考資料:
[1] New and better ways to create images with Imagen 2
[2] Bard’s latest updates: Access Gemini Pro globally and generate images
[3] Google Bard to become ‘Gemini’ very soon with ‘Advanced’ tier and Android app
[4] Google Bungles AI Reveal With Incorrect Webb Telescope Facts
[5] 谷歌再雪前恥,新Bard逆襲GPT-4沖上LLM排行榜第二!Jeff Dean高呼我們回來(lái)了 |新智元
[6] 十年,谷歌是如何在聊天機(jī)器人競(jìng)賽中落后微軟的?|智東西
本文為專欄作者授權(quán)創(chuàng)業(yè)邦發(fā)表,版權(quán)歸原作者所有。文章系作者個(gè)人觀點(diǎn),不代表創(chuàng)業(yè)邦立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者。如有任何疑問(wèn),請(qǐng)聯(lián)系editor@cyzone.cn。