訂閱
糾錯(cuò)
加入自媒體

上萬(wàn)照片秒搜?百度網(wǎng)盤(pán)搞了個(gè)AI高級(jí)圖搜功能

壓箱底的照片都給你搜出來(lái),何嘗不是一個(gè)“噩耗”。

國(guó)內(nèi)大模型,從年初開(kāi)始卷現(xiàn)在,都開(kāi)始追求賦能應(yīng)用了。百度李彥宏在公開(kāi)場(chǎng)合不止一次提到,要把百度的產(chǎn)品用AI“從頭到尾重做一遍”。

但誰(shuí)能想到,百度系率先把AI玩出花來(lái)的竟然是百度網(wǎng)盤(pán)。

上萬(wàn)照片秒搜?百度網(wǎng)盤(pán)搞了個(gè)AI高級(jí)圖搜功能

就在最近,為了讓你更容易找到你想要的照片、視頻,百度網(wǎng)盤(pán)費(fèi)盡心機(jī)上線(xiàn)了一個(gè)名叫“高級(jí)圖片搜索”的功能,官方號(hào)稱(chēng)上萬(wàn)照片能夠秒搜索,秒響應(yīng)。各路網(wǎng)友紛紛表示好奇。

“高級(jí)圖片搜索”,能有多高級(jí)?

百度網(wǎng)盤(pán)其實(shí)一直都有圖片搜索的功能,但是和一眾搜圖功能一樣,一旦你關(guān)鍵詞輸?shù)牟粚?duì),網(wǎng)盤(pán)就開(kāi)始“犯傻”,提示沒(méi)找到結(jié)果。

現(xiàn)在推出的這套“高級(jí)圖搜”功能,據(jù)說(shuō)是在原有搜圖功能上基于AI延伸而來(lái)的。

官方介紹,百度網(wǎng)盤(pán)現(xiàn)在能夠通過(guò)基于向量的語(yǔ)義搜索,理解涵蓋時(shí)間、地點(diǎn)、人物、事件等多個(gè)要素的組合搜索語(yǔ)句,從而提供更準(zhǔn)確、更全面的搜索結(jié)果。這項(xiàng)功能能夠幫助用戶(hù)快速找到上萬(wàn)張照片和視頻。


目前大部分用戶(hù)都可以體驗(yàn)這個(gè)功能。先在網(wǎng)盤(pán)搜索“高級(jí)圖片搜索”,點(diǎn)擊結(jié)果進(jìn)入介紹頁(yè)面,在最底部點(diǎn)擊“立即體驗(yàn)”并坐等數(shù)據(jù)升級(jí)完成,即可體驗(yàn)新功能了。

其實(shí)不光是圖片,這個(gè)功能也可以搜索視頻。輸入的詞匯可以是單個(gè)詞,也可以是一句話(huà)。而且隨著描述的細(xì)節(jié)越多,搜索結(jié)果也可以實(shí)時(shí)調(diào)整。

這個(gè)功能,可能百度的產(chǎn)品團(tuán)隊(duì)預(yù)想的是讓人們來(lái)搜索一些值得懷念的照片。但實(shí)際上,熱衷于“挖墳”的當(dāng)代人全都在用它找“表情包”。更有的,是找朋友、同事的“黑歷史”。

一個(gè)正經(jīng)功能,再次被多才多藝的人類(lèi)玩壞了。所以說(shuō),AI不學(xué)壞是沒(méi)辦法打敗人類(lèi)的。

AI圖搜背后的大模型

據(jù)了解,此次上線(xiàn)的高級(jí)圖搜功能的背后,是百度的文心大模型。目前大多數(shù)圖片搜索依賴(lài)的都是“標(biāo)簽功能”,但實(shí)際上“標(biāo)簽”沒(méi)辦法將文字和圖片精準(zhǔn)得聯(lián)系起來(lái),所以在搜索時(shí)經(jīng)常遇到“搜了個(gè)寂寞”。

為了解決這一問(wèn)題,百度網(wǎng)盤(pán)的團(tuán)隊(duì)選用了百度文心的多模態(tài)大模型VIMER-ViLP,并用海量圖片和文本數(shù)據(jù)對(duì)它進(jìn)行了訓(xùn)練,來(lái)實(shí)現(xiàn)“基于向量的語(yǔ)義搜索”。

而所謂的“基于向量的語(yǔ)義搜索”,指的是網(wǎng)盤(pán)中的所有照片會(huì)被編碼為一組特征向量。在搜索時(shí),你輸入的文本信息也會(huì)被轉(zhuǎn)換為一組特征向量。

而圖片向量和文本向量之間的距離越近,圖片和文本的相似度就越高,該圖片就越可能是你想找的那張。

上萬(wàn)照片秒搜?百度網(wǎng)盤(pán)搞了個(gè)AI高級(jí)圖搜功能

在這種機(jī)制下,你不用絞盡腦汁去想什么“標(biāo)簽”。想輸什么就輸什么,反正也會(huì)被轉(zhuǎn)化成文本向量。這樣一來(lái),才會(huì)有更準(zhǔn)確的搜索結(jié)果。

但是“標(biāo)簽”也不是毫無(wú)用處。面對(duì)時(shí)間和地點(diǎn)這種信息,大模型也無(wú)法理解,還需要“標(biāo)簽”來(lái)補(bǔ)充。開(kāi)發(fā)團(tuán)隊(duì)利用AI,將文本信息和照片的數(shù)據(jù)信息進(jìn)行對(duì)比,結(jié)合上面的向量分析形成組合搜索,才讓這個(gè)功能真正實(shí)現(xiàn)。

光搜得準(zhǔn)沒(méi)用,還得搜得快。為了提高搜索速度,百度網(wǎng)盤(pán)還采用了異構(gòu)算力調(diào)度系統(tǒng),充分利用云上算力,降低了本地索引占用空間的同時(shí),提供了更精確的查找能力。

上萬(wàn)照片秒搜?百度網(wǎng)盤(pán)搞了個(gè)AI高級(jí)圖搜功能

此外,百度網(wǎng)盤(pán)還支持OCR識(shí)圖和以圖搜圖功能,能夠自動(dòng)關(guān)聯(lián)百度百科信息和全網(wǎng)信息。

百度網(wǎng)盤(pán)身上的AI“大雜燴”

其實(shí)這個(gè)“高級(jí)圖搜”功能,不是度盤(pán)上線(xiàn)的第一個(gè)AI功能了。

5月份,在萬(wàn)象百度移動(dòng)生態(tài)大會(huì)上,百度網(wǎng)盤(pán)宣布推出基于文心大模型的“云一朵”智能助理。然后5月27日,百度網(wǎng)盤(pán)宣布“云一朵”智能助理開(kāi)啟內(nèi)測(cè)。

據(jù)百度的介紹,“云一朵”可通過(guò)自然對(duì)話(huà)幫助用戶(hù)在海量信息中快速查找信息。只要有了“云一朵”,找圖、摘要、翻譯等能力,都是一句話(huà)的事兒。

上萬(wàn)照片秒搜?百度網(wǎng)盤(pán)搞了個(gè)AI高級(jí)圖搜功能

可以看出來(lái),百度推出文心大模型之后,真的打算把所有產(chǎn)品用大模型重新“改造”一遍。而百度網(wǎng)盤(pán)作為百度用戶(hù)最多的產(chǎn)品之一,自然是改造的第一梯隊(duì)。

但是人們可能更關(guān)心的是,這樣一來(lái)自己存在網(wǎng)盤(pán)里的那些“秘密”不是更容易被發(fā)現(xiàn)了嗎?還有,你這些功能這么厲害,是不是代表網(wǎng)盤(pán)會(huì)員要漲價(jià)?!

不愧是你啊,百度!

聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點(diǎn)?帽菊靖寮瑒(wù)經(jīng)書(shū)面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制、翻譯及建立鏡像,違者將依法追究法律責(zé)任。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)