杭州網(wǎng)站設計:搜狗搜索事業(yè)部總經(jīng)理:從識圖搜索談未來大勢
分享 2011.08.30 瀏覽次數(shù):6936次
搜狗搜索事業(yè)部總經(jīng)理:從識圖搜索談未來大勢
經(jīng)過近半年的獨立研發(fā),搜狗搜索推出了識圖搜索功能,即可通過上傳圖片等方式搜索找到相似群組圖片和資料。日前,就這一新功能以及搜索領域熱點話題,CSDN記者專訪了搜狗公司搜索事業(yè)部總經(jīng)理茹立云。
搜狗公司搜索事業(yè)部總經(jīng)理茹立云
關鍵詞:杭州網(wǎng)站建設
深度調研和數(shù)據(jù)挖掘用戶需求
CSDN記者:請談談搜狗做識圖搜索功能的初衷是什么?
搜狗公司搜索事業(yè)部總經(jīng)理茹立云:主要基于用戶需求的轉變,包括兩個層面。第一個層面是整個互聯(lián)網(wǎng)技術都在提升,用戶背后的需求一直得不到滿足,以前大家搜索主要靠文字,隨著時代的進步,媒介使用設備的更新,用戶對基于圖片、音頻、視頻等跨媒體搜索需求越來越大。比如說,在搜狗的搜索引擎里面,過去搜一張圖片是誰,會有1000萬以上的結果。到現(xiàn)在,更多用戶不再滿足于僅僅看到圖片,而想了解圖片背后的故事是什么。第二,隨著新興媒體的誕生,像微博,對識圖搜索的需求越來越大,用戶想知道要加的這個人是不是真實的那個人,包括北京下暴雨網(wǎng)上出現(xiàn)了大量通過PS出來的虛假圖片,還有動車事故也有很多虛假的圖片,廣大網(wǎng)友難辨真?zhèn)?,所以要增加辨別能力,識圖技術就可以辨別事情的真?zhèn)?。此外,我們也考慮到了搜狗的優(yōu)勢,識圖能夠更加便捷,搜狗通過跟瀏覽器結合,用戶使用識圖越來越方便。
記者:當時開發(fā)識圖搜索功能的時候搜狗團隊內(nèi)部有沒有一些分歧?
茹立云:初期做了比較多的調研,最主要的調研包括三個方面:1.首先是用戶的潛在需求到底會有多大,這個我們對相關數(shù)據(jù)做了挖掘和分析;2.另外就是調研了識圖或者圖片相關技術,要支撐這么一個識圖的產(chǎn)品在技術層面是不是成熟;3.同時現(xiàn)在用戶使用的話是不是便捷,如何能夠給用戶提供更好的體驗。通過調研,搜狗發(fā)現(xiàn),一旦發(fā)現(xiàn)用戶背后的需求非常巨大,做這么一個產(chǎn)品自然而然成為大家的共識。一開始討論比較多的是用什么樣的技術方案研發(fā)出來,并且能夠很好的做好。但是對于這個功能,我們內(nèi)部是一直看好的。
記者:與Google推出的識圖搜索功能相比如何?
茹立云:搜狗的識圖搜索跟Google比較有幾個比較重大的創(chuàng)新,我們發(fā)現(xiàn)用戶在之前的識圖需求里面,除了想找到跟這張圖片及文化一樣的圖片之外,很多同組的圖片可能也是他感興趣的,比如說搜一張搞笑的圖片,能不能把其他的搞笑的圖片搜在一起。搜狗已經(jīng)不僅僅是基于圖像的內(nèi)容,同時把它文字上的含義,或者說它的語意結合在一起,找到同組合的圖片,這是一個創(chuàng)新。第二塊兒就是發(fā)現(xiàn)用戶在使用識圖的時候,如果單純用一種網(wǎng)絡服務的形式的話,使用環(huán)節(jié)會非常不便利,但是如果把它和瀏覽器很好的緊密結合在一起,使用識圖的過程就變得特別簡單了,隨時隨地都可以識圖,不用像之前要記住這個網(wǎng)址,拷下來輸進去。
關鍵詞:杭州網(wǎng)站制作
技術門檻較高 在微博領域可發(fā)揮大作用
記者:采訪之前,我也找業(yè)界的人咨詢了識圖搜索技術,據(jù)說難度非常大。能否用通俗的語言解釋一下技術上的實現(xiàn)方式?
茹立云:搜狗識圖主要包括以下幾個技術:
首先,圖像有效特征的抽取。有一句話叫做“一圖勝千言”,圖片包含了大量的語意,是用各種各樣的顏色、紋理特征表現(xiàn),怎樣能夠找到一種有效地特征來描述,對圖像壓縮、變形、光照的變化都不會受它的影響,這些特征不是搜狗定的,這是里面比較困難的點,就是圖像有效特征的抽取。
其次,要抽取這個特征的話怎么把它理想化,一旦理想化之后才可能成為一種索引,否則就沒有辦法進行索引,后續(xù)的效力就沒有辦法得到保證。搜狗對識圖效果的要求非常高,一張圖在匹配這塊兒要求在10秒以內(nèi)把結果反饋回來,有效特征的表示是其中一大難點,以及怎么樣建立一個索引。
第三,去偽存真。有了大量跟當前圖片類似的圖片,怎么樣從里面能夠提取出表示這個圖片含義的語意,現(xiàn)在中文互聯(lián)網(wǎng)的情況比外文互聯(lián)網(wǎng)的情況復雜很多,比如說很多明星的照片,比如說減肥,都會被網(wǎng)上盜用,怎么能夠去偽存真,真正找到這張圖對應的是誰。
第四,搜狗做了同主題圖片的識別。有別于之前一般的做法,僅僅根據(jù)圖片的特征和語意,搜狗技術還用到了圖片之間的鏈接關系,怎么樣能夠把這種鏈接的關系應用起來,同時提高識圖的精度。
記者:我們在圖片上可能會存在一些關鍵字或敏感詞,能否對這些關鍵詞進行識別?
茹立云:從技術上來講,如果不是手寫的話,印刷體內(nèi)容的識別技術是非常成熟的,在90年代末的時候,OCR(Optical Character Recognition光學字符識別)的技術已經(jīng)非常成熟,里面唯一有困難的是怎么樣對圖片進行切割。所以OCR的技術本身是非常成熟的,另外搜狗目前還沒有應用,但是搜狗這塊兒技術有儲備,我們跟清華有聯(lián)合實驗室,在90年代末的時候基本上已經(jīng)可以做到極致了。之前的四庫全書的數(shù)字化已經(jīng)做到了這個工作,現(xiàn)在我們會看到微博上有印刷體的圖,印刷體的識別現(xiàn)在是非常成熟的技術。
記者:現(xiàn)在微博上需要進行關鍵字審核,很多人可以先發(fā)內(nèi)容,然后再截一張圖下來。這樣基于圖的內(nèi)容審核會比較麻煩。
茹立云: 對。這個不在于識圖,在監(jiān)控里面如果有這種需求,已經(jīng)有非常成熟的技術,基本上國內(nèi)的高校都有這樣的技術。
記者:搜狗的識圖搜索技術在業(yè)內(nèi)是什么樣的水平?
茹立云:之前我們也做過精度測試,都不遜于當前任何主流的識圖產(chǎn)品,另外在信息的及時度上,當天出現(xiàn)的熱點,當天能否搜索出來,搜狗可以當天搜索出來,但是我們看到其他的同類產(chǎn)品還不支持(到這個及時度)。圖像這塊兒搜狗在搜索引擎領域有7年的積累,在圖像技術上不能說比別人一定強,但是不會比其他家落后,現(xiàn)在大概是這個情況。整個研發(fā)到最后推出與創(chuàng)新點結合在一起,速度非常迅速。
任何有道德的公司都不會去觸犯保護用戶隱私的底線
記者:網(wǎng)上有些圖片是有所有權,搜狗識圖是怎么處理的?
茹立云:現(xiàn)在對于互聯(lián)網(wǎng)來講,圖片搜索還沒法辨別它是不是有所有權,什么人擁有這個所有權,要通過投訴的渠道。另外,會做一些比較敏感的圖片的過濾。
記者:如何看待識圖搜索可能會涉及用戶個人隱私的問題?
茹立云:據(jù)現(xiàn)在的了解,之前也跟國內(nèi)的圖像權威人士做了比較多的交流,基于頭像識別的技術,或者人臉識別的技術在開放性方面是不完備的,效果有待于進一步提升。首先在技術上這個門檻還沒有跨越;其次就是保護層面,由于技術的不成熟,用人臉識別這種方式的話,本身這種擔心是有必要的,但是也并不是非常有必要的事情。作為任何一家有社會責任的公司,推出任何可能涉及隱私產(chǎn)品的時候,一方面要多聽一聽公眾的意見,都不會去侵犯這個底線,隱私是需要保護的。另外一方面需要通過一些技術手段或者其他一些手段能夠保護用戶的隱私。
記者:但是普通的用戶并不是很了解,他們就覺得隱私被侵犯了。
茹立云:現(xiàn)在搜狗的識圖搜索技術還不會用人臉識別的技術在里面。
記者:您對目前搜索市場怎么看?尤其是國內(nèi),百度基本處于壟斷地位,你對搜狗的未來是如何規(guī)劃的?
推薦和整合功能是關鍵
茹立云:對搜索引擎市場來講,其實現(xiàn)在還是處于蓬勃發(fā)展的階段,無論是全球范圍內(nèi)還是中國范圍內(nèi),市場的潛力還是非常巨大的,尤其是國內(nèi)市場潛力更加巨大,主要是幾方面。
第一,國內(nèi)的網(wǎng)民還在繼續(xù)增長,不只在說PC端,無線端也在高速成長。
第二,中國有2000萬家中小企業(yè),現(xiàn)在進行互聯(lián)網(wǎng)營銷的有20幾萬家,規(guī)模跟國際上比起來還小很多,整個中國的經(jīng)濟處于高速的發(fā)展中,互聯(lián)網(wǎng)以及電子商務在不斷地普及,從企業(yè)需要營銷的方面來講未來也會有很大的增長。整個行業(yè)處于比較好的發(fā)展時期,當然現(xiàn)在也面臨一些問題,比如說搜索引擎在互聯(lián)網(wǎng)上營銷的控制可能是其中的一個問題,不能讓一些虛假的廣告?zhèn)Φ接脩?,所以這也是大家盡力去解決的事情。
具體到搜狗來說,里面的機會在于:
第一,我們有跟客戶端,瀏覽器有協(xié)同作戰(zhàn)的做法,在用戶入口方面有優(yōu)勢。
第二,搜狗搜索有比較多的技術創(chuàng)新,像剛才提到的識圖搜索,以及前期提到的全搜索技術。用戶在使用搜索的時候更加便捷、全面、及時。通過入口的把握以及對產(chǎn)品的創(chuàng)新使得用戶越來越多的用搜狗并且喜歡搜狗,這也是過去的一年我們?yōu)槭裁磿@么快速成長的原因之一。
另外,未來搜狗會更多的探索瀏覽器跟搜索結合的搜索模式,現(xiàn)在的搜索還是稱作為第二代搜索,那么第三代搜索需要轉變一種形式,不再像現(xiàn)在這樣簡單的關健詞搜索,是一種無處不在的搜索,用戶要看到一篇新聞的時候,搜索引擎可以告訴你背后是什么,給你推薦相關的內(nèi)容,從整個互聯(lián)網(wǎng)發(fā)展來講,第一代是瀏覽器,第二代是搜索,第三代我們把它稱為總推薦,其實是搜索的延伸。搜狗未來希望在這個領域做出比較大的創(chuàng)新性的產(chǎn)品出來,搜索不再像現(xiàn)在靠關健詞做的搜索,可以把它稱為探索式的搜索,用戶看這篇文章背后的需求是什么,我可以告訴你進一步你想做的一些什么事情。
記者:搜狗搜索跟瀏覽器整合,目前大概的進展是什么樣的?
茹立云:目前我們已經(jīng)在做這個層面的整合,像識圖功能通過跟瀏覽器結合,使得用戶使用的便捷和體驗有非常好的提升。另外,之前的消息盒子會做視頻的推薦,比如說用戶看過某一個連續(xù)劇,這是一個更新的連續(xù)劇,如果有新的出現(xiàn)的話,將第一時間推薦給你,不需要用戶自己不停的搜索看看有沒有新的,是這種推薦的概念。像音樂搜索,也會搜索頁面上是不是存在一些應用,如果你感興趣的直接就可以在頁面上應用,會非常的便捷。未來像電子商務、軟件、旅游酒店這塊兒都會跟推薦引擎結合在一起。
標簽:杭州精品網(wǎng)站設計
興趣為先 扎實基本功最重要
記者:對于一些想進入搜索領域的學生或技術人士,您有什么建議?
茹立云:想跨入搜索領域有很多種方式,本身跟搜索相關的領域要有特別全面的人才,比如說是一個技術人員的話,基本功一定要扎實,比如說編程基本功打好了,才能夠做很多比較高深尖的技術。此外,還要選好入門搜索引擎領域的方向,如果本身對互聯(lián)網(wǎng)的產(chǎn)品非常喜歡,就可以做跟產(chǎn)品相關的工作。如果對網(wǎng)民這塊兒有感覺,跟他們聯(lián)絡有感覺,你就可以做產(chǎn)品應用的工作,搜索引擎這個行業(yè)出來的人才是多種多樣的,關鍵是你是不是對這個感興趣,只要感興趣并且有基礎,又為之去努力,做這個行業(yè)并不是太難的事情。
記者:技術人員的基本功具體包括哪些部分?
茹立云:這跟計算機科學的基礎技術比較相關,比如說像操作系統(tǒng)、編程基礎課程等等。你想在里面有更進一步的發(fā)展,最好還要會編程語言處理、自然語言處理、技術學識這些計算機領域的專長。
備注:
關于搜狗識圖搜索:能實現(xiàn)以圖搜圖,即通過上傳圖片、鼠標拖拽、鼠標選圖、輸入圖片URL地址等多種方式搜索,找到互聯(lián)網(wǎng)上與這張圖片相似的其他圖片,并且利用圖片識別技術,進一步分析圖片內(nèi)容的主題,找到與這張圖片同主題的其他圖片。
關鍵詞:杭州精典網(wǎng)站制作
-
杭州網(wǎng)站設計公司:品牌網(wǎng)站開發(fā)助力企業(yè)成長
日期:2024-12-20瀏覽次數(shù):328次
-
杭州網(wǎng)站建設公司:商城網(wǎng)站建設的六大關鍵步驟
日期:2024-12-18瀏覽次數(shù):431次
-
杭州網(wǎng)站制作:醫(yī)院網(wǎng)站設計與域名備案的復雜性探討
日期:2024-12-18瀏覽次數(shù):439次
-
杭州網(wǎng)站制作公司:打造安全可靠的醫(yī)院網(wǎng)站
日期:2024-12-11瀏覽次數(shù):689次
-
杭州網(wǎng)站設計公司:數(shù)據(jù)庫在高端網(wǎng)站制作中的關鍵作用
日期:2024-12-11瀏覽次數(shù):659次
相關新聞
整合同類新聞,相關新聞一手掌握
-
大慶網(wǎng)站建設:專業(yè)的網(wǎng)站建設是這樣的
日期:2023-02-20瀏覽次數(shù):1565次
-
數(shù)據(jù)庫對大慶網(wǎng)站建設的用處
日期:2023-02-20瀏覽次數(shù):1539次
-
大慶企業(yè),做好網(wǎng)站建設的優(yōu)化,需要的幾個策略。
日期:2023-02-20瀏覽次數(shù):1522次
-
大慶企業(yè)網(wǎng)站制作,需要的主要步驟有哪些
日期:2023-02-20瀏覽次數(shù):1579次
-
大慶網(wǎng)站的流量來源于哪里?
日期:2023-02-20瀏覽次數(shù):1579次
最新新聞
與互聯(lián)網(wǎng)同行,實時掌握網(wǎng)建行業(yè)最新動態(tài)
-
杭州網(wǎng)站建設價格一般是多少
日期:2018-03-28瀏覽次數(shù):5794次
-
“引流之王”:軟文營銷推廣策略
日期:2020-03-24瀏覽次數(shù):4769次
-
教育行業(yè)APP開發(fā)前景分析
日期:2021-02-05瀏覽次數(shù):2029次
-
優(yōu)秀的品牌企業(yè)網(wǎng)站建設應具備哪些能力?
日期:2021-06-01瀏覽次數(shù):3458次
-
杭州網(wǎng)站優(yōu)化,如何將網(wǎng)站做上搜索引擎首頁
日期:2023-06-02瀏覽次數(shù):2585次
隨機新聞
新聞新動態(tài),您需要的新聞管家
洞悉市場趨勢演變讓傳播回歸社會
免費獲取網(wǎng)站建設與網(wǎng)絡推廣方案報價
-
關于我們
杭州帷拓科技有限公司,是一家新型的全案網(wǎng)絡開發(fā)公司,作為以互聯(lián)網(wǎng)高端網(wǎng)站建設、APP開發(fā)、小程序開發(fā)為核心的專業(yè)網(wǎng)絡技術服務供應商,帷拓科技致力于全面分析市場環(huán)境、衡量與預測市場需求、整合區(qū)別于行業(yè)競爭對手的絕對優(yōu)勢,結合品牌理念深度挖掘項目優(yōu)勢和產(chǎn)品價值,提升客戶品牌認知、認可度。
-
我們的客戶
帷拓科技歷經(jīng)十年沉淀,與國內(nèi)外上千家客戶達成合作關系,其中穩(wěn)定合作的公司有:浙江華為、浙江移動、浙江5G產(chǎn)業(yè)聯(lián)盟、浙江省社科院、綠城足球俱樂部、娃哈哈雙語學校、健康中國杭州峰會、科雷機電等,帷拓科技始終堅持“帷有專業(yè),才能拓展無限”的服務理念,堅持“認真堅持細節(jié)”的優(yōu)質服務理念,不斷完善自身,成就企業(yè),最終實現(xiàn)共贏。
-
我們的業(yè)務
帷拓科技主營業(yè)務范圍包含互聯(lián)網(wǎng)高端網(wǎng)站建設、APP開發(fā)、小程序開發(fā)、商城網(wǎng)站建設、公眾號運營以及數(shù)字營銷等,涵蓋了服務、房產(chǎn)、數(shù)碼、服裝、物流貿(mào)易等行業(yè),根據(jù)品牌現(xiàn)狀,為每個客戶量身定制項目整體服務方案,以敏銳的市場洞察力、創(chuàng)新的市場策劃能力,全面把握市場變化,為客戶實現(xiàn)從企業(yè)到消費者的價值轉換。