您的位置:首頁 > 業(yè)內(nèi)資訊 > 阿里媽媽圖像識別創(chuàng)世界紀(jì)錄:識別虛假推廣準(zhǔn)確率超95%

阿里媽媽圖像識別創(chuàng)世界紀(jì)錄:識別虛假推廣準(zhǔn)確率超95%

來源:互聯(lián)網(wǎng) | 時(shí)間:2016-06-01 14:18:31 | 閱讀:154 |  標(biāo)簽: 阿里媽媽   | 分享到:

日前,阿里巴巴旗下廣告交易平臺阿里媽媽圖像團(tuán)隊(duì)的OCR(圖中文字識別)技術(shù)刷新了ICDAR Robust Reading競賽數(shù)據(jù)集的全球最好成績,并大幅超越第二名。

Robust Reading競賽是當(dāng)前OCR技術(shù)領(lǐng)域全球最具影響力的比賽。這也是繼阿里巴巴圖像搜索領(lǐng)軍人物華先勝獲得ACM(美國計(jì)算機(jī)協(xié)會)“杰出科學(xué)家”稱號之后,阿里的圖像識別技術(shù)再一次登上國際頂尖舞臺。

借助這一領(lǐng)先的OCR技術(shù),阿里媽媽圖像團(tuán)隊(duì)能夠以95%的超高準(zhǔn)確率識別圖中違規(guī)文字信息,有效過濾商家惡意推廣,維護(hù)消費(fèi)者權(quán)益。2015年,阿里媽媽累計(jì)屏蔽了4600萬條惡意推廣。

OCR是計(jì)算機(jī)視覺領(lǐng)域的經(jīng)典問題,長久以來,一直受到學(xué)術(shù)界和工業(yè)界的持續(xù)關(guān)注。在工業(yè)界,Google、Microsoft、Amazon等大型互聯(lián)網(wǎng)公司,以及商湯科技、曠視科技(擁有Face++、Image++)等計(jì)算機(jī)視覺技術(shù)創(chuàng)業(yè)公司,都在OCR技術(shù)上耕耘多年。隨著技術(shù)不斷成熟,OCR也開始在互聯(lián)網(wǎng)及其他行業(yè)逐步上線使用。

據(jù)阿里媽媽定向算法技術(shù)負(fù)責(zé)人蓋坤介紹,在阿里巴巴平臺上營銷創(chuàng)意、商品等均是以圖片形式展示,圖像技術(shù)是理解這些信息的重要手段。同時(shí),也有不良商家在圖片中內(nèi)嵌一些違規(guī)的信息達(dá)到其惡意推廣的目的,圖片內(nèi)文字違規(guī)是比例相當(dāng)大的一類,而傳統(tǒng)監(jiān)控手段多以人工肉眼來審核,費(fèi)時(shí)費(fèi)力,尤其是隨著圖片數(shù)量越來越大,這幾乎已成為不可完成的任務(wù)。

針對這一強(qiáng)烈需求,從2014年開始,阿里媽媽圖像團(tuán)隊(duì)開始重點(diǎn)攻堅(jiān)O(shè)CR技術(shù),通過機(jī)器視覺的方式從圖片中識別出文字,從而鑒別出違規(guī)的文案信息。

對惡意推廣的定義,蓋坤表示,一方面依據(jù)國家相關(guān)法律法規(guī),對于違禁品、色情信息、封建迷信、假冒偽劣、減肥豐胸、夸大虛假等違規(guī)類型進(jìn)行不同程度的處罰和管理,另一方面在法規(guī)之外平臺有著更高要求,對損害消費(fèi)者利益或進(jìn)行不正當(dāng)競爭的推廣類型積極嘗試進(jìn)行管控。其中,與消費(fèi)者關(guān)系最為密切的假冒偽劣單項(xiàng)違規(guī)類型,被阿里媽媽作為重點(diǎn)審查對象。

小編推薦閱讀

好特網(wǎng)發(fā)布此文僅為傳遞信息,不代表好特網(wǎng)認(rèn)同期限觀點(diǎn)或證實(shí)其描述。

相關(guān)視頻攻略

更多

掃二維碼進(jìn)入好特網(wǎng)手機(jī)版本!

掃二維碼進(jìn)入好特網(wǎng)微信公眾號!

本站所有軟件,都由網(wǎng)友上傳,如有侵犯你的版權(quán),請發(fā)郵件[email protected]

湘ICP備2022002427號-10 湘公網(wǎng)安備:43070202000427號© 2013~2025 haote.com 好特網(wǎng)