無論是本地硬盤還是網絡云盤,我們都希望用最小的空間存儲最大的數據量。為了達到這個目的,各種各樣的文件壓縮技術和標準也應運而生,圖片里有jpeg和png,音頻里有mp3和flac,視頻里有rmvb和mkv,還有zip和tar等各種壓縮。
其實他們的最終目的是一樣的:最大限度地保持數據的原始信息,同時生成最小體積的可讀寫文件,F在,谷歌憑借神經網絡的方法又向著這個目標往前跨了一大步。
來自谷歌的一個研究團隊日前憑借神經網絡訓練法讓計算機對圖片文件的壓縮效率達到了新高度。據外媒報道,這種新的壓縮算法效果要優(yōu)于傳統的jpeg壓縮,在同樣的清晰度下,使用神經網絡算法壓縮的文件體積要比jpeg更小。
團隊的具體做法是:首先從互聯網上隨機挑選6百萬張已經被壓縮過的圖片,并將每張圖片都切割成若干個32x32大小的像素碎片,從每張圖片中都挑出100個壓縮效果最差的碎片輸入到神經網絡中進行學習。經過反復訓練,告訴神經網絡哪些是最差的壓縮,讓計算機自己學習這些最差壓縮的特點?茖W家們的想法是:如果計算機掌握了最差壓縮的圖片特點,那就能夠在后續(xù)的壓縮算法中有效規(guī)避,于是在保證文件壓縮比的同時,能最大限度地確保圖片的顯示效果。
該神經網絡壓縮的實現方式類似于訓練中的情況。計算機會將一張照片首先拆分成若干個小片段,并針對每個片段的特點進行單獨壓縮,隨后再將所有片段組合起來形成最后的輸出結果。在團隊成員發(fā)表的論文中,可以看到算法的具體實現情況,其中也展示了神經網絡算法在大部分壓縮比例下都優(yōu)于jpeg的效果。
不過谷歌也承認,人類的視覺系統或許是所有感知系統中最難把握的一個,因為有些人對某種特定的變化很敏感,而另一些又不敏感,目前還無法形成一個統一的判定標準,一張圖片到底怎樣才算最優(yōu)的顯示。
無論如何,谷歌都在努力將我們的越來越龐大的媒體數據盡量無損地壓縮到最小,這在任何時候都是一件好事。
小編推薦閱讀