小編今天想起,之前每次說到馬賽克技術的發展時,都會給我留言:
我們想要的是打碼嗎?!明明更想要去除馬賽克啊……
害,你們這些人吶,別以為我不知道你們在想啥~

實際上,去年就已經給大家介紹過,iPhone 上的一個打碼功能被破解了。

我們經常直接在相冊里,直接對某個重要的部位打碼,所以就會用到 iOS 自帶的畫筆功能。

But,有萬能的網友發現,如果我們把照片的曝光度、亮度等參數拉到最高,被打碼的內容就會漏出來。

這是因為 iPhone 這個畫筆功能,是真的還原了現實中的畫筆。
如果你現在在白紙上寫幾個字,然後用黑色畫筆塗抹後,把白紙對著陽光,一樣能看到被塗抹的文字。
看來有時候過於用科技還原現實,也不是一件好事啊。

但是吼,細心的我已經發現,這種還原馬賽克的方式,有它的局限性。
一個是因為局限於 iPhone 上,另一個是因為局限於用「塗鴉」的方式打碼。
實際上,我們現在打碼的花樣,那可多得去了。
而用的最多的,還是那種一個個小格子組合起來的「真·馬賽克」。

小編知道,你們最想知道的,是怎麼去除這種馬賽克。
我跟你們一樣,原本以為這種技術還要很久,才能被發明出來。
萬萬沒想到的是,這一天真的來了。
馬賽克不安全了
不知道有木有做程序猿的機友?
如果有,應該都知道 GitHub 這個網站:全球最大同性交友平台。啊不是,是全球最大的程序員交流平台。
每天都會有很多程序猿,把自己想出來的新技術、寫出來的新代碼,在上面分享、開源給大家。

而這個月,GitHub 上面有一個叫做 Depix 的項目突然火了。
沒錯,結合上文,應該猜到機哥要說啥了,這個項目就是:利用 AI 技術去除馬賽克。
並且,Depix 不只是提供一個構思,可是真真正正把這個技術做出來了。不愧是程序猿小哥,人狠話不多。

羅老師說得好,少啰嗦,先看東西。
那麼,就先給大家展示一下,如今 Depix 能夠實現的效果。
比如說,這裡是一段打了厚碼的文字。

有一說一,如果你丟直接丟這張圖片過來,機哥橫看豎看都看不出原本的內容。
但是,人類做不到的事情,機器說不定就能實現。
於是乎,把這張圖片丟進去 Depix 里,通過 AI 的計算之後,就會輸出去除馬賽克後的結果:

雖然不算特別清晰,但基本上能看見原本寫的是啥了!
如果拿原圖來對比,就會更加感慨 Depix 的強大,幾乎已經把馬賽克還原得七七八八:

看到這裡,應該不少人都覺得害怕。
以前我們在微信上、微博上,沒少發出去一些打馬賽克的東西。現在有了這項技術,豈不是隱私全都曝光了?

想想看,最近又到年末,很多 App 都推出年度賬單、年度盤點什麼的。
很多人喜歡截圖曬出去朋友圈,告訴大家今年花了多少錢、聽了多少歌。凡爾賽嘛~
但是吼,發現大家都會小心翼翼地給自己的名字、地址等隱私信息打上碼,甚至會把賬單里買了什麼給打碼。

而這,這是其中一個例子。咱們需要打馬賽克的場合,遠不止這個。
而 Depix 的出現,會不會讓隱私,不再是隱私呢?
我這裡可以直接下個結論:至少在目前,還不需要擔心。
在我說為什麼之前,機哥建議大家先聽我說完,Depix 實現去除馬賽克的原理。
去除文字馬賽克的原理
平常我們給一個東西打碼,本質上就是把一張圖片分成一個個小格子,然後像 Photoshop 等修圖工具,就會給每個格子算出它的平均顏色。
然後就用這種平均顏色,覆蓋整個小格子。

所謂的馬賽克的薄與厚,其實只是看要分成多少個小格子罷了。
而要把馬賽克還原成圖片原本的樣子,其實是一個逆向過程。
但想想就知道,要實現起來有多困難。
畢竟馬賽克打得越厚,就會讓圖片的細節丟失得越多。就像上面機哥舉的例子,那幾個英文單詞哪怕經過 Depix 的還原,還是很難 100% 還原。

於是這兩天 GitHub 上面這個 Depix 項目,它的想法就是:利用 AI 人工智慧,讓馬賽克里的小格子們,不斷跟資料庫里已有的字元組合做匹配。
這就有一個問題了,資料庫咋整?
今天拿到了代碼作者提供的資料庫,大概明白了他的想法。
想想看,英文字母只有 A~Z 的 26 個、阿拉伯數字只有 0~9 的 10 個、常用的英文標點符號也是只有幾個。

你們去看看你們電腦鍵盤的布局就知道了,幾十個按鍵就覆蓋了英語里所有需要的東西。
說這個的意思是,在英文語法下,「字母+數字+標點」的組合是有限的。
吶,如今 Depix 代碼里就把這些組合列出來,就在這張圖裡:

Depix 的作者還考慮到每個字元之間的距離,可能會對運算產生影響,所以一次性做了「寬字距」和「窄字距」的資料庫。
所以說,每次運算時,只要把需要去除馬賽克的圖片丟進去 Depix 里,Depix 就會開始進行逐一匹配,最終得出一個大致的結果。

好了,說到這裡,硬核的東西講完。
機哥就要開始回答,為啥我上面說:現在還不需要擔心隱私問題泄露。
目前還存在的問題
首先是,Depix 對原圖的要求極高。
我看到有從事這方面的專業人士分析,這個項目目前對文本大小、字體、顏色、hsl 也許都有限制。
機哥覺得嘛,像大家現在經常用一些花里胡哨的字體,機器想要識別出來,還是有點難的。

今天本來想自己試一下,但是沒成功。(這個項目是運行在 Python 語言上的,有點小複雜。)
但我看到網上有程序猿大神,已經成功運行了。
只是他說,他用自己的圖丟進去 Depix,出來的結果很爛……
吶,他把他名字打上馬賽克:


但 Depix 去除馬賽克的結果是:

emmm,機哥仔細比對了一下,除了字母「L」被還原了,別的就還是一團亂麻。
他推測,這個項目是這個月初才做出來,目前還在初期階段,所以還不夠完善。

除此之外,我覺得對於我們使用中文的人來說,Depix 還遠不能實現破解中文的馬賽克。
雖然理論上中文組合也是有限的,但數量會比英文龐大得多。
So,Depix 這個項目不僅目前還不支持中文,也許在短期內也很難實現。
所以不管哪種原因,機哥上面才說 Depix 至少目前還不能對我們的隱私構成威脅。
但未來呢?
AI要看你怎麼用
最近一段時間,我們似乎每天都能聽見 AI 又干成什麼什麼事。
比如說,AI 修復了晚晴拍攝的視頻,不僅從黑白影片變成彩色影片,甚至幀數、清晰度也有所提高。

還有就是前兩天很火的,B 站有 up 主利用 AI 技術「復活了」歷代皇帝。
讓我們看到,原來歷史書里的皇帝,真實的樣子是這樣的。

但與此同時,我也聽到了有犯罪分子,利用「AI換臉」、「AI假冒聲音」等新技術作案。

AI 人工智慧,作為現在發展得最為迅速的技術,就像一枚硬幣有兩面。
有的人用它來改善我們的生活、有的人卻用它犯罪。
新技術的出現與發展,是不可逆的潮流。
說到底,還是要看它怎麼用吶。
原創文章,作者:投稿專員,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/226978.html