歡迎光臨
我們一直在努力

AI鑑黃,一把量出人性的尺子

在1997年版的電影《洛麗塔》裡,洛麗塔趴在花園的草坪上讀書,天真的臉龐籠罩在朦朧的水霧下。 在她的眼波流轉之中,電影流露出情色的味道。 情色作品的含蓄和豐富常常使其可以藉“性”的描述來傳達對社會精神狀態的思考。 但是情色和色情從來不是一回事,而二者模糊的邊界卻不斷讓色情內容的傳播有了可乘之機。

鑑黃師是在互聯網色情內容暴增的條件下滋生的一個職業。 然而長期面對大量色情內容的刺激使這類工作者往往要承受心理、生理的雙重壓力。 那麼,在人工智能迅速崛起的時代,AI的加入會不會成為鑑黃師們的“減壓閥”呢?

AI來了,“東京熱”們還會好嗎?

互聯網鑑黃主要分為三個階段, 第一階段叫人肉階段, 主要通過人工識別的方式來發現黃色內容; 第二階段叫算法過濾階段 ,以膚色識別算法過濾黃色圖片開始成為主流; 第三階段叫深度學習階段 ,因為純膚色式地圖片過濾已經難以擔當鑑黃的重任,所以機器學習成為了新的主角。 針對第三個階段,智能相對論分析師(aixdlun)楊甦穎梳理了三種不同的智能鑑黃工種,分別囊括了音頻、圖像和視頻三種形式。

首先是鑑定圖片和視頻的鑑定。 鑑別黃色圖片的過程主要有兩步,第一步是用黃圖的特點來定義一個機器可以識別的數學模型。 第二步則是用大量滿足定義的圖片來進行樣本數據的收集並將其用於機器訓練。 在島國搜尋大量動作片的種子進行海量灌輸之後,我們可以得到一個越來越精準的模型,從而讓人工智能準確識別出某張圖片是否為黃圖。 這是AI鑑別靜態圖片的一個簡單流程。

那麼AI對於動態圖像又是怎麼進行處理的呢? 其實AI要對在線視頻和直播這類的動態圖像開展鑑黃工作,其原理與鑑別靜態圖片並沒有太大的差別。 只要在鑑別視頻和直播的時候,人為地多加一個步驟把動態內容解碼變成圖片幀,剩下的工作就和靜態圖片處理大同小異了。

另外,如今偽ASMR的湧現要求AI在色情音頻上的處理能力也必須跟上。 在各種直播房間內,主播們更是可以直接以語言交流的方式與粉絲進行互動。 所以,國內的一家名叫極限元的公司採用了一種叫CTC+LSTM組合的深度學習技術來識別色情音頻內容。 它可以分析語音的信息內容,從而判斷出語音當中是否含有色情信息。

在鑑黃領域,AI的三管齊下顯示了其要肅清黃色內容的決心,而且它也確確實實地減輕了人工鑑黃的壓力。 但是在現實當中上有政策,下有對策的戲碼總是會不斷上演, 因此鑑黃的力度越大,色情的邊界也就拓展地越快,自然AI鑑黃的難度也會越大。 而這好像成為一個繞不開的死循環。

AI鑑黃可能暫時還hold不住軟色情

最近軟色情一詞在網絡上被頻繁提到,成為一個關注度很高的話題。 軟色情的內容很軟,好像廣告軟文一樣,入侵的時候悄無聲息。 但是其所造成的傷害卻很硬,足以讓沒有心智成熟的青少年沈溺其中難以自拔。 AI進入鑑黃領域,勢必要面對現在越來越活躍的軟色情, 但要如果真想要AI對軟色情做出識別和判定卻是一項難上加難的工作。

軟色情的定義很模糊,它的定義是與硬色情對比得來的,指一些不暴露生殖器官的色情內容。 如果把暴露生殖器官作為一個特點去識別哪些內容屬於硬色情,那麼這是一件相對比較容易的事情。 但是我們卻不能把不暴露生殖器官作為識別軟色情的特點,否則所有不暴露生殖器官的內容都會被標記為軟色情內容。 所以這也就意味著軟色情並不是一樣容易被貼上具體標籤的東西, 它非黑非白,而是屬於灰色,因此很難被公式化。

這就為人工智能鑑黃製造了一個難題。 通常人工智能進行鑑黃首先需要建立一個“分類器”來將圖片歸類,但不幸的是,軟色情的問題卻沒有那麼簡單。 什麼是軟色情這個事並不好弄清楚。 在B站的一些彈幕上,我們常常可以看到一群人對著視頻當中的蘿莉發彈幕,包括“跪舔”“硬了”之類的字眼。 但是拿“跪舔”為例,有些人只把它當作一個比較誇張的網絡用語,覺得無比正常。 而有的人在這些字眼的刺激下卻真的會產生生理反應,難以把控。

這些不同的反應主要是由於我們每個人色情刺激的閾值高低不一。 所以,像“跪舔”這樣的彈幕到底算不算是軟色情的表現呢? 這很難判定。 捫心自問, 軟色情是一個很個人化的東西,它幾乎可以是一切能夠喚起自己對配偶之外的性慾的東西,而機器卻不可能成為每一個人肚子裡的蛔蟲。

不僅是定義模糊難分類,軟色情的傳播渠道也開始朝越來越隱秘的方向發展。 今年3月B站的“文愛”事件讓語C群浮出水面。 各種嬌喘的音頻,露骨的聊污在QQ微信群裡肆意傳播。 在此基礎上,選擇私聊成為“文愛”對象的青少年也同樣不在少數。

我們可以看到的是,全國最大的社交工具現在正在成為全國最大的軟色情承載地之一,而這些社交工具對隱私的保護竟成為了軟色情最好的保護傘。 面對這些越來越隱秘的色情傳播形式,AI要嘗試去發現它們的存在實際上是一件非常困難的事情。

如果強行去打開這扇門,那麼很有可能會觸及到閱讀用戶隱私這條紅線,對此,內容審核方難以把握,所以也就更難以下手。 加之,人工智能對自然語言的識別程度現在還十分局限。 常用的拆字法、首字母縮寫法、取別稱法、拼音代替法、形近字代替法等等也會讓鑑黃工作變得更為複雜。

AI鑑黃堵住了人性的出口嗎?

弗洛伊德的泛性論認為,性是一種本能力量。 若受到壓抑就會導致人得精神疾病。 因此,色情內容的看客會說,AI鑑黃堵住了人性的出口。 在美國,色情業的收入超過了哥倫比亞廣播公司CBS、全國廣播公司NBC和美國廣播公司ABC三家收入的總和。 營業額超過了所有職業橄欖球、職業棒球和職業籃球收入的總和,因此色情產業對人來說是一種剛需。

法國有一部叫《生吃》的電影曾對人的慾望做出討論,電影女主角一家因為基因變異的問題受本能驅使不得不生吃人肉,這看上去非常殘忍。 但是仔細想想,吃人肉為什麼一定得被定義成“野蠻”、“殘忍”的代表,“吃人肉是錯的”這樣的道德標準又是從何而來? 如果吃人肉是一種本能,那麼本能是不是不能加以價值判斷?

確實,本能不可以加以價值的判斷。 因為慾望是真實存在,並且與生俱來的。 但是怎麼對待自己的慾望卻可以成為一門很重要的功課。 如果我們對慾望視而不見,那麼人就會麻木,壓抑;如果我們任慾望橫流,那麼人最終會被慾望吞噬,成為怪物。 慾望不能被殺死,但是也不能成為我們生活的主宰者。 控制性慾、食慾、肉慾的道理皆是如此。 所以,黃色內容需要正規、有序的引導, AI鑑黃不是在堵住人性的出口,而是在調控慾望的尺度。

*文章為作者獨立觀點,不代表虎嗅網立場

本文由 智能相對論 授權 虎嗅網 發表,並經虎嗅網編輯。 轉載此文章須經作者同意,並請附上出處( 虎嗅網 )及本頁鏈接。 原文鏈接https://www.huxiu.com/article/248841.html
未來面前,你我還都是孩子,還不去下載 虎嗅App 猛嗅創新!

未經允許不得轉載:頭條楓林網 » AI鑑黃,一把量出人性的尺子