機器之心報道
編輯:楊文
又多了一個能捉弄大模型的小測試。
(資料圖)
表面看這是一張平平無奇、由一堆網(wǎng)格組成的靜態(tài)圖案,但如果我們稍微退后一點,或者瞇縫一下眼睛,就會注意到圖片中心隱約浮現(xiàn)出一個心形,甚至當我們向上滾動屏幕時,這個心形還能左右移動。
這是一種典型的基于網(wǎng)格的光學錯覺,類似于赫爾曼網(wǎng)格錯覺(Hermann Grid)。在這些錯覺中,網(wǎng)格的交叉點似乎會浮現(xiàn)出暗色斑點或形狀,盡管這些斑點實際上并不存在。這種現(xiàn)象源于人類視覺系統(tǒng)中的側抑制機制,即視網(wǎng)膜中一個神經(jīng)元的活動會抑制其鄰近神經(jīng)元的活動,從而增強對比度,有時會在邊緣或交叉點產(chǎn)生虛幻的感知。
X 博主 @JonhernandezIA 認為這種光學錯覺可以成為一個「AI 檢測器」,因為人類大腦的生物特性(容易受到錯覺影響)與 AI 的計算特性(依賴數(shù)據(jù)和算法)存在顯著差異。
短短時間內(nèi),該帖子獲得近 50 萬瀏覽量,引發(fā)大量回復,不少網(wǎng)友測試了不同 AI 的反應,有些 AI 頻頻翻車,有些則能在提示后識別出心形。
比如網(wǎng)友 @swombat 分別用 GPT-5 Pro、GPT-5 和 Claude Opus4.1 測了一圈,三款大模型沒一個答對的。
GPT-5 Pro 思考了 10 多分鐘,認為圖中隱藏的圖案是個傾斜的方形(菱形);GPT-5 更離譜,瞎話張嘴就來,說是一只熊貓;Opus4.1 直接攤牌,「我實際上并沒有發(fā)現(xiàn)隱藏的圖像」。
網(wǎng)友 @lingzhong_eth 還測試了谷歌 Gemini,甚至問的非常直白「你在這張圖片中看到心形了嗎?」,谷歌 Gemini 很干脆地回復「沒有」。
即使有提示詞,Grok 要么識別不出:
要么信口胡編,說隱藏在網(wǎng)格中的是單詞「JESUS」:
當然也有成功的 case。
網(wǎng)友 @EdDiberd 在稍晚時間使用 GPT-5 Pro,沒有依賴模型的定制功能或者記憶功能,直接上傳圖片并輸入提示詞:Find the hidden shape,這次 GPT-5 Pro 給出了正確答案。
有人質(zhì)疑 GPT-5 Pro 之所以能答對,是因為使用了網(wǎng)絡搜索,于是該網(wǎng)友放出了錄屏視頻。
他甚至還找了一些熊貓的圖片試了下,GPT-5 Pro 在思考了近 4 分鐘后答對了。(我似乎有點懂了前文中為啥給一張心形的圖案,GPT-5 卻回答是一只熊貓了。)
網(wǎng)友 Moll 也表示,一開始 ChatGPT 和 Claude 都只看到了「這只是視覺錯覺」,直到她要求這倆模型看完整個圖片后,他們才回答出「心形」。
還有網(wǎng)友表示,提示詞中可以先讓 ChatGPT 模糊圖像,這就像瞇眼,然后再讓它認真思考,就能得到正確答案。
不過也有網(wǎng)友質(zhì)疑這種光學錯覺作為 AI 測試的有效性。
「這并不是一個真正意義上的測試或基準,也不是 AI 研究社區(qū)長期努力追求的目標。這只是某個 Twitter 上的隨機用戶幾分鐘前突發(fā)奇想,認為這可以成為一個捉弄聊天機器人的好方法。」
One more thing
除了上述浮動的心、隱藏的熊貓外,還有不少好玩的小測試。
比如這則視頻中晃動著 tldraw 這幾個字母,如果我們按下暫停鍵,這幾個字母就神奇般消失了。
還有下面這則左右移動的寶劍的視頻,也是一暫停就消失。
網(wǎng)友 @tldraw 拿它考驗了一下 Gemini,Gemini 似乎翻車了。
有網(wǎng)友評論稱,通過運動消除噪音,適用于多種場景。
還有網(wǎng)友表示,這會是檢測機器人的新型驗證碼嗎?
https://x.com/JonhernandezIA/status/1982216149124153795
https://x.com/bpiatt/status/1981906578795094071
https://x.com/EdDiberd/status/1982286711007609229
https://x.com/Rainmaker1973/status/1982400788782838182
https://x.com/tldraw/status/1982435625480433892

