Copyright 2012-2025 家電庫 版權所有 京ICP備20132067號-1
蘋果在大模型和大模型應用上總是慢人一步。
Apple Intelligence 發布也已經一年多了,除去其仍未能在國行設備上提供服務外,功能上也很難稱得上有多好用。
就拿視覺生成類功能舉例子,蘋果的圖像生成大概是這個畫風:

但在開放研究領域里,蘋果似乎一整個脫胎換骨,在純粹的研究中經常會有一些出彩的工作。
但這次蘋果發布的研究成果的確出人意料:
他們用谷歌的 Nano-banana 模型做個了視覺編輯領域的 ImageNet。

對于蘋果用納米香蕉和 Gemini 的事情,引發了網友遐想:

在文本引導的圖像編輯的工作中,GPT4-o 和谷歌 Nano-banana 都能夠實現令人驚艷的編輯效果,保留原圖像的特征,實現高質量的新圖像的生成。尤其是 Nano-banana,真正能被成為圖像編輯的里程碑和新標桿。
但目前在研究界仍然缺乏針對圖像編輯的,來自真實圖像的大規模,高質量的開放數據集。
為此,來自蘋果的研究團隊提出Pico-Banana-400K,一個包含 40 萬張圖像的基于指令的圖像編輯綜合數據集。