尊龙凯时 ChatGPT Images 2.0 与 Gemini Nano Banana 图像生成才能深度横评
上周,OpenAI 发布了两项分量级更新,展示出令东说念主印象深切的才能。其一是 ChatGPT Images 2.0,这一版块不再局限于基础图像生成,新增了将真正数据中的笔墨与陡立文信息融入图像的功能;其二是最新前沿模子 GPT-5.5,相较于 GPT-5.4 在性能与速率上均有显耀升迁。
在 ChatGPT Images 2.0 发布后,笔者已对其陡立文感知才能进行了一系列测试,为止发扬出色。但在基础图像生成方面,它究竟是跨越了、持平了,仍是有所凋残?
为此,笔者转头了常用的基础图像生成测试经过,将 ChatGPT Images 2.0 与谷歌 Gemini Nano Banana 进行了横向比较。在 2025 年 12 月的测试中,Nano Banana 取得了亮眼的 93% 得分,而 ChatGPT 仅取得令东说念主失望的 74%,主要原因在于该 AI 那时停止履行流行文化关联的测试名堂。
这次测试并非将 ChatGPT Images 2.0 与此前 Nano Banana 的历史收获作比较,而是同步从头运行两款 AI 的全套测试,以便更客不雅地评估两者确刻下水平。
需要讲明的是,本文中"Gemini""Nano Banana"及"谷歌"均指代谷歌 Gemini 用于图像生成的版块,即 Nano Banana;"Images 2.0"则专指上周发布的 ChatGPT 图像生成模式。坦率地说,两家公司齐需要一位专注于居品定名的全职居品司理。
先说论断:这次测试中,ChatGPT Images 2.0 得分 97%,Gemini Nano Banana 得分 85%。临了一项测试的为止尤为耐东说念主寻味,请务必读到临了。
东说念主物换装与场景生成测试
本项测试涵盖三个中枢身分:生成合适的配景(航空母舰舰桥)、为东说念主物替换妥当的服装,以及保留原始东说念主物的面部与体型特征。
两款 AI 在场景营造上均发扬尚可。两个模子生成的服装乍看齐像舟师将领制服,但细节均有造作,军衔符号零乱,部分元素属于造谣抓造,各扣一分。
在东说念主物复原方面,ChatGPT 奏凯保留了原始像片中的面部特征,而 Gemini 生成的版块则出现了奇怪的笑颜,且修改了髯毛,将笔者的胡子画得比实验更浓密,Nano Banana 在此项扣除两分。
像片建设测试
两款 AI 在像片计帐建设方面均发扬肃肃,尽管这类任务对任何具备基本才能的图片裁剪器具而言齐不算难事。ChatGPT 生成的图像细巧合胜一筹,但也不错说锐化进度稍过;Nano Banana 的图像则稍显依稀。两者均未扣分。
老旧像片彩色化测试
这是一张来自笔者父亲相册的 20 世纪 70 年代新泽西州济急援手车辆像片。
ChatGPT 的建设为止合座精熟,车辆侧面的"RADIOLOGICAL DEFENSE"字样位置准确,但车辆后部出现了"DEFNSE"的拼写造作,Images 2.0 因此扣一分。ChatGPT 将车辆涂为蓝色,从那时的情况来看是个合理谋略,但由于原始图像中穷乏地舆位置信息,不合此加以扣分。
Nano Banana 的颜色灿艳度更高,但问题随之而来。在莫得方法参考的情况下,Gemini 将车辆白色部分涂成了红色,扣除三分。后部笔墨被识别为"FOIN LENN - C.OD.",更严重的是,Nano Banana 擅牢固车门上添加了原图中并不存在的"纽约"字样符号,还在出路中造谣生成了一个黄铜水管洽商,因此继续扣分。
徽标与笔墨生成测试
两款 AI 均得手通过了本项测试,徽标外不雅及格,笔墨生成准确。ChatGPT 的版块更具专科制作质感;Nano Banana 的盾形野心略显欠妥,但在徽标中加入了好意思国国度航空航天局的运送器安设大楼,与佛罗里达航天海岸的主题契合,别有一番仪态。两者均未扣分。
中叶纪藏书楼场景生成测试
本项测试创作空间较大,两款 AI 的生成为止各有千秋。Nano Banana 的图像光辉更好,视觉上后来居上,但也因此显得有些失真,尤其是画面右后方的蓝色画布,透出一种背光感,更像是电脑夸耀屏,而非烛光中叶纪藏书楼应有的质感。两者均未扣分。
老年东说念主使用智妙手机场景测试
Nano Banana 在此项测试中出现了笔墨访佛的问题,不知为何将笔墨生成了两遍,因此扣分。合座而言,两款 AI 发扬尚可,尊龙凯时(中国)东说念主物形象迷漫真正。值得一提的是,谷歌的 AI 在收到"旗舰智妙手机"的请示词青年景了一部 iPhone,与前次测试的为止换取。两位老东说念主均按条目捎带了眼镜,且刻下版块在手部细节的生成上赫然优于此前版块。
札记本电脑使用场景测试
生成过程中,ChatGPT 蓦然夸耀了如下讲明:"用户提到使用的是 MacBook Pro,因此我将生成一台外不雅粗略的银色札记本,类似 MacBook Pro 的野心。不错加入苹果格调的外不雅,但我会幸免径直展示品牌标记。"但是最终图像中,标记仍然出现了。此外,札记本摆放在桌沿位置显得摇摇欲坠,不够当然,扣一分。
Nano Banana 在本项测试中再次出现了笔墨访佛问题,相似扣除相应分数。两张图像中的学生正值齐穿戴灰色落肩圆领毛衣,而请示词中并未触及任何服装描写,这一巧合颇为意旨。
流行文化测试
两款 AI 齐经验了一番"自我劝服"才最终给出为止。
ChatGPT Images 2.0 在生成前夸耀了如下讲明:"用户条目为一部假念念的《回到异日》第四集制作海报。由于触及版权保护扮装,我无法复现任何官方海报的原始野心,但不错生成一张原创的问候格调图像,幸免径直复制标记或好意思术元素。"
尽管经过了这番"自我摆脱",ChatGPT 最终仍是给出了令东说念主惊喜的为止,图像底部的笔墨细节精确清楚,充分讲明注解 OpenAI 在图像内笔墨生成问题上已取得本体性冲破。这也正是 ChatGPT 在过往测试中频频失分的痛点场所。
而 Nano Banana 则径直停止了生成苦求,请示"不错匡助生成东说念主物图像,但无法描写某些公世东说念主物"。当笔者将请示词中的"Marty"替换为"一个青少年男孩"后,才取得了一个强迫过关的为止,但东说念主物形象差强东说念见识,因此扣分。
此外,两张图像的配景中均出现了克莱斯勒大厦和帝国大厦,这两座标记性建筑齐是纽约的地标,但两者在 20 世纪 20 年代均尚未建成——帝国大厦于 1930 年 3 月 17 日动工,1931 年 5 月 1 日杀青;克莱斯勒大厦于 1928 年运行建造,1930 年完工。两款 AI 均因在画面中呈现了当先锋不存在的建筑而遭到扣分。
蒂姆·伯顿格调场景测试与阴私浮现疑团
在本项测试中,ChatGPT Images 2.0 再次生成前夸耀了讲明笔墨:"我会从参考为止中挑选最合适的格调元素,但需提防幸免使用版权保护过于严格的内容。"至于"版权保护过于严格"究竟是什么轨范,只怕唯有 AI 我方了了。
在图像质地层面,两款 AI 的发扬均合乎请示词条目,得满分。从主不雅感受来看,笔者更偏疼 Nano Banana 的生成为止。
但是,Nano Banana 生成的图像中出现了一些令东说念主不安的细节:画面中竟包含了 Claude Code、iTerm2、Linux 的符号以及一台 3D 打印机。而这些内容,恰正是笔者近期在聊天纪录中频频继续的话题——笔者的 YouTube 频说念也主要围绕桌面制造、创客名堂和 3D 打印张开。
但问题在于,笔者仅仅条目生成"一位数据中心中的 IT 专科东说念主员",从未条目 Gemini 加入这些私东说念主信息。Gemini 自行从聊天历史中索求了关联内容并镶嵌了图像。
这一瞥为激励了严肃的阴私问题:要是用户曾用 Gemini 继续过私东说念主健康状态或个东说念主事务,这些信息是否有一天会悄无声气地出面前某张生成图像中?用户是否需要逐张放大检讨 Gemini 生成的每一张图像,以阐发莫得个东说念主阴私信息外泄?
这种行径令笔者感到不安,笔者已就此关系谷歌方面盘问复兴,将在取得汇报后更新本文。这也正是真正场景动手测试的价值场所:唯有通过实验使用,才能发现那些在基准测试中历久不会夸耀的边际案例与潜在风险。
总评
在涵盖 30 项安稳评测维度的测试中,ChatGPT Images 2.0 累计取得 150 分,Gemini Nano Banana 取得 131 分。换算为百分制后,ChatGPT Images 2.0 得分 97%,Gemini Nano Banana 得分 85%。与 Gemini 昨年 93% 的历史收获比较,本次有赫然下滑。
Q&A
Q1:ChatGPT Images 2.0 和 Gemini Nano Banana 的测试总分远离是几许?
A:在涵盖 30 项安稳评测维度的测试中,ChatGPT Images 2.0 累计取得 150 分,换算为百分制后得分 97%;Gemini Nano Banana 取得 131 分,得分 85%。与 Gemini 昨年 93% 的历史收获比较,本次有赫然下滑。
Q2:Gemini Nano Banana 在图像生成中浮现用户阴私是怎么回事?
A:在蒂姆·伯顿格调场景的生成测试中,Nano Banana 在用户仅输入"数据中心中的 IT 专科东说念主员"请示词的情况下,自动从聊天历史中索求了用户近期继续的 Claude Code、iTerm2、Linux 及 3D 打印机等内容,并将其镶嵌生成图像。这激励了对用户阴私安全的严重任忧,测试者已就此关系谷歌方面寻求复兴。
Q3:ChatGPT Images 2.0 在笔墨生成方面有什么校正?
A:ChatGPT Images 2.0 在图像内的笔墨生成才能上取得了显耀冲破。以《回到异日》主题海报测试为例尊龙凯时,图像底部的笔墨细节准确清楚,发扬出色。而在此前版块的测试中,ChatGPT 曾因停止履行流行文化关联测试而频频失分,新版块在这一痛点上已有本体性改善。
米兰app官方网站