谷歌“香蕉”手写满分卷,Karpathy玩上瘾,ChatGPT跪验沉默
产品发布与战略影响 - 谷歌发布Gemini 3 Pro和Nano Banana Pro双产品,被行业视为战略突破[1] - PyTorch之父Soumith Chintala评价Gemini 3接近GPT-4水平[1] - Salesforce CEO Marc Benioff从ChatGPT转向使用Gemini 3[1] 多模态能力表现 - Nano Banana Pro生成超逼真人物图像,硅谷八巨头同框图像真假难辨[3] - 根据具体坐标和时间生成图像,如2001年9月11日纽约坐标图像[5] - 解答手写试卷时能进行涂鸦和图表绘制,输出完美手写答案[10][11] - 数学题解答能模仿原手写字体输出答案[17] 逻辑推理与文本处理 - 生成汉堡组装教程等步骤化图表[21] - 根据论文内容自动配图[26] - 将诗作《尤利西斯》转化为漫画分镜[36] - 将菜单文字转化为带图片的可视化菜单[23] 影视级内容生成 - 生成1984电影分镜故事版[32] - 支持基础图像的角度、氛围、表情无缝调整[46][48] - 生成电影幕后花絮,如《堡垒之夜》主题内容[63][64] - 制作多场景剧本分镜,包含12个场景切换[61] 创意应用与时空模拟 - 16宫格生成从1880年代到未来的跨世纪变装序列[76][78] - 模拟不同年代女性发型和穿着变化[81] - 生成漫威人物、动物表情包等恶搞系列[83][85]