当前位置:首页 > 攻略秘籍 > 亲测谷歌Gemini3,多模态、编程与Agent能力实现全方位提升

亲测谷歌Gemini3,多模态、编程与Agent能力实现全方位提升

文章来源:潮游速递网作者:admin发布时间:2026-01-17 11:16:16

万众瞩目的Gemini 3,终于和大家见面了!此次在推理、多模态、编程以及Agent能力等方面实现了全方位的提升。

GooGle DeepMind 表示:这是全球最好的多模态理解模型,也是我们迄今最强大的智能体和 Vibe Coding 模型。

刚一发布,Gemini 3 几乎屠榜了所有的基准测试,还在 LMArena 人类盲测榜上首次突破1500 Elo得分,Gork 4.1刚登顶没多久就被挤下来了!

Polymarket 上关于「到 2025年底哪家公司拥有最好的 AI 模型?」的讨论,Google Gemini 拿下近90%的投票遥遥领先。

分确实是高,不过还是过一遍手才能知道是不是有真东西,我们一起实测一下。

体验地址:https://aistudio.google.com/

01. 实测case

case1 图像理解

提示词:尽可能精确地用语言描述这张图片,并生成一段可复现该图像的完整提示词。

Gemini 3准确地识别出这是一张角色设计图,详细分析了图片的构图布局、角色特征、服饰细节和艺术风格,信息识别蛮准的。

Gemini 3给出的完整提示词是这样的:

角色设计图,包含多个视角:全身正面、全身背面、头部特写以及手部细节。画面主体是一位美丽的年轻中国女性,身着一件风格化的水墨风黑色长裙,配有半透明的薄纱袖。她佩戴着繁复精美的传统苗族银饰,包括一枚大型层叠银项圈、胸前银链,以及带有流苏的花卉银质头饰。发型为高髻。裙身呈现湿画法水彩质感,带有黑色墨色渐变效果,袖口处饰有民族风几何刺绣。背景为纯白色。整体采用时尚插画风格,结合水彩与水墨艺术手法,营造出优雅、空灵的氛围,属于高品质、细节丰富的角色概念设计。 –ar 3:4 –v 6.0

生成的图片风格和原图几乎一模一样,衣服中的薄纱、人物头上、身上的银饰这些元素都还原了。虽然画面细节和布局上还有一些差异,不过我觉得能还原到这个程度相当不错了。

case2 文字识别

朋友发给我一张图片,他说自己当初学数据分析的时候做了笔记,现在想重新翻出来看看,已经很难认清到底写了什么。

我们发给Gemini 3识别看看。

提示词:提取图片中的文案内容,并保持原文的排版结构和符号。

Gemini 3 几秒钟就识别出这是一份关于 Power Query 的函数处理操作:

符号和文字识别准确率挺高的,很多字我都认不出是什么,Gemini 3都识别出来了,只有个别错字;排版一般,分段少了很多。

case3 视频理解

提示词:帮我详细分析这个视频中的每个分镜,确保我可以复刻。

Gemini 3判断出这是一支分厂风格鲜明的高能量快节奏旅行Vlog,同时还找出了风格相近的知名博主,并且指出该视频的关键在于卡点剪辑、无缝转场与高质量的空镜(B-Roll)。它对内容和要点的总结都相当准确。

这段4分钟的视频,Gemini 3按照叙事逻辑和音乐情绪拆分成7个阶段,并详细分析了每个分镜的画面,不仅包含了画面是什么内容,还详细描述了拍摄和后期的技巧。

最后Gemini 3给了关键的3条建议:

需要用到什么拍摄设备、人物出镜是什么状态、转场怎么规划、最后怎么剪辑成片,这些真实拍摄流程中要注意的关键点,Gemini 3全都讲到了。

case4 SVG动画

提示词:生成一个展示二极管整流电路工作原理的 SVG 动画.

一句简单的提示词,Gemini 3 就画出了动画版的电路图,方便理解知识点,还在旁边加上了一个波形图,页面布局挺不错,动画效果做的也很棒。

不过波形图还需要优化一下,形状对了但数值不太准确,把输入和输出拆分成两个独立的坐标系会更合适。

case5 数学练习训练器

提示词:制作一个网页,网页中显示用emoji 创建的动画,用来展示AI Agent的原理。

Gemini 3制作了一个案例演示动画,当用户提出查询天气的需求时,AI Agent并不掌握实时天气信息,此时它会调用搜索工具进行查询,之后把获取到的数据反馈给用户。

整个过程简单明了,没有任何基础的人都能看懂,动画也很丝滑,很不错。

case6 3D Excel模拟器

提示词:将一台电脑放置在一个可以移动视角的 3D 空间中, 并在该电脑中创建一个可操作的 Excel 模拟器。 功能:提供10种类型。同时允许更改视角高度。

Gemini 3生成的页面呈现出这样的效果:我们能够自由切换视角,进行拉近、拉远、上下移动以及旋转等操作,而且电脑屏幕里的Excel也处于可编辑状态。由此可见,Gemini 3在多模态理解能力与UI生成能力方面的表现相当出色。

case7 数学练习训练器

提示词:创建一个仅用单个 HTML 文件实现的单页应用,具体要求如下:

名称:数学练习训练

目标:提升做数学题的速度和准确度。

功能:限时测验、难度设置、分数追踪。

界面:整体风格应保持极简,大字号、易阅读的文字。

本来我以为它的界面这么简单,肯定很拉跨。

但是实际用下来确实还不错,可以调整时间、数字大小和运算类型,给小学生练习加减乘除的运算非常合适。

还有得分系统,也相当于玩游戏了。

case8 网站开发

尝试做了一个会员优惠网站,我是通过自然语言对话完成的,以下是分步提示词:

提示词1:帮我生成一个会员优惠网站,支持领取会员码、购买会员卡密,分为最新和最热两个Tab。

提示词2:帮我增加一个用户中心和鉴权,支持谷歌账号一键登录,未登录态不可领取和购买,点击后引导注册登录账号,登录态用户可以看到他历史买了哪些、免费领取了哪些。

帮我在商品上增加领取数据、购买数据,多少人已领取、多少人已购买。热门Tab按照领取数、购买数降序排序,最新Tab按照上线时间排序,左侧增加日期目录,按日维度倒序。

提示词3:左侧日期不够美观,做成滚动的,去掉具体日期显示,改成按月维度显示,UI风格还是参考上一版不需要大改。

在最新与最热的Tab页面下,内容将采用两列布局展示:左侧列全部为可免费领取的会员权益,商品陈列方式为每排两个;右侧列则是可享受优惠购买的会员权益,商品陈列方式为每排一个。同时,页面将新增折扣力度的直观展示,具体表现为划掉原价,并自动换算出对应的折扣力度,且折扣数值保留一位小数,例如呈现为“6.6折”。

提示词4:我们的产品名称叫 VipCheap ,帮我取字母”V”为主元素,生成一个LOGO放上去,LOGO是主色调偏深一点的底色,V元素为白色。

最新和最热下面的 分类标签,帮我保留,跟之前的样式类似即可。

免费领取会员卡片,提示剩余库存数量还有多少,如果剩余为0则不可领取,按钮置灰。

提示词5:整体很好,LOGO帮我改成圆角矩形,其他不变。

热门榜单,补充一下领取数,按照领取数降序排序,其他不变。

提示词6:免费领取后,按钮文案改成“查看会员”,颜色换一个,可以点击弹窗预览领取的卡密和如何领取兑换的信息,其他保持不变。

付费折扣专区的商品购买流程如下:下单时会弹出确认窗口,需核对商品数量、订单总金额及选择支付方式(支持PayPal、微信、支付宝、信用卡);完成支付后,系统将引导您查看卡密信息与兑换方式;此外,您也可以在个人中心随时查阅所有相关的购买记录和信息。

付费折扣专区默认展示10个,其他严格保持不变。

这是最终的网站:

我们可以注册登录、查看和购买产品,页面审美还是挺不错的,交互也很流畅。

在多轮自然语言对话迭代中,Gemini 3始终都能维持住整体的UI风格、页面布局和组件逻辑,不会越改越乱,这点对我这种看不懂代码的人来说太关键了。

我又顺手让它生成了一个管理后台:

依据上述最新版产品功能,全面梳理后台管理系统所涵盖的各项功能以及增删改查需求。待完整需求梳理完毕后,开发一个管理后台,该后台需设置超级管理员与运营两个系统角色,其中运营角色的权限配置需限制为无法删除商品、订单、用户等任何数据。

Gemini 3根据前端页面、已有的功能逻辑,把仪表盘、商品管理、订单流水、用户和系统权限这些模块都补全了。整个后台是基于前端网页倒推出来的,这点非常像一个合格的产品经理。

02. 一些分享

实测下来,我发现Gemini 3 的价值远远不止模型变强这么简单,它对工作方式的改写,可能比跑分和参数更直观。

未来,AI时代最小团队应该是2个人,即 1个懂增长会用AI的PM + 1个熟练掌握AI的资深全栈开发。

Gemini 3在指令遵循、前端实现与视觉审美方面表现十分出色,几乎能够承担UI和前端的工作内容。我们只需清晰阐述需求,Gemini 3就能自动补全逻辑并交付可用的成品,其成熟度远超我的预期。当前AI时代仍处于新一轮技术革命进程中,新技术的诞生会催生新需求与新产品,这一阶段对PM的要求更侧重于了解AI技术、掌握增长思维,而非传统意义上仅懂得需求挖掘。PM借助AI完成需求梳理、视觉交互稿设计乃至前端代码实现,省去了两个角色间的沟通传递与执行环节,原本一个月的工作量可压缩至一天,由此可见,Gemini 3最主要的受益人群其实是PM,而非RD。若要打造真正高可用、高并发且稳定运行的产品或系统,还需配备一名资深全栈开发人员——既不能是初级开发,也不能是单纯的后端开发,而应是资深且熟练运用AI技术的全栈开发,由其完成服务开发上线的最后环节。

AI 正在重写团队规模,也重写产能曲线。也让创意和产品之间不再隔着漫长周期。

下一个产品时代,会在这样的趋势里重新长出新的样子。

原文链接:谷歌正式发布 Gemini 3,我玩了一天得出1个结论!

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表本站立场。文章及其配图仅供学习分享之用,如有内容图片侵权或者其他问题,请联系本站作侵删。
  • 最新文章