近日,谷歌创始人谢尔盖·布林接受了知名播客主理人洛根的访谈。对话探讨了谷歌 I/O 大会上的最新动态,以及谷歌 AI 开发的整体现状。布林说,这一系列发布非常精彩,甚至有一些令他感到意外的元素,例如谷歌搜索中的虚拟试穿功能,反响热烈。但仍有大量工作要做,才能顺利实现所有已宣布的功能。
布林表示,纵观人工智能发展的更广阔轨迹,看到当前的进展与几年前对奇点的理性推理截然不同,人工智能的发展方式令人惊讶:
1、语言模型已成为人工智能发展的主要驱动力,这在 15 年前并不明显,尤其是考虑到 DeepMind 过去专注于物理基础。
2、思维模型的惊人可解释性,可以洞察其推理过程,从安全角度来看具有显著的积极意义。
从架构上看,布林发现不同的模型非常相似,甚至看似不同的模型,例如视频传播模型训练过程正在不断发展。后训练阶段(微调、强化学习工作)在整体工作中所占的比例越来越大,此阶段添加了工具使用等功能,使模型更加强大。
关于推理扩展,特别是深度思考计划。布林说,谷歌的愿景是让模型能够思考更长时间(数小时、数天甚至数月),从而对复杂问题给出更好的答案,这与克服实现长上下文输入的挑战相比,谷歌一直在努力实现这一点。从短期任务的训练模型推广,到期望它们在几天内开发出新的东西,是一个正在克服的重大差距。人工智能时刻凸显了评估问题的普遍难度,无论对于人类还是人工智能而言。
最后,布林还反思了谷歌的地位和创新步伐。他认为,企业必须定期进行自我改造,尽管充满挑战,但谷歌凭借其在大规模数据、谷歌大脑和 Transformer 方面的经验,已经为人工智能转型做好了充分准备。他对目前看到的加速发展感到乐观,并解释了谷歌大模型从跟随到领跑的原因。他特提到,与 2024 年的赶超相比,2025 年已经取得了显著进展。Gemini 2.5 Pro是一次明显的飞跃,在大多数排行榜上仍然位居第一。最近推出的Gemini 2.5 Flash也被认为是一款速度超快、性能强大的模型,在许多排行榜上排名第二。