AI摘要
微软本周举办了BUILD 2025大会,宣布了:
— 完全自主的GitHub Copilot编程助手
— Windows AI Foundry
— 新模型,包括Grok-3,以及Azure AI Foundry的工具
— 基于代理的AI科学研发发现 — NLWeb,用于开放代理的网络
OpenAI斥资65亿美元收购了由前苹果设计师Jony Ive创办的AI硬件初创公司io Ive的io和LoveFrom团队将与OpenAI合并,推出一款超越屏幕的AI设备 他们还将为其他OAI产品处理创意工作。
谷歌在I/O大会上推出了一堆新AI产品,包括:
— 改进版的Project Astra,支持对话和UI控制
— Gemini 2.5 Pro Deep Think
— Gemini 2.5 Flash
— Gemini的Agent模式
— 用于视频的Veo 3,支持声音/对话
— Imagen 4
— Flow用于电影制作
谷歌还宣布了:
— Android XR,XR头戴设备和智能眼镜的平台
— Google Beam,一个AI优先的3D通信平台
— Stitch,一个用文本提示创建UI的AI平台
Anthropic发布了Claude 4 Opus和Sonnet
— 两者都是混合模型,支持在正常思维和扩展思维之间切换
— Opus 4与领先模型相匹配或超越,在编程、工具使用和写作上实现了SOTA(最先进技术)
— Sonnet 4在日常任务中表现出色
Figure更新:本周满3岁了! Figure的类人机器人还完成了在宝马X3生产线上的20小时连班运行 Figure已经连续几个星期运行10小时的班次了
在Computex上,Nvidia发布了新机器人产品:
— Isaac GR00T N1.5:一个用于通用机器人行为的新开放模型
— GR00T-Dreams蓝图,用于生成合成的人体运动数据
— GR00T-Mimic,用于在仿真中放大现有的人体运动数据
Nvidia还宣布了DreamGen,一个通过数字梦想扩展机器人学习的新引擎 它可以生成大量的逼真机器人视频(使用视频模型),并配有运动操作标签,能够实现到新环境的泛化
FutureHouse取得了首次重大科学突破,发现了治疗黄斑变性的全新方法 该公司的Robin AI代理生成了假设,设计了实验,并分析数据,找到了适合此病的药物
Mistral发布了Devstral,一款与All Hands AI共同开发的开放编码AI
— 在基准测试中击败所有开源和多个封闭模型
— 为代理软件开发进行了优化
— 小到可以在Mac上运行
— 更大的版本即将推出
新加坡的Sharpa发布了SharpaWave,一款栩栩如生的机器人手
— 具有22个自由度,平衡灵活性和力量
— 每个指尖拥有1000多个触觉传感像素和5mN的压力灵敏度
— AI模型调整手的抓握并调节力度
特斯拉透露,他们现在可以将人类视频中的学习内容转移到Optimus上,使其能够比以往更快地执行新任务 这种技术目前仅适用于第一人称视频(第三人称支持即将推出)
TikTok母公司字节跳动推出了BAGEL,一个统一的多模态模型。它可以:
— 在文本和图像之间进行思考和推理
— 生成新图像
— 编辑(包括以不同方式填充或扩展它们)
— 如有需要,还能为图像添加动态效果
AI基准测试平台LMArena从a16z和UC Investments获得了1亿美元的种子资金 它计划利用这笔资金拓展其工作,首先从下周推出一个经过社区反馈改进的网站开始
内容来源:AI Will @FinanceYF5