
Salesforce 36 亿美元吞下 Fin、Kimi 推理提速 6 倍——AI HOT 今日热点(2026-06-16)
Salesforce 以 36 亿美元收购 AI 客服平台 Fin(前 Intercom),AI 应用并购加速;Kimi K2.7 Code 高速版上线,同模型输出速度提升 5–6 倍;MiniMax M3 开源两周登顶多项开源榜,DFlash 投机解码让 Qwen 3.5 397B 吞吐提升 4.3 倍。行业侧:Nvidia 发行 200 亿美元债券、AI 裁员今年已达 15 万。精选 2026-06-15 全天 14 条 AI 行业动态。

今天有两条主线值得并排看:一条是推理提速,MiniMax M3 权重全量开源、DFlash 新投机解码让 Qwen 3.5 397B 吞吐量达基线 4.3 倍、Kimi K2.7 Code 高速版正式上线;另一条是 AI 应用层的并购加速,Salesforce 用 36 亿美元买下曾经的 Intercom、AI 裁员潮一月消灭近 4 万个岗位。
模型发布/更新
MiniMax M3 开源两周成绩单:开源榜第一,输出速度翻倍
MiniMax 上周五正式开源 M3 模型权重,并同步发布 **MSA(MiniMax Sparse Attention)**技术论文。M3 是 428B 总参数、23B 激活参数的 MoE 架构,是目前首个在预训练阶段就做文本与图像多模态交错混合训练的开源模型,上下文窗口达 1M token 1。
发布两周后的最新成绩:Artificial Analysis 综合智能指数和 GDPval-AA 榜单拿下开源模型第一,Code Arena WebDev 跻身帕累托最优序列,Vals.AI 国产模型第一。推理速度从约 30 TPS 提升至约 80 TPS,官方计划再提速 30–40%,Token Plan 后台同步新增调用量看板。
DFlash + Spec V2:投机解码再进化,4.3 倍吞吐量
Z Lab、Modal、SGLang 团队联合发布 DFlash 投机解码模型,并将 Spec V2 设为 SGLang 默认引擎。DFlash 采用「块扩散 + KV 注入」并行生成整块 draft token,在 Qwen 3.5 397B-A17B(BF16)HumanEval 数据集、并发 1 的条件下,吞吐量达到基线的 4.3 倍 2。对在本地或云端跑大参数模型的开发者来说,这个数字直接影响 token 预算和推理成本。
产品发布/更新
Kimi K2.7 Code 高速版:同模型、6 倍速、2 倍价
Kimi 上线 K2.7 Code 高速版,与普通版是同一模型,但输出速度约 5–6 倍:常规编程场景约 180 Token/s,短上下文可达 260 Token/s。API 定价为普通版 2 倍,模型 ID 为
kimi-k2.7-code-highspeed;Kimi Code Plan 用户通过「抢先体验计划」可访问,用量按普通版 3 倍计算。使用须开启思考模式,关闭会报错或回退至 K2.6 3。K2.7 Code 相比 K2.6 的量化提升:长上下文编程指令遵循和长程任务性能均有提升,平均 token 消耗减少 30%。做代码补全、长上下文重构的场景值得试试高速版对实际体验的差异。
Grok Build 推出 Agent Dashboard:多会话并行管理
xAI 为 Grok Build CLI 推出 Agent Dashboard,把多个编码会话汇到一块屏幕管理 4。仪表板按状态分组(等待输入 / 工作中 / 空闲),每行显示状态标记、名称、分支、权限模式和当前操作。选中会话可打开 peek 面板查看最新输出并直接回复;等待输入的会话支持用箭头键或数字键选择选项;底部输入框可分派新会话,支持设置模型、启动计划模式或自动批准编辑。通过
grok dashboard、/dashboard 或 Ctrl+\ 打开,关闭后会话继续后台运行。正在加载内容卡片…
同日,xAI 宣布 Grok 集成至拥有近百万开发者的 Warp 终端开发环境,驱动 Grok Build CLI 的
grok-build-0.1 模型即将可用 5。在 Warp 的 Agent 设置页连接 SuperGrok 订阅后切换模型即可使用。Meta Facebook 上线 AI Mode:从公开帖子合成答案
Meta 在 Facebook 推出「AI Mode」搜索功能,Meta AI 从公开帖子(含群组和 Reels)提取信息并合成自然语言答案。新功能还包含视频拼贴剪辑、过渡效果和 AI 照片预设(可虚拟更换服装、发型和配饰),体育粉丝可在 Stories 里点「AI Edit」穿上球队队服 6。
值得注意的是,Meta 近期同步启动了 Facebook、Instagram、WhatsApp 的全球订阅计划(每月 3.99 美元起),更多 AI 订阅层级正在规划中。从动态头像到 Marketplace 自动回复,Meta 正在把 AI 功能铺进几乎所有产品触点。
OpenRouter 上新:gpt-oss-20b 和 Gemma 4 26B 免费可用
由 Eigenlabs 的 Darkbloom 提供算力,OpenRouter 新增两个免费模型:
gpt-oss-20b 和 Gemma 4 26B 7。对预算有限但需要跑评测或原型的开发者,多两个免费节点总是好事。正在加载内容卡片…
Claude Code v2.1.178:权限规则新语法、技能自动加载
本次更新新增
Tool(param:value) 语法用于权限规则匹配工具输入参数;嵌套 skills 目录中的技能自动加载,名称冲突时以 namespace:name 形式区分;嵌套 agent、workflow、output-style 冲突时取最近目录。此外改进了自动模式下子 agent 生成前的分类器评估;/doctor 采用扁平树布局;/bug 提交前需填写描述 8。正在加载内容卡片…
行业动态
Salesforce 36 亿美元收购 Fin(前 Intercom)
Salesforce 宣布以 36 亿美元收购 AI 客服平台 Fin,后者前身为 Intercom 9。Fin 支持实时聊天、WhatsApp、短信、电话、Slack 等多渠道 AI 智能体。Salesforce 计划将 Fin 的技术与团队整合进企业级 Agentforce 平台,交易预计在 Salesforce 2027 财年第四季度(2027 年初)完成;Fin 联合创始人 Eoghan McCabe 和研发负责人 Des 均留任。
今天 Tom Tunguz 在博客里把这笔收购、Fable 被政府关闭访问和 Satya Nadella 的「AI 护城河在人类专业知识」论合并成一个论点:AI 应用黄金时代已至。Fin 本身就用开源模型实现性价比,这是 Kimi K2.6、Qwen 3.6、GLM 5.1 这类模型战争的直接受益者;Anthropic Fable 因美国政府监管被切断访问后,反而推动开发者转向开源和本地部署 10。
Nvidia 发行 200 亿美元债券
Nvidia 计划通过自 2021 年以来的首次债券发行筹集至少 200 亿美元 11。从微软、Meta、Google 的数据中心 CapEx 到 Prometheus 410 亿估值,AI 基础设施融资正在加速向债务市场延伸,Nvidia 这次发债是同一趋势里的另一个数据点。
Cloudflare 引入 Ensemble AI 团队,加速 Workers AI 推理
Cloudflare 宣布 Ensemble AI 核心成员加入,Ensemble 的两项核心技术将整合进 Workers AI 平台 12:
- NdLinear:可直接替换 Transformer 标准线性层,保持多维激活结构
- NdLinear-LoRA:降低大模型微调所需的可训练参数
这两项技术与量化等方法互补,目标是降低 LLM 和多模态模型在内存、计算和部署层面的开销。对依赖 Cloudflare 做边缘推理的团队来说,利好明显。
技巧与观点
AI 裁员浪潮变成火药桶:今年已裁 15 万人,AI 连续三月列首因
今年科技公司已累计裁员约 15 万人,日均 974 人,速度比去年快 44%;5 月单月裁员近 4 万,创两年新高,AI 连续三个月被列为裁员首要原因 13。
Block 近半数员工被裁,CEO Jack Dorsey 否认 AI 是根源;Marc Andreessen 称 AI 是「银弹借口」;Uber 裁撤 23% 人事部门,但其 CTO 此前透露 AI 编码预算四个月内耗尽。与此同时,Cerebras 上市首日市值 670 亿美元,Anthropic 和 OpenAI 估值均约 1 万亿美元,Meta 扎克伯格购入 1.7 亿美元豪宅后宣布裁员 8000 人。民调显示 65% 选民认为中产阶级生活遥不可及,76% 美国人将生活成本列为首要经济问题。两组数字同时存在,是当前 AI 周期最显著的张力所在。
GitHub Copilot CLI 斜杠命令速查
GitHub 整理了 Copilot CLI 的常用斜杠命令概览,供初学者上手 14。如果你最近才开始在终端用 Copilot CLI,官方文档是比散装教程更可靠的起点。
参考来源
- 1MiniMax 公众号:M3 开源公告
- 2LMSYS Blog:Next-Gen Speculative Decoding DFlash V2
- 3月之暗面公众号:K2.7 Code 高速版
- 4xAI News:Agent Dashboard
- 5xAI News:Grok × Warp
- 6TechCrunch:Meta AI Mode on Facebook
- 7X:OpenRouter 新模型公告
- 8Claude Code GitHub Releases:v2.1.178
- 9TechCrunch:Salesforce 收购 Fin
- 10Tom Tunguz 博客:AI 应用黄金时代
- 11The Decoder:Nvidia 200 亿债券
- 12Cloudflare Blog:Ensemble AI 加入
- 13TechCrunch:AI 裁员浪潮
- 14GitHub Blog:Copilot CLI 初学者指南
围绕这条内容继续补充观点或上下文。