ScatterAI
Issue # · 2026年3月14日

值得关注 — 2026-03-14

Research

其他值得关注

04 [推理] 一个训练更聪明的模型,服务数百万不同用户 在多设备上训练 AI 模型时,每台设备持有不同的私有数据且无法共享,如何平衡所有人的需求是一大难题——现有方案大多只是猜测如何取得平衡。这一方法将问题重新定义为多目标数学挑战,以有原则的权衡取舍替代聚类或平均等试错技巧。最终实现了在完全不泄露用户数据隐私的前提下,为数百万用户同时提供更可靠的个性化 AI 服务。链接

05 [视频生成] AI 在直播视频播放时同步思考,而非事后处理 大多数视频 AI 必须等到片段播放完毕才能回答问题,而这个系统能够在实时处理直播视频流的同时,同步响应追问。关键在于一个分段级记忆缓冲区,让模型能够同时感知传入画面并生成答案——这是以往设计无法实现的,因为这两项任务此前只能交替进行。这意味着 AI 助手有朝一日能够针对直播画面——安防摄像头、体育直播或外科手术——进行持续的来回对话,而不会出现尴尬的停顿或遗漏片段。链接

06 [RAG] 读取基因活动以解释细胞生物学的 AI 智能体 ELISA 是一个将基因表达数据直接接入 AI 智能体的系统,使其能够基于真实的细胞测量数据回答生物学问题,而非仅依赖文字描述。打通这两个世界颇具难度,因为基因活动数据与自然语言存在于完全不同的技术体系中,而大多数 AI 工具只能处理其中一种。研究疾病或药物靶点的科学家,现在有望用自然语言从单细胞实验中获取可解释、有数据支撑的假设,大幅加速科学发现。链接

07 [RAG] 新基准测试 AI 在中文法律文件中的检索与理解能力 Legal-DC 是一个专为测试 AI 系统检索和解读中文法律文件的能力而构建的新基准。法律系统对 AI 尤为棘手,因为法律高度结构化且措辞精准——细微偏差就可能改变整体含义,而现有测试也未被设计为同时评估”查找”和”解读”两个步骤。更好的法律 AI,最终有望让那些请不起律师的普通人也能获得专业的法律指引。链接

08 [RAG] 更聪明的解码技巧让 AI 摘要更少遗漏关键信息 BLooP 是一种即插即用技术,无需任何额外训练,即可引导 AI 语言模型在撰写摘要时更紧密地贴近原文。要做到这一点并不容易,因为模型天然倾向于生成听起来自信却流于泛泛的语言,而纠正这一问题通常需要在标注数据上进行昂贵的重新训练。该方法适用于任何现有大语言模型,开箱即用,意味着以更低的成本和精力获得更忠实、更准确的摘要。链接

09 [视频生成] AI 模型现在能边看视频边同步推理 Video Streaming Thinking 是一个让 AI 能够在观看视频时同步进行推理的新系统,而非等到片段结束后才开始思考。挑战在于,更深层的”思考”通常会引入过大的延迟而无法实时使用,因此团队构建了一个将推理编织进数据流本身的框架,在不落后于进度的同时完成推理。这意味着 AI 助手有朝一日能够对直播视频——如安防画面或视频通话——做出有意义的实时反应,而不是以缓慢、断续的方式事后处理。链接

10 [RAG] AI 智能体从文本描述生成开放词汇的三维场景 SceneAssistant 是一个 AI 智能体,能够将纯文本描述转化为完整的三维场景,且不受特定类别或预设空间规则的限制。现有大多数工具要么只适用于特定领域,要么需要精确指定每个物体的位置,使真正自由形式的场景创建几乎无从实现。这为游戏设计师、电影制作人和建筑师打开了一扇门——只需用自然语言描述,即可生成复杂的三维环境。链接

11 [评估] 360° AI 视觉在三维空间中预测任意物体 O3N 是一个新系统,让 AI 智能体能够利用全方位摄像头构建周围环境的完整三维地图,并识别它从未特别训练过的物体。现有大多数工具只能向前看,且只能标记训练时预设好的固定物体列表——将全景视觉与开放式识别结合是一个真正的工程挑战。当机器人和自动驾驶系统能够理解整个周围环境而非仅仅是正前方的内容时,安全性会有意义的提升。链接

12 [评估] 适配任意相机镜头的通用 AI 模糊修复模型 大多数用于锐化模糊或失真照片的相机 AI 仅适用于训练它的特定镜头,这意味着每一款新镜头都需要从头进行昂贵的重新训练。该基准通过创建一个综合测试框架直面这一限制,以衡量修复模型在众多不同镜头上的泛化能力。摄影师、手机制造商和相机厂商都可以从一个通用修复模型中受益,而不必为每款镜头单独开发。链接

13 [图像生成] AI 图像生成器内部发现隐藏的颜色编码规则 科学家在一个流行 AI 图像生成器的复杂数学运算中发现,颜色被组织成了结构清晰的形式——镜像了人类用来描述颜色的色调、饱和度和亮度系统。这令人惊讶,因为 AI 是在没有人为设计的情况下自己学习了这种结构,这表明模型为颜色开发了类人的内部语言。这一发现为 AI 生成图像的精确颜色控制打开了大门——让设计师可以说”使其更温暖”或”降低饱和度”并真正得到想要的结果。链接

14 [机器人] 机器人灵手在关键位置精准应用柔性材料 CRAFT 是一个新型机器人灵手,在关节处使用柔性材料,在手指链接处使用刚性材料,模仿真实手部在不同部位不均匀吸收冲击的方式。找到这个平衡点确实困难——大多数机器人灵手要么完全刚性(受冲击时容易破损),要么完全柔软(失去精度),所以仅在真正发生接触的地方应用柔性是一个有意义的工程洞见。需要处理精细、高接触任务的机器人——比如装配零件或在家居中协助——需要既坚固又精确的灵手,CRAFT 的混合方案推动了这一进展。链接

15 [评估] AI 模型倾向于选择真实信息的真正原因:压缩效率 语言模型倾向于赞成准确信息,不是因为它们”理解”真理,而是因为真实陈述在训练过程中在数学上更容易压缩和存储。虚假的替代方案需要更复杂的内部表示,使模型难以有效编码——意味着准确性是效率的副作用,而非设计目标。这将 AI 可靠性重新定义为一个结构属性,对模型何时及为何可能失效有真实的影响:在虚假信息与事实同样容易压缩的领域中,真实偏好可能会悄然消失。链接