集智书童-微阅读

最新文章

YOLO丢细节、DETR抢Token | TinyFormer打造YOLO-DETR混合架构新范式，四个基准全面SOTA！ 2026-06-01 08:30
模型越大视觉推理越好？VisReason：最强模型在人类面前也不过如此！ 2026-06-01 08:30
复旦大学+新智具身发布 VLA-Pro | 具身智能跨任务泛化的救星！ 2026-06-01 08:30
MagicDriveV2被卷飞 | 理想提出AnyScene，重新定义智驾数据合成，布局、相机、轨迹全可控 2026-06-01 08:30
ViT线性注意力还有“第三条路”？RPAttention：一招解决，检测/分割/分类，全线涨点！ 2026-05-31 08:30
还在用 VLM 给 SAM3 打辅助？CLIP-Guided SAM：仅用167M参数，SAM3精度再暴涨10个点！ 2026-05-31 08:30
一个模型操控所有机器人？通义团队发布Qwen-VLA，操作+导航+轨迹预测全统一 2026-05-31 08:30
港中文新研究反着来：不用VLM当大脑，让视频生成模型直接开车了 2026-05-31 08:30
超越YOLOv8/11/12/26全系！YOLO26-RipeLoc Lite：架构新突破，检测精度达95.2%！ 2026-05-30 08:30
MiniMax M3 真的要来了！深度解析MiniMax M2.7官方技术报告：M2已逼近天花板，M3会强到什么程度？ 2026-05-30 08:30
智元祭出 GE-Sim 2.0 | 给世界模型装上"本体感知"和"裁判"，真机性能飙升15% 2026-05-30 08:30
港中文新研究反着来：不用VLM当大脑，让视频生成模型直接开车了 2026-05-30 08:30
ICML 2026｜告别SoftMax，哈工深SMULL提出全新线性注意力范式 NaLaFormer，显存暴降92%！ 2026-05-29 08:30
最懂中文的文生图模型？百度文心开源ERNIE-Image：8B叫板Nano Banana 2.0和Seedream 5.0！ 2026-05-29 08:30
刚刚，港大联合Qwen团队开源FineVLA | 让机器人跳过“说人话”，直接“做动作” 2026-05-29 08:30
Drive-OccWorld出局！浙大×华为提出SparseWorld，用稀疏表示重新定义世界模型 2026-05-29 08:30
谢赛宁团队最新力作！RAEv2：ImageNet生成、文生图、世界模型三项SOTA！训练效率提升超过10倍！ 2026-05-28 08:30
ICML2026开源 | 华科&酷睿程提出GemDepth：首个几何引导视频深度估计框架，远超VGGT/VDA，精度全面SOTA 2026-05-28 08:30
中科院联合北大发布X-DiffVLA | 终结"一机一模型"时代 2026-05-28 08:30
28万小时视频"喂"出AI先知！小鹏 X-Foresight 世界模型如何打通端到端VLA任督二脉？ 2026-05-28 08:30