首页
时事
民生
政务
文化
财富
文摘
科技
更多
美体
创业
汽车
职场
教育
学术
企业
百科
健康
时尚
美食
乐活
旅行
幽默
情感
体娱
登入
注册
集智书童
书童带你领略视觉前沿之美,精选科研前沿、工业实用的知识供你我进步与学习!
订阅
RSS
最新文章
YOLO丢细节、DETR抢Token | TinyFormer打造YOLO-DETR混合架构新范式,四个基准全面SOTA!
2026-06-01 08:30
模型越大视觉推理越好?VisReason:最强模型在人类面前也不过如此!
2026-06-01 08:30
复旦大学+新智具身发布 VLA-Pro | 具身智能跨任务泛化的救星!
2026-06-01 08:30
MagicDriveV2被卷飞 | 理想提出AnyScene,重新定义智驾数据合成,布局、相机、轨迹全可控
2026-06-01 08:30
ViT线性注意力还有“第三条路”?RPAttention:一招解决,检测/分割/分类,全线涨点!
2026-05-31 08:30
还在用 VLM 给 SAM3 打辅助?CLIP-Guided SAM:仅用167M参数,SAM3精度再暴涨10个点!
2026-05-31 08:30
一个模型操控所有机器人?通义团队发布Qwen-VLA,操作+导航+轨迹预测全统一
2026-05-31 08:30
港中文新研究反着来:不用VLM当大脑,让视频生成模型直接开车了
2026-05-31 08:30
超越YOLOv8/11/12/26全系!YOLO26-RipeLoc Lite:架构新突破,检测精度达95.2%!
2026-05-30 08:30
MiniMax M3 真的要来了!深度解析MiniMax M2.7官方技术报告:M2已逼近天花板,M3会强到什么程度?
2026-05-30 08:30
智元祭出 GE-Sim 2.0 | 给世界模型装上"本体感知"和"裁判",真机性能飙升15%
2026-05-30 08:30
港中文新研究反着来:不用VLM当大脑,让视频生成模型直接开车了
2026-05-30 08:30
ICML 2026|告别SoftMax,哈工深SMULL提出全新线性注意力范式 NaLaFormer,显存暴降92%!
2026-05-29 08:30
最懂中文的文生图模型?百度文心开源ERNIE-Image:8B叫板Nano Banana 2.0和Seedream 5.0!
2026-05-29 08:30
刚刚,港大联合Qwen团队开源FineVLA | 让机器人跳过“说人话”,直接“做动作”
2026-05-29 08:30
Drive-OccWorld出局!浙大×华为提出SparseWorld,用稀疏表示重新定义世界模型
2026-05-29 08:30
谢赛宁团队最新力作!RAEv2:ImageNet生成、文生图、世界模型三项SOTA!训练效率提升超过10倍!
2026-05-28 08:30
ICML2026开源 | 华科&酷睿程提出GemDepth:首个几何引导视频深度估计框架,远超VGGT/VDA,精度全面SOTA
2026-05-28 08:30
中科院联合北大发布X-DiffVLA | 终结"一机一模型"时代
2026-05-28 08:30
28万小时视频"喂"出AI先知!小鹏 X-Foresight 世界模型如何打通端到端VLA任督二脉?
2026-05-28 08:30
上一页
1
2
3
4
5
6
下一页