首页
时事
民生
政务
文化
财富
文摘
科技
更多
美体
创业
汽车
职场
教育
学术
企业
百科
健康
时尚
美食
乐活
旅行
幽默
情感
体娱
登入
注册
集智书童
书童带你领略视觉前沿之美,精选科研前沿、工业实用的知识供你我进步与学习!
订阅
RSS
最新文章
清华发布WorldVLN | 不卷VLA,自回归预测,成功率+12%
2026-05-20 08:30
完成DINOv3+SAM+CLIP的活!EUPE 3阶段蒸馏让iPhone 62ms跑通分类/分割/VLM,全面SOTA
2026-05-19 08:30
华科发布 IntentVLA | 给VLA装上"金鱼记忆"后,成功率暴涨17.7%
2026-05-19 08:30
模拟数据喂真实网络就打折?DriveCtrl 用 LoRA 搞定 Sim-to-Real,标注零损耗迁移
2026-05-19 08:30
DINO 行,DINOv2 不行?注意力迁移在 11 个 ViT 家族里"精神分裂" | 架构不匹配,蒸馏反而成毒药
2026-05-18 08:30
"分而治之"才是具身最大的坑!Pelican-Unified 1.0发布,1个模型即可完成3项SOTA
2026-05-18 08:30
别再为每种天气单独训模型了!OmniLiDAR一统LiDAR生成江湖,8域通杀,文本指哪打哪
2026-05-18 08:30
别让ViT算全量Token了!LLaVA-UHD v4把Token压缩塞进ViT第6层,高分辨率多模态终于不卡了
2026-05-17 08:30
58ms→19ms!FLASH把机器人扩散策略加速3倍,传送带上成功率不降反升
2026-05-17 08:30
Meta联合斯坦福发布 BLT-D | 内存带宽暴降92%,不用tokenizer的大模型,推理速度反而快3倍?
2026-05-16 08:30
离散 Token Out!北大联合小米用SO(n)几何结构重构VLA,1.7B吊打13个大模型
2026-05-16 08:30
MicroViTv2 正式开源 | 跳出TransformerFLOPs陷阱,1335帧/秒!ViT用"反直觉"设计屠榜
2026-05-15 08:30
从"看图说话"到"破案式感知" | 武大发布Pixel-Searcher 让开源多模态首次超越闭源
2026-05-15 08:30
地平线发布 HorizonDrive | 打破"19秒必崩"魔咒,世界模型向前迈出一大步
2026-05-15 08:30
斯坦福发布 Urban-ImageNet | 感知步入新时代,新范式新卷法!!!
2026-05-14 08:30
四川大学发布ForgeVLA | 砍掉语言标注,精度反涨26%
2026-05-14 08:30
北大发布 HiDrive | 端到端的"满分泡沫"被戳破了!
2026-05-14 08:30
千问迎来自己的“SAM3”时刻 | Qwen3-VL-Seg用0.4%参数实现不用SAM也能分割万物!
2026-05-13 08:30
港科大发布 StarVLA | 6倍数据效率干翻SOTA!!!
2026-05-13 08:30
英伟达发布123D | 9大数据集秒变"一家人",自动驾驶的"Hugging Face时刻"来了!
2026-05-13 08:30
上一页
1
...
3
4
5
6
下一页