首页
时事
民生
政务
文化
财富
文摘
科技
更多

美体

创业

汽车

职场

教育

学术

企业

百科

健康

时尚

美食

乐活

旅行

幽默

情感

体娱

集智书童

书童带你领略视觉前沿之美，精选科研前沿、工业实用的知识供你我进步与学习！

订阅 RSS

最新文章

清华发布WorldVLN | 不卷VLA，自回归预测，成功率+12% 2026-05-20 08:30
完成DINOv3+SAM+CLIP的活！EUPE 3阶段蒸馏让iPhone 62ms跑通分类/分割/VLM，全面SOTA 2026-05-19 08:30
华科发布 IntentVLA | 给VLA装上"金鱼记忆"后，成功率暴涨17.7% 2026-05-19 08:30
模拟数据喂真实网络就打折？DriveCtrl 用 LoRA 搞定 Sim-to-Real，标注零损耗迁移 2026-05-19 08:30
DINO 行，DINOv2 不行？注意力迁移在 11 个 ViT 家族里"精神分裂" | 架构不匹配，蒸馏反而成毒药 2026-05-18 08:30
"分而治之"才是具身最大的坑！Pelican-Unified 1.0发布，1个模型即可完成3项SOTA 2026-05-18 08:30
别再为每种天气单独训模型了！OmniLiDAR一统LiDAR生成江湖，8域通杀，文本指哪打哪 2026-05-18 08:30
别让ViT算全量Token了！LLaVA-UHD v4把Token压缩塞进ViT第6层，高分辨率多模态终于不卡了 2026-05-17 08:30
58ms→19ms！FLASH把机器人扩散策略加速3倍，传送带上成功率不降反升 2026-05-17 08:30
Meta联合斯坦福发布 BLT-D | 内存带宽暴降92%，不用tokenizer的大模型，推理速度反而快3倍？ 2026-05-16 08:30
离散 Token Out！北大联合小米用SO(n)几何结构重构VLA，1.7B吊打13个大模型 2026-05-16 08:30
MicroViTv2 正式开源 | 跳出TransformerFLOPs陷阱，1335帧/秒！ViT用"反直觉"设计屠榜 2026-05-15 08:30
从"看图说话"到"破案式感知" | 武大发布Pixel-Searcher 让开源多模态首次超越闭源 2026-05-15 08:30
地平线发布 HorizonDrive | 打破"19秒必崩"魔咒，世界模型向前迈出一大步 2026-05-15 08:30
斯坦福发布 Urban-ImageNet | 感知步入新时代，新范式新卷法！！！ 2026-05-14 08:30
四川大学发布ForgeVLA | 砍掉语言标注，精度反涨26% 2026-05-14 08:30
北大发布 HiDrive | 端到端的"满分泡沫"被戳破了！ 2026-05-14 08:30
千问迎来自己的“SAM3”时刻 | Qwen3-VL-Seg用0.4%参数实现不用SAM也能分割万物！ 2026-05-13 08:30
港科大发布 StarVLA | 6倍数据效率干翻SOTA！！！ 2026-05-13 08:30
英伟达发布123D | 9大数据集秒变"一家人"，自动驾驶的"Hugging Face时刻"来了！ 2026-05-13 08:30

上一页 1 ... 3 4 5 6 下一页