已看 | 年份 | 名字 | 简介 | 引用 |
---|---|---|---|---|
✅ | 2021 | CLIP | 图片和文本之间的对比学习 | |
2021 | ViLT | 第一个摆脱了目标检测的视觉文本模型 | ||
2021 | ViLD | CLIP蒸馏帮助开集目标检测 | ||
2021 | GLIP | 联合目标检测和文本定位 | ||
2021 | CLIP4Clip | 拿CLIP直接做视频文本retrieval | ||
2021 | ActionCLIP | 用多模态对比学习有监督的做视频动作分类 | ||
2021 | PointCLIP | 3D变2D,巧妙利用CLIP做点云 | ||
2022 | LSeg | 有监督的开集分割 | ||
2022 | GroupViT | 只用图像文本对也能无监督做分割 | ||
2022 | CLIPasso | CLIP跨界生成简笔画 | ||
2022 | DepthCLIP | 用文本跨界估计深度 | ||
2022 | Audioclip | 音频加上CLIP | ||
2023 | A Survey of Knowledge Graph Reasoning | 基于图类型的知识图推理综述 |