已看	年份	名字	简介
✅	2021	CLIP	图片和文本之间的对比学习
	2021	ViLT	第一个摆脱了目标检测的视觉文本模型
	2021	ViLD	CLIP蒸馏帮助开集目标检测
	2021	GLIP	联合目标检测和文本定位
	2021	CLIP4Clip	拿CLIP直接做视频文本retrieval
	2021	ActionCLIP	用多模态对比学习有监督的做视频动作分类
	2021	PointCLIP	3D变2D，巧妙利用CLIP做点云
	2022	LSeg	有监督的开集分割
	2022	GroupViT	只用图像文本对也能无监督做分割
	2022	CLIPasso	CLIP跨界生成简笔画
	2022	DepthCLIP	用文本跨界估计深度
	2022	Audioclip	音频加上CLIP
	2023	A Survey of Knowledge Graph Reasoning	基于图类型的知识图推理综述

Provide feedback

Saved searches