• 简体   /   繁体
基于CLIP的视频时刻检索预训练模型-计算机应用研究2024年12期

基于CLIP的视频时刻检索预训练模型

作者:缪翌 张卫锋 徐领 字体:      

摘 要:视频时刻检索作为下游任务,依赖预训练模型提取特征的能力。近年的研究表明,以CLIP为代表的图像-语言预训练模型在大规模数据集下能学习到有效且通用的语义知识,从而在图像分类等任务上表现出强大的迁移能力(试读)...

计算机应用研究

2024年第12期