中文名 | 大规模图像数据自动标注算法研究 | 依托单位 | 复旦大学 |
---|---|---|---|
项目类别 | 面上项目 | 项目负责人 | 薛向阳 |
主要研究大规模图像数据的自动标注算法,具体研究内容有:研究具有更好表示和区分能力的图像特征提取算法,其重点是研究特征选取和特征变换;研究用于高层语义特征提取的机器学习方法,其重点是研究半监督学习和大规模数据学习问题;研究图像标记的语义相关性挖掘问题,以进一步提高自动标记的性能,基本思路是利用先验信息、WordNet等知识库和标记在图像同现等统计信息。基于上述算法研究成果,我们将针对日常生活中常见的实体语义对象,从互联网上下载相应的图像,通过学习训练建立起较大规模的视觉语义特征模型库,用于实现图像的自动语义标注;我们还计划研究开发大规模图像数据的自动标注原型演示系统,用于网上大规模图像的搜索和过滤。
批准号 |
60873178 |
项目名称 |
大规模图像数据自动标注算法研究 |
项目类别 |
面上项目 |
申请代码 |
F0605 |
项目负责人 |
薛向阳 |
负责人职称 |
教授 |
依托单位 |
复旦大学 |
研究期限 |
2009-01-01 至 2011-12-31 |
支持经费 |
30(万元) |
选好种植地块选择l0年生以上的即将淘汰的苜蓿草地中土表肥沃的地段,坡度在l5。左右,土表杂草占l5%左右。种植将的野生地木耳切成3 cm的小片,一端埋入选好地块杂草根际附近的土中2 cm,每平方米种植...
在最初的新建工程设置中, 如果选择的是‘纯做法模式’就没有自动套取做法。 如果选择的是‘工程量表模式’就有自动套取做能。
大规模机械土石方与大规模人工土石方的区别,施工主体不同,前者是机械,后者是人工
钢筋自动计数是钢材生产中的一个难题。现有的钢筋自动计数方法包括捆装棒材的图像计数和在线棒材的自动计数,它们的采集、处理方法有较大差别。本文对比分析了面积计数和模板计数这两种方法,指出了它们各自存在的问题以及需要完善和改进之处。
基于道路图像的交通标志识别系统中,关键步骤之一是对图像中的交通标志能够快速有效的识别.文中以具有字符信息的限速标志为例,通过对提取的区域图像进行预处理、旋转校正、字符分割和字符识别,实现了对交通标志中字符信息的自动识别.实验验证:该算法能有效地识别交通标志中的字符信息.
本规范对输变电巡视隐患/缺陷目标识别图像数据集的标注作出要求,为输变电数据集
标注提供参考。
本规范适用于电力系统架空输电线路设备缺陷分级及缺陷标注。
本规范规定图像分析隐患检测与识别系统的标注要求、存储要求、非功能性要求。
本规范的标注要求适用于深度学习算法的数据标注。
随着图像信息资源的迅速增长,图像标注中存在的语义鸿沟问题严重影响了图像信息资源研究与应用的发展,将人对图像的感性认知与自动图像标注有机联系起来协同标注是解决问题的有效途径。本项目综合应用情报学、管理学、计算机科学、认知科学等多学科的理论与方法,首先通过理论分析与用户认知实验,深度剖析图像语义鸿沟的产生过程,明确图像标注的研究需求;进而构建图像信息资源的可视化协同语义标注模型,以图像与文本协同挖掘进行图像标签语义优化,以语义可视化支持用户感性交互,通过用户对图像及图像之间关系的感性认知与计算机语义处理之间的协同,研究消减乃至消除语义鸿沟的图像标注;接着以典型数据集及web实际数据从系统与用户体验两方面对模型进行实证研究;最后探索将模型应用于图像信息资源研究与实践的途径与方式,为有效标注大规模图像信息资源的多层次语义提供理论与应用指导,并将丰富与拓展图像信息资源管理理论与方法。
基于范数
这类方法通过定义
基于稀疏表示
这类方法的核心思想是建立卡通信号字典和纹理信号字典,通过稀疏编码(sparse coding)过程把图像分解到这两个字典上。
基于算子信号
然而,以上分解算法的求解过程复杂且不易对图像作更精细的层级分解。近年Peng和Hwang提出一种基于算子的信号分解算法,该方法可以将1维信号中的局部窄带的成分分解到算子的零空间,这种局部窄带信号成分完全由该算子所刻画。
分解模型为:
式中,
基于算子的信号分解方法可以有效地把1维信号分解到两类奇异线性算子的零空间,这种分解方法可以有效地应用到2维图像信号的卡通纹理分解,使分解得到纹理成分得到具体算子的刻画,这是从算子的思想角度对图像中所包含成分的一种新认识,为更好地认识图像(主要对纹理成分的认识)提供了一条新思路。为了把图像转变为1维信号,采用对图像分块处理的方法,将图像块系列化为1维信号,并结合卡通纹理图像的一般特点,用局部全变差变化率作为自适应参数选择的依据,对图像块进行分解,最后综合各图像块的分解结果得到整个图像的分解结果,为了一定程度克服块效应,采取了块间重叠的措施。同时,把自适应参数当成尺度因子,层级调整尺度因子,反复对剩余信号分解,最后实现了图像的层级分解,对具体图像分解验证了算法的有效性 。
多尺度图像
多尺度多分辨是人类视觉高效、准确工作的重要特征之一。自然产生的图像大多包含大量不同尺度的信息,这些信息在一幅图像中同时出现。而对图像的应用研究往往仅限于某一尺度或某些尺度上的现象,或者只需要某些尺度的信息:其它尺度的信息往往会对处理结果有不良影响,或者增大了处理的难度和复杂性。所以把图像信息按尺度进行分离十分必要。多尺度图像分解可以消除其他无用尺度信息对处理结果的影响,也简化了处理的难度和复杂性:也是图像目标识别和边缘检测等处理过程的预处理方法之一。
经验模分解方法是一种适用于非静态和非线性数据的分解方法,该方法是直接的、后验的和自适应的,该种分解具有完备性和准正交性 。