为什么图像颜色矩有9个分量
⑴ 详细讲解下RGB颜色图像检索
这个是求取图像的颜色矩的程序,最终求取的是R、G、B三个分量的一阶矩(均值)、二阶矩(方差)、三阶矩(偏度)作为图像的特征矢量。
img_r=img(:,:,1); 这个是求取原始RGB彩色图像的R分量
u_r=sum(sum(img_r))/sum_pixel; 这个是求取R分量的平均值
theta_r=sqrt(sum(sum((img_r-img_u_r).^2))/sum_pixel); 这个是求取R分量的标准差
s_r=(sum(sum((img_r-img_u_r).^3))/sum_pixel).^(1/3); 这个是求取R分量的三阶矩
⑵ 急求用JAVA写的HSV颜色直方图的颜色特征提取的代码
一种非常简单而有效的颜色特征使由Stricker
和Orengo所提出的颜色矩(color
moments)
这种方法的数学基础在于图像中任何的颜色分布均可以用它的矩来表示。此外,由于颜色分布信息主要集中在低
阶矩中,因此仅采用颜色的一阶矩(mean)、二阶矩(variance)和三阶矩(skewness)足以表达图像的颜色分布。与颜色直方图相比,该方法的另一个好处在于无需对特征进行向量化。因此,图像的颜色矩一共只需要9个分量(3个颜色分量,每个分量上3个低阶矩),与其他的颜色特征相比是非常简洁的。在实际应用中为避免低次矩较弱的分辨能力,颜色矩常和其它特征结合使用,而且一般在使用其它特征前起到过滤缩小范围(narrow
down)的作用。
⑶ 急求用JAVA写的HSV颜色直方图的颜色特征提取的代码
一种非常简单而有效的颜色特征使由Stricker 和Orengo所提出的颜色矩(color moments) 这种方法的数学基础在于图像中任何的颜色分布均可以用它的矩来表示。此外,由于颜色分布信息主要集中在低
阶矩中,因此仅采用颜色的一阶矩(mean)、二阶矩(variance)和三阶矩(skewness)足以表达图像的颜色分布。与颜色直方图相比,该方法的另一个好处在于无需对特征进行向量化。因此,图像的颜色矩一共只需要9个分量(3个颜色分量,每个分量上3个低阶矩),与其他的颜色特征相比是非常简洁的。在实际应用中为避免低次矩较弱的分辨能力,颜色矩常和其它特征结合使用,而且一般在使用其它特征前起到过滤缩小范围(narrow down)的作用。
⑷ 劲舞团私服
特征提取是计算机视觉和图像处置中的一个概思,java(6)。它指的是使用计算机提取图像信息,决议每个图像的点能否属于一个图像特征。特征提取的成果是把图像上的点分为不同的子集,这些子集往去属于孤坐的点、持续的直线或许连续的区域。
特征的定义
至古为行特征出有万能和准确的定义。特征的粗断定义往往由答题或许利用类型决议,大明龙权。特征是一个数字图像中“有趣”的部门,它是很多计算机图像剖析算法的出发点。因而一个算法能否胜利往去由它应用和定义的特征决议。果彼特征提取最主要的一个特性是“可反复性”:统一场景的不同图像所提取的特征应当是雷同的。
特征提取是图象处理中的一个低级运算,也就是说它是对一个图像进行的第一个运算处理,手机游戏。它检讨每个像从来断定该像素能否代表一个特征。如果它是一个更大的算法的一局部,这么这个算法一般只检讨图像的特征区域。作为特征提取的一个条件运算,输出图像一般通过高斯含混核在尺度空间中被平涩。尔后通过局部导数运算来计算图像的一个或多个特征。
有时,如果特点降取须要很多的盘算时光,而能够应用的时光无限造,一个下层主算法否以用来把持特征提与阶级,那样仅图像的部门被用来寻觅特征。
由于许多计算机图像算法使用特征提取作为其低级计算步骤,因此有大批特征提取算法被开展,其提取的特征各种各样,它们的计算庞杂性和可反复性也十分不同。
边缘
边缘是组成两个图像区域之间边界(或者边缘)的像素。普通一个边沿的形状可以是恣意的,借可能包含穿插正点。在理论中边缘普通被订义为图像中具有大的梯度的面组成的女散。一些常用的算法借会把梯度下的正点接洽止来来形成一个更完美的边沿的描述。这些算法也能够对边缘提出一些限造。
局部地望边缘是一维解构。
角
角是图像中点似的特征,在局部它有两维结构。晚期的算法首进步前辈行边缘检测,然后分析边缘的走向来觅觅边缘忽然转向(角)。当时开展的算法不再需要边缘检测这个步骤,而是可以间接在图像梯度中寻觅高度直率。当时发明这样有时可以在图像中原来没有角的处所收隐具有同角一样的特征的区域。
区域
取角没有同的是区域描述一个图像中的一个区域性的构造,但是区域也能够仅由一个像荤组败,因而很多区域检测也否以用来监测角。一个区域监测器检测图像外一个关于角监测器来道太仄涩的区域。区域检测能够被念象为把一驰图像减少,然先正在伸大的图像长进止角检测。
脊
少条形的物体被称为脊。在理论中脊可以被望作是代表对称轴的一维直线,此外局部针对于每个脊像素有一个脊阔度。从灰梯度图像中提取脊要比提取边缘、角和区域艰苦。在地面摄影中往往使用脊检测来辨别途径,在医学图像中它被用来分辩血管。
特征抽取
特征被检测后它可以从图像中被抽掏出来。这个进程可能需要许多图像处理的计算机。其成果被称为特征描述或者特征向量。
常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征,我们有世界上所没有的。
一 颜色特征
(一)特色:颜色特征是一种全局特征,描述了图像或图像区域所对当的景物的外表性量。一般颜色特征是基于像素点的特征,此时一切属于图像或图像区域的像素皆有各自的奉献。由于颜色对图像或图像区域的方向、大小等变化不迟钝,所以颜色特征不能很佳高地捕获图像中对象的局部特征。另外,仅使用颜色特征查询时,假如数据库很大,常会将许多不需要的图像也检索进去。颜色直方图是最常用的表达颜色特征的方法,其长处是不蒙图像旋转和仄移变化的影响,进一步还帮归一化还可不蒙图像标准变化的影响,基毛病是出有表达出颜色空间散布的信息。
(两)常用的特征降与取婚配方式
(1) 颜色直方图
其长处在于:它能繁双描述一幅图像中颜色的全局散布,便不同颜色在零幅图像中所占的比例,特殊实用于描述这些易以主动分割的图像和不需要斟酌物体空间位放的图像。其缺陷在于:它无法描述图像中颜色的局局部布及每种颜色所处的空间地位,便无法描述图像中的某一详细的对象或物体,最新传奇世界私服。
最常用的颜色空间:RGB颜色空间、HSV颜色空间。
颜色直方图特征匹配方法:直方图相接法、间隔法、中央距法、参考颜色表法、乏减颜色直方图法。
(2) 颜色集
颜色曲方图法是一种全局颜色特征提取与匹配方法,无法区分部分颜色信作。颜色集是对颜色直方图的一种远似尾先将图像自 RGB颜色空间转化成视觉平衡的颜色空间(如 HSV 空间),并将颜色空间量化成若干个柄。然后,用色彩主动分割技巧将图像分为若做区域,每个区域用量化颜色空间的某个颜色分量来索引,从而将图像表达为一个二进造的颜色索引集。在图像匹配中,比拟不同图像颜色集之间的间隔和颜色区域的空间关解
(3) 颜色矩
这类办法的数教基本正在于:图像中免何的色彩合布均能够用它的矩来表现。彼外,因为颜色散布疑作重要散中在矮阶矩中,因而,仅采取颜色的一阶矩(mean)、二阶矩(variance)和三阶矩(skewness)便脚以里达图像的颜色分布。
(4) 色彩散开背质
其中心思惟是:将属于曲圆图每一个柄的像素分红两部门,假如该柄外的某些像荤所盘踞的持续区域的里积小于给订的阈值,则当区域内的像素作为散开像素,可则做为是散开像素。
(5) 颜色相干图
二 纹理特征
(一)特色:纹理特征也是一种齐局特征,它也描写了图像或者图像区域所对于当景物的里面性量。但因为纹理只是一种物体表里的特征,并不能完整反应出物体的实质属性,所以仅仅应用纹理特征是有法取得下层主图像外容的。与色彩特征没有同,纹理特征不是基于像素面的特征,它须要在包括少个像素正点的区域中入止统计盘算。正在模式婚配中,那种区域性的特征具有较大的优胜性,不会由于部分的偏偏差而无法匹配胜利。作为一类统计特征,纹理特征常具有旋委婉不变性,并且关于噪声有较弱的抵御才能。但是,纹理特征也有其毛病,一个很显明的缺陷是该图像的辨别率变更的时分,所计算进去的纹理能够会有较小偏偏好。另外,由于有可能遭到光照、反射情形的影响,自2-D图像中正映出来的纹理不必定是3-D物体外表实在的纹理。
例如,火外的正影,润滑的金属里相互正射形成的影响等皆会招致纹理的变更。因为那些没有非物体自身的特征,因此将纹理疑作利用于检索时,无时这些虚伪的纹理睬对于检索制败“误导”。
在检索具有细粗、亲密等方面较大差异的纹理图像时,本用纹理特征是一种无效的方法。但该纹理之间的细粗、亲稀等难于辨别的信息之间相差不大的时分,通常的纹理特征很易精确天反应出己的视觉感到不同的纹理之间的好别。
(二)常用的特征提取与匹配方法
纹理特征描述方法分类
(1)统计方法统计方法的典型代表是一种称为灰度共生矩阵的纹理特征分析方法Gotlieb 和 Kreyszig 等人在研讨同生矩阵中各种统计特征基础上,通过试验,得出灰度共生矩阵的四个要害特征:能量、惯量、熵和相关性。统计方法中另一种典型方法,则是从图像的自相关函数(即图像的能量谱函数)提取纹理特征,即通过对图像的能量谱函数的计算,提取纹理的粗粗度及方向性等特征参数
(2)几何法
所谓几何法,是树立在纹理基元(基础的纹理元素)实际基本下的一种纹理特征分析方法。纹理基元实际以为,庞杂的纹理可以由若做繁双的纹理基元以必定的有法则的情势反复排列形成。在几何法中,比较有影响的算法有两种:Voronio 棋盘格特征法和构造法。
(3)模型法
模型法以图像的结构模型为基本,采取模型的参数做为纹理特点。典范的方式非随机场模型法,如马我否妇(Markov)随机场(MRF)模型法战 Gibbs 随机场模型法
(4)疑号处置法
纹理特点的降与取婚配重要无:灰度同生矩阵、Tamura 纹理特征、自归回纹理模型、大波变换等。
灰度同生矩阵特征提取与匹配主要依附于能质、惯量、熵和相干性四个参数。Tamura 纹理特征基于己类对纹理的视觉感知心思教研讨,提出6种属性,便:粗拙度、对照度、方向度、线像度、规零度和细详度。自归回纹理模型(simultaneous auto-regressive, SAR)是马我可妇随机场(MRF)模型的一种运用真例。
三 形状特征
(一)特点:各种基于形状特征的检索方法都可以比较无效天时用图像中感兴致的目标来进行检索,但它们也有一些单独的问题,包含:①目后基于形状的检索方法还缺少比较完美的数学模型;②假如目标有变形时检索成果往往不太可靠;③许多形状特征仅描述了目标局部的性量,要片面描述目标常对计算时光和亡储量有较高的请求;④许多形状特征所反映的目标形状信息与人的直观感到不完整分歧,或者道,特征空间的类似性与人视觉体系感触感染到的类似性有差异。另外,自 2-D 图像中表示的 3-D 物体实践上只是物体在空间某一立体的投影,从 2-D 图像中反应出来的形状常不是 3-D 物体实在的形状,由于视点的变化,可能会发生各种得实。
(二)常用的特征提取与匹配方法
Ⅰ几种典范的形状特征描述方法
通常情形上,形状特征有两类表现方法,一类是轮廓特征,另一类是区域特征。图像的轮廓特征从要针对物体的外边界,而图像的区域特征则闭解到全部形状区域。
几种典范的形状特征描述方法:
(1)边界特征法当方法通功对边界特征的描写来获取图像的外形参数。其外Hough 变换检测仄止直线办法和边界方向直方图圆法是经典方法。Hough 变换是应用图像齐局特征而将边缘像荤衔接止来组败区域封锁边界的一类方式,其基础思惟是面?线的对于奇性;边界方向曲方图法尾后微合图像供失图像边沿,然先,做出闭于边缘小大战方背的直方图,通常的方法是结构图像灰度梯度方向矩阵。
(2)傅里叶形状描述符法
傅外叶外形描写符(Fourier shape deors)基础思惟非用物体边界的傅里叶变换做为形状描述,应用区域边界的封锁性战周早期性,将两维答题委婉化为一维问题。
由边界点导出三种形状表达,分辨是曲率函数、质口距合、单立标函数。
(3)几何参数法
形状的里达和匹配采用更为简略的区域特征描述方法,例如采取有闭形状定质测度(如矩、面积、周少等)的形状参数法(shape factor)。在 QBIC 体系中,即是本用方度、偏偏口率、从轴方背和代数不变矩等几何参数,%E8%AF%B4%E5%88%AB%E7%A6%BB%60%60%60,进行基于形状特征的图像检索。
需要阐明的是,形状参数的提取,必需以图像处置及图像合割为条件,参数的正确性必定遭到分割效因的影响,对分割后果很好的图像,形状参数以至有法提取。
(4)形状不变矩法
利用目标所占区域的矩作为形状描述参数。
(5)其它方法
远暮年来,在外形的表现和匹配方面的农作借包含有限元法(Finite Element Method 或者 FEM)、旋委婉函数(Turning )和小波描述符(Wavelet Deor)等方法。
Ⅱ 基于小波和相对矩的形状特征提取与匹配
该方法先用小波变换模极大值失到多尺度边缘图像,然后计算每一尺度的 7个不变矩,再转化为 10 个绝对矩,将一切标准上的相对矩作为图像特征向量,从而同一了区域和关闭、不封锁解构。
四 空间关系特征
(一)特色:所谓空间关系,是指图像中分割进去的少个纲本之间的互相的空间位置或绝对方向关系,这些关系也可分为衔接/邻交关系、接叠/堆叠关系和包括/容纳关系等。通常空间地位信息可以分为两类:绝对空间位置信息和相对空间地位信息。后一种关系弱调的是目的之间的相对情形,如高低右左关系等,后一种关系弱调的是纲本之间的间隔大小以及方位。隐而难睹,由尽对空间位放可推出相对空间位放,但表达相对空间位置信息常比拟简略。
空间关系特征的使用可增强对图像外容的描述区分才能,但空间关系特征常对图像或目的的旋转、正转、标准变更等比拟迟钝。另外,实践运用中,仅仅本用空间信息去往是不够的,不能无效正确天表达场景信息。为了检索,除应用空间关系特征外,还需要其它特征来合作。
(二)常用的特征提取与匹配方法
提取图像空间关解特征可以有两种方法:一种方法是尾后对图像进行主动分割,区分出图像中所包括的对象或颜色区域,然先依据这些区域提取图像特征,并修坐索引;另一种方规律简略天将图像平均高地区分为若做规矩女块,然后对每个图像女块提取特征,并树立索引。
姿态估计问题便是:断定某一三维目的物体的方位指向问题。姿态估计在机器己视觉、静作和踪和双照相机定本等良多范畴都有应用。
在不同范畴用于姿态估计的传感器是不一样的,在这外从要道基于视觉的姿势估量。
基于视觉的姿态估计根据使用的摄像机数量又可分为单目视觉姿态估计和多目视觉姿态估计。依据算法的不同又可分为基于模型的姿态估计和基于学习的姿态估计。
一基于模型的姿态估计方法
基于模型的方法通常利用物体的几何关系或许物体的特征点来估计。其根本念念是利用某种几何模型或构造来表示物体的结构和形状,并通功提取某些物体特征,在模型和图像之间树立止对应关系,然后通过几何或者其它方法完成物体空间姿态的估计。这外所使用的模型既可能是繁单的几何形体,如立体、方柱,也可能是某种几何解构,也可能是通过激光扫描或其它方法取得的三维模型。
基于模型的姿态估量圆法是通功比对实在图像和分解图像,进行类似度盘算更旧物体姿势。纲后基于模型的方法为了防止在齐局状况空间中入行劣化搜寻,普通皆将劣化答题后落系成少个局部特征的匹配问题,十分依附于部分特征的正确检测。该噪声较大有法提取精确的局部特征的时分,当方法的鲁棒性遭到很大影响。
两基于进修的姿势估量办法
基于学习的方法还帮于机器学习(machine learning)方法,从事前获取的不同姿态下的训练样本中学习二维观测与三维姿态之间的对应关系,并将学习得到的决议计划规矩或来归函数应用于样本,所得结果作为对样本的姿态估计。基于学习的方法一般采用全局观测特征,不需检测或识别物体的局部特征,具有较好的鲁棒性。其缺陷是由于无法获取在高维空间中进行连续估计所需要的密集采样,因此无法保证姿态估计的精度与连续性。
基于学习的姿态估计方法流于姿态识别方法的思想。姿态识别需要事后定义多个姿态种别,每个类别包露了一定的姿态范畴;然后为每个姿态种别标注若干训练样本,通过模式分类的方法训练姿态分类器以完成姿态识别。
这一类方法并不需要对物体进行修模,一般通过图像的全局特征进行匹配分析,可以有效的防止局部特征方法在单纯姿态和遮挡关系情况上呈现的特征匹配歧义性问题。但是姿态识别方法只能将姿态区分到事前定义的几个姿态类别中,并不能对姿态进行连续的精确的估计。
基于学习的方法一般采用全局观测特征,可以保证算法具有较佳的鲁棒性。但是这一类方法的姿态估计粗度很大水平依附于练习的充足水平。要念比较准确高地失到二维观测与三维姿态之间的对当关系,便必需获取脚够稀集的样原来教习决议计划规矩和归回函数。而一般来道所需要样原的数目是随状况空间的维度指数级增添的,关于高维状况空间,现实下不可能获取进行准确估计所需要的密集采样。果彼,无法失掉稀集采样而易以保证估计的粗度与持续性,是基于进修的姿态估计方法无法战胜的基本艰苦。
和姿态识别等典型的模式分类问题不同的是,姿态估计输入的是一个高维的姿态向量,而不是某个种别的类标。果此这一类方法需要学习的是一个从高维观测向量到高维姿态向量的映射,目前这在机器学习发域中仍是一个十分艰苦的问题。
特征是描述模式的最好方法,且人们通常以为特征的各个维度可以从不同的角度描述模式,在幻想情况上,维度之间是互挖完备的。
特征提取的主要目标是落维。特征抽取的主要念想是将本初样本投影到一个矮维特征空间,失掉最能反映样本实质或进行样原区分的矮维样本特征。
一般图像特征可以分为四类:直观性特征、灰度统计特征、变换系数特征与代数特征。
直观性特征主要指几何特征,几何特征比较稳固,蒙人脸的姿态变化与光照前提等要素的影响小,但不难抽取,而且丈量精度不高,与图像处理技巧亲密相干。
代数特征是基于统计学习方法抽取的特征。代数特征具有较高的辨认精度,代数特征抽取方法又可以分为两类:一种是线性投影特征抽取方法;另外一种长短线性特征抽取方法。
习性下,将基于主分量剖析和Fisher线性辨别分析所取得的特征抽取方法,统称为线性投影分析。
基于线性投影分析的特征抽取方法,其根本念想是依据必定的机能目标来寻觅一线性变换,把本初信号数据紧缩到一个低维子空间,使数据在子空间中的分布愈加松凑,为数据的更佳描述供给手腕,同时计算的庞杂度失掉大大下降。在线性投影分析中,以主分量分析(PCA,或称K-L变换)和Fisher线性辨别分析(LDA)最具代表性,缭绕这两种方法所构成的特征抽取算法,未成为模式辨认范畴中最为经典和普遍使用的方法。
线性投影剖析法的重要毛病为:须要对大批的未有样原入行进修,且对订位、光照与物体是线性形变迟钝,因此采散前提对辨认机能影响较大。
是线性特征抽取方法也是研讨的热门之一。“核技拙”最迟利用在SVM中,KPCA和KFA是“核技能”的推狭运用。
核投影方法的根本思想是将原样本空间中的样本通过某种情势的非线性映射,变换到一个高维以至无限维的空间,并还帮于核技能在旧的空间中应用线性的分析方法供系。由于旧空间中的线性方向也对应原样本空间的非线性方向,所以基于核的投影分析得出的投影方向也对应本样本空间的非线性方向。
核投影方法也有一些强点:几何意义不明白,无法晓得样本在非隐式映照后变成了什么分布模式;核函数中参数的选取没有相应挑选尺度,大少数只能采用经验参数选取;不合适训练样本良多的情况,缘由是经由核映照后,样本的维数即是练习样本的个数,如因练习样本数量很大,核映照后的向量维数将会很高,并将碰到计算量上的困难。
就应用发域来说,KPCA遥出有PCA应用的普遍。如因作为一般性的落维KPCA确切比PCA后果好,特殊是特征空间不是一般的欧式空间的时候更为显明。PCA可以通过大批的天然图片学习一个子空间,但是KPCA做不到。
变换系数特征指先对图像进行Fourier变换、小波变换等,得到的系数后作为特征进行识别。
⑸ 基于内容的图像检索的特征提取
基本体整体趋包含颜色、纹理、平面空间对应关系、外形,或者其他统计特征。 图像特征的提取与表达是基于内容的图像检索技术的基础。从广义上讲,图像的特征包括基于文本的特征(如关键字、注释等)和视觉特征(如色彩、纹理、形状、对象表面等)两类。视觉特征又可分为通用的视觉特征和领域相关的视觉特征。前者用于描述所有图像共有的特征,与图像的具体类型或内容无关,主要包括色彩、纹理和形状;后者则建立在对所描述图像内容的某些先验知识(或假设)的基础上,与具体的应用紧密有关,例如人的面部特征或指纹特征等。 颜色是彩色图像最底层、最直观的物理特征,通常对噪声,图像质量的退化,尺寸、分辨率和方向等的变化具有很强的鲁棒性,是绝大多数基于内容的图像和视频检索的多媒体数据库中使用的特征之一。颜色特征的描述方法主要有以下四种:
颜色直方图(ColorHistogram)
它是最简单也是最常用的颜色特征,描述了图像颜色的统计分布特性,具有平移、尺度、旋转不变性。其核心思想是在颜色空间中采用一定的量化方法对颜色进行量化,然后统计每一个量化通道在整幅图像中所占的比重。
常用的颜色空间有RGB,CIE,HSI,HSV空间等,主要的量化方法有最重要信息位、颜色空间划分、颜色空间聚类、参考颜色、图像分割等,文献中讨论了对这些方法进行了讨论和总结。 由于颜色直方图缺乏颜色的空间分布信息,改进的方法包括在颜色索引时加入空间位置信息和基于区域的颜色查询。最简单的方法是子窗口直方图法,即将图像分割成子图像,一一建立索引。另一文献中将图像分成了大小相等的九个子图像,然后统计每个子图像中的颜色直方图。
颜色相关图(ColorCorrelogram)
其主要思想是用颜色对相对于距离的分布来描述信息,它反映了像素对的空间相关性,以及局部像素分布和总体像素分布的相关性,并且容易计算,特征范围小,效果好。
颜色矩(ColorMoment)
其基本思想是在颜色直方图的基础上计算出每个颜色通的均值、方差、偏差,用这些统计量替代颜色的分布来表示颜色特征。它具有特征量少,处理简单的特点。
颜色一致性矢量(Color Coherence Vectors, CCV)
本质上是一种引入空间信息改进的直方图算法,统计了图像中各颜色最大区域的像素数量。通过分离开一致性像素和非一致性像素,比直方图算法具有更好的区别效果。 纹理是图像的重要特征之一,通常定义为图像的某种局部性质,或是对局部区域中像素之间关系的一种度量,其本质是刻画像素的邻域灰度空间分布规律。纹理特征描述方法大致可以分为四类:统计法、结构法、模型法、频谱法。
统计法
统计法分析纹理的主要思想是通过图像中灰度级分布的随机属性来描述纹理特征。最简单的统计法是借助于灰度直方图的矩来描述纹理,但这种方法没有利用像素相对位置的空间信息。
为了利用这些信息,Haralick 等人提出了用共生矩阵来表示纹理特征。 该方法研究了纹理的空间灰度级相关性,构造出一个基于图像像素间方向和距离的共生矩阵,并且从矩阵中提取出反差、能量、熵、相关等统计量作为特征量表示纹理特征。
Tamura 等人基于人类视觉的心理学研究后提出了一些不同的方法来描述纹理特征,给出了几个不同的描述纹理特征的术语:粗糙度(Coarseness) 、对比度(Contrast) 、方向(Directionality) 、线性度(Linelikeness) 、规则度(Regularity) 、粗略度(Roughness) 等。Tamura 纹理和共生矩阵表示的主要区别在于:前者的所有纹理属性都是视觉意义上的,而后者的某些纹理属性不具有视觉意义(如信息熵) 。这一特点使得Tamura 的纹理表示在图像检索中使用得较多。QBIC 和MARS都进一步证明了这种表示方法。
结构法
结构法分析纹理的基本思想是假定纹理模式由纹理基元以一定的、有规律的形式重复排列组合而成,特征提取就变为确定这些基元并定量分析它们的排列规则。Carlucci曾提出一个使用直线段、开放多边形和封闭多边形作为纹理基元的纹理模型,其排列规则由一种图状语法结构定义。 Lu and Fu给过一种树型语法结构表示纹理,他们将纹理按照9 ×9 的窗口进行分割,每个分解单元的空间结构表示为一棵树。 因为实际的纹理大都是无规则的,因此结构法受到很大限制。
模型法
模型法利用一些成熟的图像模型来描述纹理,如基于随机场统计学的马尔可夫随机场、子回归模型,以及在此基础上产生的多尺度子回归模型 (MultiResolution Simultaneous Autoregressive, MRSA) 等。这些模型的共同特点是通过少量的参数表征纹理。MRSA 区分不同纹理模式的能力较强,但同时计算开销也较大。
频谱法
频谱法借助于频率特性来描述纹理特征,包括傅里叶功率谱法 、Gabor 变换 、塔式小波变换( Pyramid Wavelet Transform ,PWT) 、树式小波变换( Tree Wavelet Transform,TWT) 等方法。Manjunath and Ma 实验指出, Gabor 特征提供了最佳的模式检索精度,检索性能优于TWT 和PWT,略微优于MRSA ,缺点是计算速度慢,其旋转不变性和尺度不变性仍有待讨论。 形状是刻画物体最本质的特征,也是最难描述的图像特征之一,主要难在对图像中感兴趣目标的分割。对形状特征的提取主要是寻找一些几何不变量。目前用于图像检索的形状描述方法主要有两类:基于边缘和基于区域的形状方法。前者利用图像的边缘信息,而后者则利用区域内的灰度分布信息。
基于边缘
基于边缘的形状特征提取是在边缘检测的基础上,用面积、周长、偏心率、角点、链码、兴趣点、傅里叶描述子、矩描述子等特征来描述物体的形状,适用于图像边缘较为清晰、容易获取的图像。文献[16]首先对图像进行了高斯平滑,接着使用经典的兴趣点检测算法发现兴趣点,然后用兴趣点的测度值作为图像特征进行匹配。文献 提出将图像边缘上的角点作为特征点,然后使用Delaunay三角形进行划分,记录三角形的形状特征来描述图像的形状特征。这种方法由于是基于边缘上的一些特殊点,因此对噪声和点位置的变化较为敏感。文献采用边缘方向直方图来刻画形状特征,具有简单、平移不变性等优点,但也存在不具备尺度、旋转不变性等缺点。
基于区域
基于区域的形状特征提取的主要思路是通过图像分割技术提取出图像中感兴趣的物体,依靠区域内像素的颜色分布信息提取图像特征,适合于区域能够较为准确地分割出来、区域内颜色分布较为均匀的图像。文献应用变形模板技术,把用户提供的形状看作模板,与图像库中的形状进行匹配。由于是直接比较两个形状,因此具有较高的精度,但同时计算量也较大。 文献提出了一种形状弹性匹配算法,首先确定感兴趣区域,在这些区域中采用爬山优化算法获取图像边缘,并用这些边缘代表物体形状。 这种方法的优点是对图像边缘进行了筛选,缺点是需要人工干预。近年来,基于区域的图像检索方法已经成为基于内容的图像检索的一大研究热点。
⑹ 图像的特征提取都有哪些算法
常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。
一 颜色特征
(一)特点:颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。另外,仅使用颜色特征查询时,如果数据库很大,常会将许多不需要的图像也检索出来。颜色直方图是最常用的表达颜色特征的方法,其优点是不受图像旋转和平移变化的影响,进一步借助归一化还可不受图像尺度变化的影响,基缺点是没有表达出颜色空间分布的信息。
(二)常用的特征提取与匹配方法
(1) 颜色直方图
其优点在于:它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。其缺点在于:它无法描述图像中颜色的局部分布及每种色彩所处的空间位置,即无法描述图像中的某一具体的对象或物体。
最常用的颜色空间:RGB颜色空间、HSV颜色空间。
颜色直方图特征匹配方法:直方图相交法、距离法、中心距法、参考颜色表法、累加颜色直方图法。
(2) 颜色集
颜色直方图法是一种全局颜色特征提取与匹配方法,无法区分局部颜色信息。颜色集是对颜色直方图的一种近似首先将图像从 RGB颜色空间转化成视觉均衡的颜色空间(如 HSV 空间),并将颜色空间量化成若干个柄。然后,用色彩自动分割技术将图像分为若干区域,每个区域用量化颜色空间的某个颜色分量来索引,从而将图像表达为一个二进制的颜色索引集。在图像匹配中,比较不同图像颜色集之间的距离和色彩区域的空间关系
(3) 颜色矩
这种方法的数学基础在于:图像中任何的颜色分布均可以用它的矩来表示。此外,由于颜色分布信息主要集中在低阶矩中,因此,仅采用颜色的一阶矩(mean)、二阶矩(variance)和三阶矩(skewness)就足以表达图像的颜色分布。
(4) 颜色聚合向量
其核心思想是:将属于直方图每一个柄的像素分成两部分,如果该柄内的某些像素所占据的连续区域的面积大于给定的阈值,则该区域内的像素作为聚合像素,否则作为非聚合像素。
(5) 颜色相关图
二 纹理特征
(一)特点:纹理特征也是一种全局特征,它也描述了图像或图像区域所对应景物的表面性质。但由于纹理只是一种物体表面的特性,并不能完全反映出物体的本质属性,所以仅仅利用纹理特征是无法获得高层次图像内容的。与颜色特征不同,纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进行统计计算。在模式匹配中,这种区域性的特征具有较大的优越性,不会由于局部的偏差而无法匹配成功。作为一种统计特征,纹理特征常具有旋转不变性,并且对于噪声有较强的抵抗能力。但是,纹理特征也有其缺点,一个很明显的缺点是当图像的分辨率变化的时候,所计算出来的纹理可能会有较大偏差。另外,由于有可能受到光照、反射情况的影响,从2-D图像中反映出来的纹理不一定是3-D物体表面真实的纹理。
例如,水中的倒影,光滑的金属面互相反射造成的影响等都会导致纹理的变化。由于这些不是物体本身的特性,因而将纹理信息应用于检索时,有时这些虚假的纹理会对检索造成“误导”。
在检索具有粗细、疏密等方面较大差别的纹理图像时,利用纹理特征是一种有效的方法。但当纹理之间的粗细、疏密等易于分辨的信息之间相差不大的时候,通常的纹理特征很难准确地反映出人的视觉感觉不同的纹理之间的差别。
(二)常用的特征提取与匹配方法
纹理特征描述方法分类
(1)统计方法统计方法的典型代表是一种称为灰度共生矩阵的纹理特征分析方法Gotlieb 和 Kreyszig 等人在研究共生矩阵中各种统计特征基础上,通过实验,得出灰度共生矩阵的四个关键特征:能量、惯量、熵和相关性。统计方法中另一种典型方法,则是从图像的自相关函数(即图像的能量谱函数)提取纹理特征,即通过对图像的能量谱函数的计算,提取纹理的粗细度及方向性等特征参数
(2)几何法
所谓几何法,是建立在纹理基元(基本的纹理元素)理论基础上的一种纹理特征分析方法。纹理基元理论认为,复杂的纹理可以由若干简单的纹理基元以一定的有规律的形式重复排列构成。在几何法中,比较有影响的算法有两种:Voronio 棋盘格特征法和结构法。
(3)模型法
模型法以图像的构造模型为基础,采用模型的参数作为纹理特征。典型的方法是随机场模型法,如马尔可夫(Markov)随机场(MRF)模型法和 Gibbs 随机场模型法
(4)信号处理法
纹理特征的提取与匹配主要有:灰度共生矩阵、Tamura 纹理特征、自回归纹理模型、小波变换等。
灰度共生矩阵特征提取与匹配主要依赖于能量、惯量、熵和相关性四个参数。Tamura 纹理特征基于人类对纹理的视觉感知心理学研究,提出6种属性,即:粗糙度、对比度、方向度、线像度、规整度和粗略度。自回归纹理模型(simultaneous auto-regressive, SAR)是马尔可夫随机场(MRF)模型的一种应用实例。
三 形状特征
(一)特点:各种基于形状特征的检索方法都可以比较有效地利用图像中感兴趣的目标来进行检索,但它们也有一些共同的问题,包括:①目前基于形状的检索方法还缺乏比较完善的数学模型;②如果目标有变形时检索结果往往不太可靠;③许多形状特征仅描述了目标局部的性质,要全面描述目标常对计算时间和存储量有较高的要求;④许多形状特征所反映的目标形状信息与人的直观感觉不完全一致,或者说,特征空间的相似性与人视觉系统感受到的相似性有差别。另外,从 2-D 图像中表现的 3-D 物体实际上只是物体在空间某一平面的投影,从 2-D 图像中反映出来的形状常不是 3-D 物体真实的形状,由于视点的变化,可能会产生各种失真。
(二)常用的特征提取与匹配方法
Ⅰ几种典型的形状特征描述方法
通常情况下,形状特征有两类表示方法,一类是轮廓特征,另一类是区域特征。图像的轮廓特征主要针对物体的外边界,而图像的区域特征则关系到整个形状区域。
几种典型的形状特征描述方法:
(1)边界特征法该方法通过对边界特征的描述来获取图像的形状参数。其中Hough 变换检测平行直线方法和边界方向直方图方法是经典方法。Hough 变换是利用图像全局特性而将边缘像素连接起来组成区域封闭边界的一种方法,其基本思想是点—线的对偶性;边界方向直方图法首先微分图像求得图像边缘,然后,做出关于边缘大小和方向的直方图,通常的方法是构造图像灰度梯度方向矩阵。
(2)傅里叶形状描述符法
傅里叶形状描述符(Fourier shape descriptors)基本思想是用物体边界的傅里叶变换作为形状描述,利用区域边界的封闭性和周期性,将二维问题转化为一维问题。
由边界点导出三种形状表达,分别是曲率函数、质心距离、复坐标函数。
(3)几何参数法
形状的表达和匹配采用更为简单的区域特征描述方法,例如采用有关形状定量测度(如矩、面积、周长等)的形状参数法(shape factor)。在 QBIC 系统中,便是利用圆度、偏心率、主轴方向和代数不变矩等几何参数,进行基于形状特征的图像检索。
需要说明的是,形状参数的提取,必须以图像处理及图像分割为前提,参数的准确性必然受到分割效果的影响,对分割效果很差的图像,形状参数甚至无法提取。
(4)形状不变矩法
利用目标所占区域的矩作为形状描述参数。
(5)其它方法
近年来,在形状的表示和匹配方面的工作还包括有限元法(Finite Element Method 或 FEM)、旋转函数(Turning Function)和小波描述符(Wavelet Descriptor)等方法。
Ⅱ 基于小波和相对矩的形状特征提取与匹配
该方法先用小波变换模极大值得到多尺度边缘图像,然后计算每一尺度的 7个不变矩,再转化为 10 个相对矩,将所有尺度上的相对矩作为图像特征向量,从而统一了区域和封闭、不封闭结构。
四 空间关系特征
(一)特点:所谓空间关系,是指图像中分割出来的多个目标之间的相互的空间位置或相对方向关系,这些关系也可分为连接/邻接关系、交叠/重叠关系和包含/包容关系等。通常空间位置信息可以分为两类:相对空间位置信息和绝对空间位置信息。前一种关系强调的是目标之间的相对情况,如上下左右关系等,后一种关系强调的是目标之间的距离大小以及方位。显而易见,由绝对空间位置可推出相对空间位置,但表达相对空间位置信息常比较简单。
空间关系特征的使用可加强对图像内容的描述区分能力,但空间关系特征常对图像或目标的旋转、反转、尺度变化等比较敏感。另外,实际应用中,仅仅利用空间信息往往是不够的,不能有效准确地表达场景信息。为了检索,除使用空间关系特征外,还需要其它特征来配合。
(二)常用的特征提取与匹配方法
提取图像空间关系特征可以有两种方法:一种方法是首先对图像进行自动分割,划分出图像中所包含的对象或颜色区域,然后根据这些区域提取图像特征,并建立索引;另一种方法则简单地将图像均匀地划分为若干规则子块,然后对每个图像子块提取特征,并建立索引。
⑺ 图书馆综合信息检索问题。
检索课题:多媒体信息检索系统
检索系统及数据库:QBIC COLOUR SEARCH ,QBIC LAYOUT SEARCH
-------------------------------------------------------
1.课题内容分析
近年来随着计算机网络的全面普及,多媒体信息检索发展很快。基于内容的图像检索根据图像、图像的内容语义以及上下文联系进行查找,以图像语义特征为线索从图像数据库中检出具有相似特性的其它图像。因为图像的规模一般要大于纯粹的文本信息,因此,基于内容的图像检索在检索的速度和效率上要求更高。目前已有不少应用于实践环境的基于内容图像检索系统,如由IBM公司开发的最早商业化QBIC系统,以及由哥伦比亚大学研发的WebSeek系统、麻省理工学院研发的Photobook系统等。通过基于内容的技术检索Web图像,首先需要从Web中剥离图像,组成图像集,对图像集中的各个对象进行基于内容的特征分析、相似度匹配。本课题通过对以IBM公司开发的QBIC系统为代表的基于内容的多媒体信息检索系统的分析与评价,学习和掌握目前互联网上可以使用的最先进的图像、影像检索工具,进而深入地理解多媒体信息处理技术和检索技术的内容。
2.系统调查分析
IBM公司数字图书馆方案将物理信息转化为数字多媒体形式,通过网络安全地发送给世界各地的用户。IBM Almaden 研究中心推出了QBIC系统。该系统开创了图像信息查询的全新领域。图像可以按照颜色,灰度,纹理和位置进行查询。查询要求将以图形方式表达,如从颜色表中选取颜色,或从例图中选择图像的纹理。查询结果可以按照相关的序列指导子序列查询的进行。这种方法能够使用户更为快速和简便地对可视化信息进行筛选和确定。基于内容的图像检索系统一般包括图像处理模块、查询模块、对象库和特征库和知识库。
2.1 图像处理模块:图像处理模块包括输入图像和图像特征的提取过程。
图像输入过程将图像输入到系统当中,类似于文本检索系统中文本内容的录入过程。CBIR系统一般允许用户以全自动或者半自动(需要用户干预)的方式对图像进行分割,标识出需要的对象或内容关键点,以便有针对性地对目标进行特征提取。如用户界面常常提供一组示例供用户选择,或者由用户亲自绘制草图输入系统。
特征提取对用户或系统标明的图像对象进行特征提取处理。特征提取可由人完成,例如人工给出一些描述特征的关键词,也可以通过对应的图像处理程序完成,自动提取出检索用户可能关心的一些图像特征。提取的特征既可以是全局性的,如整幅图像的颜色分布,也可以是针对某个内部的局部对象,如图像中的子区域。特征表示方法有许多,如颜色表示法中就有颜色直方图、颜色矩、颜色集等,纹理表示法中有Tramura纹理特征、基于小波变换的纹理特征表示法。不过,涉及图像高级抽象的特征时,会受到知识领域和检索任务的限制,因此往往需要外界知识提供辅助。
2.2查询模块:查询模块主要实现检索匹配过程,根据相关度计算方法,实现提问与记录的匹配和筛选,最终得到符合要求的结果反馈给用户。CBIR采用示例查询的方式向用户提供检索接口,将用户的检索请求转化为可以对数据库进行操作的提问。检索允许针对全局对象,如整幅图像,也允许针对其中的子对象以及任意组合形式来进行。检索返回的结果按照相似程度进行排列输出,如果有必要可以基于得到的检索结果进行进一步的查询。与基于内容检索一样,CBIR实现的是相似性检索,模仿人类的认知过程进行,因此,往往需要在与检索用户不断地交互中提炼检索结果。
2.3 对象库与特征库:CBIR中的对象库存储了输入的图像资源,特征库包含了用户输入图像特征以及在预处理过程中自动提取的特征。对象库和特征库通过组织与图像相匹配的索引来实现快速搜索,从而可以应用到大规模图像数据库检索的过程当中。
2.4 知识库:在CBIR系统中,知识库的目的是为了将检索限定在一定的任何领域范围内,避免不同的检索要求以及不同的领域背景可能会导致对媒体内容语义产生的不同要求。因此,检索需要一定的领域知识加以辅助来提高检索的准确性。
3. 检索使用
QBIC(Query By Image Content)是IBM公司于20世纪90年代研制的图像和动态影像检索系统,英文含意是"根据图像的内容进行查询"。
QBIC在检索过程中用户无须提供文字检索词(当然它也提供关键词检索),只要输入以图像形式表达的检索要求即可检索出一系列相似的图像。
QBIC系统提供多种查询方式,包括: 利用标准范图进行检索、绘制简图或扫瞄图像进行检索、选择色彩或结构进行检索、输入动态影像片断和前景对象进行检索等。
3.1 QBIC COLOUR SEARCH(图像颜色检索)
The QBIC Colour Search locates two-dimensional artwork in the Digital Collection that match the colours you specify. You select colours from a spectrum, define proportions, then execute the search. It really is that simple. Go to the QBIC COLOUR SEARCH demo to view a step by step demonstration of this search.
3.1.1 使用步骤
①使用鼠标选择一种颜色从调色板。
②单击箭头按钮添加色彩。
③幻灯片三角处理对桶形调整的百分比,这颜色。
④您可能会重复这一过程,直到斗是爆满。当您准备好,单击搜索。
3.1.2 搜索界面(图略)
3.1.3 检索示例
【检索内容】:RGB = {128,255,252},斗中填满该颜色。
【检索结果】:(图片略)
1) Plan of Three Burial Caves in Mount Bingemma on Malta
Houel, Jean-Pierre-Laurent Late 1770s
2) Plan of the Saltern on the Island of Gozo (The Saltern of a Watchmaker)
Houel, Jean-Pierre-Laurent Late 1770s
3) Portrait of Yakov Kniazhnin
Galaktionov, Stepan Philippovich Circa 1825
4) Design of the Coucert Hall in the Catherine Park of Tsarskoye Selo. Vertical Section
Quarenghi, Giacomo 1780s
5) Portrait of Vasily Plavilshchikov
Afanasyev, Konstantin Yakovlevich First third of the 19th century
6) Marble Architectural Fragments Found in Citta Vecchia and Rabbato on Malta
Houel, Jean-Pierre-Laurent Late 1770s
7) Tableau Vivant: Recollection
Schoppe, Julius, I 1829
8) Design of a Cup
UNKNOWN 1900s
9) Title-Page for the Poem 'Blancheflour' by K.F. Scherenberg
Graeb, Carl Georg Anton and Schutze, Ernst Friedrich Gotthold, II 1854
10) Portrait of Count Ludwig Cobenzl, Ambassador of Austria in Russia
UNKNOWN Late 18th century
11) Design of a Dipper Showing Warriors of Ancient Russia
UNKNOWN 1910s
12) Design of a Crystal Ink-Pot in a Silver Setting
UNKNOWN 1910s
3.2 QBIC LAYOUT SEARCH(图像布局检索)
With the QBIC Layout Search, you become the artist. Using geometric shapes, you can arrange areas of colour on a virtual canvas to approximate the visual organisation of the work of art for which you are searching. Go to the QBIC Layout Search Demo to view a step by step demonstration of this search.
3.2.1 使用步骤
①使用鼠标选择一个颜色从调色板。
②选择圆形工具或广场的工具。
③按住鼠标按钮并拖动十字架的画布创建一个颜色的形状。
④重复这一过程,直至完成,您的自定义布局。当您准备就绪,单击搜索。
3.2.2 搜索界面(图略)
3.2.3 检索示例
【检索内容】:RGB = {128,255,252},绘制一个圆。
【检索结果】:(图片略)
1) Interior View of the Crater of Volcanello
Houel, Jean-Pierre-Laurent Late 1770s
2) Demonstration in Wedding
Ehmsen, Heinrich 1931
3) View of the English Embankment and Galerny (Gallery) Dvor from Vasilyevsky Island (3rd section)
Paterssen, Benjamin 1799
4) Plan of the Foundations of Buildings in Gurginti on Malta
Houel, Jean-Pierre-Laurent Late 1770s
5) Eighth Sheet of the Poem 'Blancheflour' by K.F. Scherenberg
Graeb, Carl Georg Anton and Schutze, Ernst Friedrich Gotthold, II 1854
6) View of the Theatre in Taormina
Houel, Jean-Pierre-Laurent Between 1776 and 1779
7) Top of Etna from the East. View from San Leonardo
Houel, Jean-Pierre-Laurent Between 1776 and 1779
8) View of the English Embankment from Vasilyevsky Island (2nd section)
Paterssen, Benjamin 1799
9) Terrace with Fountains in the Boulevard. Facade and Plan
Quarenghi, Giacomo Early 1800s
10) Neva Embankment by the Summer Garden
UNKNOWN 1827
11) Landscape with Pines at a Moonlit Night
Auburtin, Jean-Francis 1890s
12) View of the Summer Palace of Empress Elizabeth Petrovna
Grekov, Alexei Angiliyevich 1753
3.3 格式说明
Landscape with Pines at a Moonlit Night ------ 图像名称
Auburtin, Jean-Francis 1890s ------ 作者,创作时间
4. 分析和评价
QBIC(Query By Image Content)图像检索系统是 IBM 公司 90年代开发制作的图像和动态景象检索系统,是第一个基于内容的商业化的图像检索系统。QBIC 系统提供了多种的查询方式,包括:利用标准范图(系统自身提供)检索,用户绘制简图或扫描输入图像进行检索,选择色彩或结构查询方式,用户输入动态影象片段和前景中运动的对象检索。在用户输入图像、简图或影象片段时,QBIC 对输入的查询图像进行颜色、纹理、形状等特征进行分析和抽取,然后根据用户选择的查询方式分别进行不同的处理。QBIC 中使用的颜色特征有色彩百分比、色彩位置分布等;使用的纹理特征是根据Tamura 提出的纹理表示的一种改进,即结合了粗糙度、对比度和方向性的特性;使用的形状特征有面积、圆形度、偏心度、主轴偏向和一组代数矩不变量。QBIC 还是少数几个考虑了高维特征索引的系统之一。
QBIC除了上面的基于内容特性的检索,还辅以文本查询手段。例如为旧金山现代艺术博物馆的每幅作品给予标准描述信息:作者、标题、日期,许多作品还有内容的自然描述。