向量空间模型有如下局限:
不适用于较长的文档,因为它的相似值不理想(过小的内积和过高的维数)。
检索词组必须与文档中出现的词组精确匹配;词语子字串可能会导致“假阳性”匹配。
语义敏感度不佳;具有相同的语境但使用不同的词组的文档不能被关联起来,导致“假阴性匹配”。
词组在文档中出现的顺序在向量形式中无法表示出来。
假定词组在统计上是独立的。
权重是直观上获得的而不够正式。
然而,这些局限中的多数能够通过集合各种方法来解决,包括数学上的技术(比如奇异值分解)和词汇数据库(比如WordNet)。
相对于标准布尔模型(Standard Boolean model),向量空间模型具有如下优点:
基于线性代数的简单模型
词组的权重不是二元的
文档和查询之间的相似度取值是连续的
允许根据文档间可能的相关性来进行排序
允许局部匹配
据文档相似度理论的假设,如要在一次关键词查询中计算各文档间的相关排序,只需比较每个文档向量和原先查询向量(跟文档向量的类型是相同的)之间的角度偏差。
实际上,计算向量之间夹角的余弦比直接计算夹角本身要简单。
其中
由于这个模型所考虑的所有向量都是每个元素严格非负的,因此如果余弦值为零,则表示查询向量和文档向量是正交的,即不符合(换句话说,就是检索项在文档中没有找到)。如果要了解详细的信息可以查看余弦相似性这条目。
广联达软件是不是只能识别在模型空间保存的图纸,布局空间的图纸咋识别, 答:CAD图同一文件,有模型和布局同时存在时,广联达会自动加载模型空间的数据。(导入时转为黑屏),如果是独立的布局图,(没有模型存...
画一个圆 然后挤出 然后变成可编辑多边形 使用法线工具 这样就有圆形空间了
GIS中的空间数据模型有哪些?请分析栅格数据模型和矢量数据模型的特点,并比较两种数据模型的优缺点。
栅格就是一个规则的阵列(matrix),其中各个像元(pix)互不影响;而矢量图是由一些个坐标和由这些坐标组成的线、面、体,他们之间有着密切的关系。 像.bmp图像就是最典型的栅格图形,.jpeg等也...
文档和查询都用向量来表示。
词组的定义按不同应用而定。典型的词组就是一个单一的词、关键词、或者较长的短语。如果将词语选为词组,那么向量的维数就是词汇表中的词语个数(出现在语料库中的不同词语的个数)。
通过向量运算,可以对各文档和各查询作比较。
基于及扩展了向量空间模型的模型包括:
广义向量空间模型
(增强的)基于主题的向量空间模型
潜在语义学
潜在语义索引
DSIR模型
词汇鉴别(Term Discrimination)
Rocchio分类
使用向量空间模型做实验或者想基于它们实现研究服务的人或许会对以下的这些软件包感兴趣。
Apache Lucene.这是一个高性能的软件,用java写的功能全面的文本搜索引擎。
SemanticVectors.语义向量索引,将随机投影算法(类似于潜在的语义分析)应用于Apache Lucene构建的文本词组矩阵。
Gensim是一个Python NumPy的向量空间模型的框架。它包含对Tf–idf、潜在的语义索引、随机投影和潜在的狄利克雷边界的增值算法(有效利用内存空间)。
Antonio Gulli开发的Compressed vector space in C
Text to Matrix Generator (TMG)用于一系列特殊文本挖掘的matlab工具箱。(1)指标化(2)检索(3)降维(4)聚类(5)分类。大多数的TMG都是用matlab编写的,小部分是用Perl编写的。它包括了LSI的实现和聚类、NMF以及其他方法。
SenseClusters,通过潜在的语义分析和单词的同现矩阵来进行文本和词组聚类的一个公开软件包。
S-Space Package,通过“统计语义”实现的的检索程序集成。
由于计算机数字技术的应用,现在设计师在建筑设计中对空间环境光影的研究多在计算机的虚拟环境中进行,而对传统的通过实体模型进行的光影研究方法,往往不太重视,本文通过一个实体模型的光影研究练习,来阐述实体模型在建筑光影研究中不可替代的重要性。
本文介绍一种状态空间建筑热模型降维方法,并用BTP程序模拟建筑热过程。最后,文中给出实际气候条件下建筑物内逐时温度,以验证模拟结果
对于天体,为了方便论述,把天体看成质点。坡印廷矢量强度跟物质质量成正比例关系,坡印亭矢量向外围空间辐射是呈辐射状的。如图1所示。
图1中,圆圈表示天体;箭头表示坡印亭矢量;直线AB 表示通过质心任何一个方向,质心为O。
在质点的模型中,坡印亭矢量向外围空间辐射在各个方向是均匀的。图1中,在直线AB 方向上,天体从OA 方向向外围空间辐射的坡印亭矢量和从OB 方向向外围空间辐射的坡印亭矢量大小相等,方向相反,则有:
SOA SOB=0
式中SOA、SOB 分别表示OA、OB 方向上的坡印亭矢量。
质点向外围空间辐射在各个方向总是成对的,而且大小相等。所以对包围质点的封闭曲面的坡印亭矢量的矢量积分恒等于零。我们把质点向外围空间辐射的坡印亭矢量的矢量积分记为:∮s*Sds
则有∮s*Sds=0
通过上述分析,我们可以看出天体自身辐射的坡印亭矢量不会改变自己的运动状态。
矢量之间的运算要遵循特殊的法则。矢量加法一般可用平行四边形法则。由平行四边形法则可推广至三角形法则、多边形法则或正交分解法等。矢量减法是矢量加法的逆运算,一个矢量减去另一个矢量,等于加上那个矢量的负矢量。A-B=A (-B)。矢量的乘法。矢量和标量的乘积仍为矢量。矢量和矢量的乘积,可以构成新的标量,矢量间这样的乘积叫标积;也可构成新的矢量,矢量间这样的乘积叫矢积。例如,物理学中,功、功率等的计算是采用两个矢量的标积。W=F·S,P=F·v,物理学中,力矩、洛伦兹力等的计算是采用两个矢量的矢积。M=r×F,F=qv×B。
我国各地兴建的许多地下停车场,不仅安装大量光源,并且24小时照明,浪费了大量电能。矢量照明的应用即当有人、车出入需要照明时,系统会在高亮状态下运行,反之则保持节电的低亮状态,比传统照明方式节电80%以上。
矢量照明的原理即矢量图像的原理。矢量图像由被称为矢量的数学对象定义的线条和曲线组成。 矢量根据图像的几何特性描绘图像。 例如,矢量图形中的靴带由特定的宽度和长度定义,设置在特定位置,并以特定颜色填色。 不论是移动靴带、调整其大小,还是更改其颜色,都不会降低图形的品质。同样光束也可以根据不同的照明需要和照明环境、照明风格设计进行调整,即达到了视觉美化效果,也保证了光源质量。
传统照明只有一个单一的亮度指标,只调明暗,而矢量照明则是一个多维度、多参量照明。相对传统照明而言,它的优势更加明显:不仅能调明暗,还能调色温、色调,如可以根据个人喜好和场所需要调成偏绿、偏蓝、偏红等不同风格。LED光源出现后,把照明的概念拓展了,不光是一个照亮的问题,更重要的是发挥了一种环境渲染、改变氛围、增加情趣、调节情绪、改变心情的功能,从而给照明灯具赋予了新的内涵。2100433B
由平面力偶理论知,作用于同一平面内的两个力偶等效的条件是两力偶的力偶矩大小相等,转向相同。但对空间力偶而言,若两个力偶的作用面不相互平行,即使满足平面力偶等效条件,这两个力偶对刚体的作用也是不同的。可见,空间力偶对刚体的作用效应取决于:力偶矩的大小、力偶的转向及力偶作用面在空间中的方位。因此,可用一矢量M来表示空间力偶,称为力偶矩矢量。如图1所示,M的模表示力偶矩的大小,且M=F・d。カ偶矢量方位与力偶作用面的法线方位相同,且M的指向与力偶转向的关系服从右手螺旋法则。