文档和查询都用向量来表示。

每一维都对应于一个个别的词组。如果某个词组出现在了文档中,那它在向量中的值就非零。已经发展出了不少的方法来计算这些值,这些值叫做(词组)权重。其中一种最为知名的方式是tf-idf权重(见下面的例子)。

词组的定义按不同应用而定。典型的词组就是一个单一的词、关键词、或者较长的短语。如果将词语选为词组,那么向量的维数就是词汇表中的词语个数(出现在语料库中的不同词语的个数)。

通过向量运算,可以对各文档和各查询作比较。

矢量空间模型造价信息

市场价 信息价 询价
材料名称 规格/型号 市场价
(除税)
工程建议价
(除税)
行情 品牌 单位 税率 供应商 报价日期
地图沙盘模型 材质:高密度防火板、亚克力、ABS板、真石漆等颜色:白色、仿真色、投影色比例:1:500-1:100000制作主要工艺技术:三维雕刻技术、机械精密雕刻技术、手工制作技术、静电植绒技术物理特点:包含建筑模型、道路交通模型、山体模型、草木模型、河流湖泊模型 查看价格 查看价格

定制

13% 重庆秒点科技有限公司
建筑沙盘模型 材质:高密度防火板、亚克力、ABS板、真石漆等颜色:仿真色(定制)比例:1:100-1:5000制作主要工艺:三维雕刻技术、机械精密雕刻技术、手工制作技术、静电植绒技术物理特点:还原建筑外观风格 查看价格 查看价格

定制

13% 重庆秒点科技有限公司
电子沙盘模型 材质:高密度防火板、亚克力、ABS板、真石漆、电子元器件等颜色:仿真色(定制)比例:1:50-1:2000制作主要工艺:三维雕刻技术、机械精密雕刻技术、手工制作技术、静电植绒技术物理特点:配合光电技术融合 查看价格 查看价格

定制

13% 重庆秒点科技有限公司
智能电采集 SDP3000 查看价格 查看价格

株洲中车机电

13% 株洲中车机电科技有限公司
矢量 VCF16-5 查看价格 查看价格

威乐

13% 威乐水泵(上海)有限公司
数字式可编程开关 4路20A/路数字式可编程开关块;标准Modbus协议;220V;DIN35mm导轨式安装 查看价格 查看价格

大峡谷

13% 大峡谷照明系统(苏州)股份有限公司
温控器ES-302(模拟量) DN15 查看价格 查看价格

盾安阀门

13% 浙江迪艾智控科技股份有限公司
矢量型变频器 品种:矢量型变频器;规格:VT100-132GB/160P;功率(KW):132;装箱数:1;参数:ST(VT)系列; 查看价格 查看价格

深圳西子特

13% 成都市凯莱通科技有限公司
材料名称 规格/型号 除税
信息价
含税
信息价
行情 品牌 单位 税率 地区/时间
暂无数据
材料名称 规格/需求量 报价数 最新报价
(元)
供应商 报价地区 最新报价时间
榨汁机模型 包括五种不同阶段的模型,即:草模、结构模型、功能模型、概念模型和成品模型,可以进行相应的试验.|1套 1 查看价格 中国教育企业股份有限公司 广东   2019-06-21
空间 空间租赁,400TB|1台 1 查看价格 上海商豫智能科技有限公司 全国   2021-09-03
铆接、黏接、焊接模型 铆接模型:3件/套.焊接模型:3件/套; 粘接模型:3件/套.|1套 1 查看价格 中国教育企业股份有限公司 广东   2019-06-21
模型底座 定制模型底座|1套 3 查看价格 广州市尚雅模型设计有限公司 广东   2022-11-09
仿真毒品模型 1、仿真毒品模型|28个 1 查看价格 广州千艺五金制品有限公司 广东  江门市 2022-07-13
建筑模型 1:110定制建筑模型3500×3500建筑用模型专用ABS跟进口亚克力制作,建筑与路网发光,环境淡雅写实制作.|1套 3 查看价格 广州市尚雅模型设计有限公司 广东   2022-11-09
模型语音讲解编制 模型自动语音讲解系统开发|3.0项 2 查看价格 北京华堂立业科技有限公司广州办事处    2016-06-02
数据格式定义工具 系统需可提供用户自定义参数设置、自定义报表、自定义数据库|1套 3 查看价格 深圳新基点智能股份有限公司 广东   2018-11-16

据文档相似度理论的假设,如要在一次关键词查询中计算各文档间的相关排序,只需比较每个文档向量和原先查询向量(跟文档向量的类型是相同的)之间的角度偏差。

实际上,计算向量之间夹角的余弦比直接计算夹角本身要简单。

其中

是文档向量和查询向量的点乘。
是向量d2的模,而
是向量q的模。向量的模通过下面的公式来计算:

由于这个模型所考虑的所有向量都是每个元素严格非负的,因此如果余弦值为零,则表示查询向量和文档向量是正交的,即不符合(换句话说,就是检索项在文档中没有找到)。如果要了解详细的信息可以查看余弦相似性这条目。

相对于标准布尔模型(Standard Boolean model),向量空间模型具有如下优点:

  1. 基于线性代数的简单模型

  2. 词组的权重不是二元的

  3. 文档和查询之间的相似度取值是连续的

  4. 允许根据文档间可能的相关性来进行排序

  5. 允许局部匹配

矢量空间模型定义常见问题

  • 模型空间问题

    广联达软件是不是只能识别在模型空间保存的图纸,布局空间的图纸咋识别, 答:CAD图同一文件,有模型和布局同时存在时,广联达会自动加载模型空间的数据。(导入时转为黑屏),如果是独立的布局图,(没有模型存...

  • 受限空间定义

    受限空间的概念受限空间是指生产单位的各种设备内部(塔、釜、槽、罐、炉膛、锅筒、管道、容器等)和下水道、沟、坑、井、池、涵洞、阀门间、污水处理设施等封闭、半封闭的设施及场所。换言之,一切通风不良、容易造...

  • 圆形空间3D模型怎么做

    画一个圆 然后挤出 然后变成可编辑多边形 使用法线工具 这样就有圆形空间了

向量空间模型有如下局限:

  1. 不适用于较长的文档,因为它的相似值不理想(过小的内积和过高的维数)。

  2. 检索词组必须与文档中出现的词组精确匹配;词语子字串可能会导致“假阳性”匹配。

  3. 语义敏感度不佳;具有相同的语境但使用不同的词组的文档不能被关联起来,导致“假阴性匹配”。

  4. 词组在文档中出现的顺序在向量形式中无法表示出来。

  5. 假定词组在统计上是独立的。

  6. 权重是直观上获得的而不够正式。

然而,这些局限中的多数能够通过集合各种方法来解决,包括数学上的技术(比如奇异值分解)和词汇数据库(比如WordNet)。

基于及扩展了向量空间模型的模型包括:

  • 广义向量空间模型

  • (增强的)基于主题的向量空间模型

  • 潜在语义学

  • 潜在语义索引

  • DSIR模型

  • 词汇鉴别(Term Discrimination)

  • Rocchio分类

使用向量空间模型做实验或者想基于它们实现研究服务的人或许会对以下的这些软件包感兴趣。

  • Apache Lucene.这是一个高性能的软件,用java写的功能全面的文本搜索引擎。

  • SemanticVectors.语义向量索引,将随机投影算法(类似于潜在的语义分析)应用于Apache Lucene构建的文本词组矩阵。

  • Gensim是一个Python NumPy的向量空间模型的框架。它包含对Tf–idf、潜在的语义索引、随机投影和潜在的狄利克雷边界的增值算法(有效利用内存空间)。

  • Antonio Gulli开发的Compressed vector space in C

  • Text to Matrix Generator (TMG)用于一系列特殊文本挖掘的matlab工具箱。(1)指标化(2)检索(3)降维(4)聚类(5)分类。大多数的TMG都是用matlab编写的,小部分是用Perl编写的。它包括了LSI的实现和聚类、NMF以及其他方法。

  • SenseClusters,通过潜在的语义分析和单词的同现矩阵来进行文本和词组聚类的一个公开软件包。

  • S-Space Package,通过“统计语义”实现的的检索程序集成。

2100433B

矢量空间模型定义文献

自定义函数在计算机财务模型中的应用及对策建议 自定义函数在计算机财务模型中的应用及对策建议

格式:pdf

大小:138KB

页数: 3页

评分: 4.5

自定义函数是计算机辅助财务决策的重要工具,其在创建和使用过程中经常会存在一些问题,本文对这些问题进行分类并分析其原因,提出解决对策。

立即下载
空间机械手模型参数在轨标定方法研究 空间机械手模型参数在轨标定方法研究

格式:pdf

大小:138KB

页数: 5页

评分: 4.6

为了在轨辨识空间机械手真实模型参数,该文分析了模型参数误差来源,提出了基于遗传算法的空间机械手模型参数在轨标定方法,设计了关节变量误差和DH参数误差两组仿真数据对该方法进行验证。仿真结果表明,该方法切实可行,能够比较准确地识别出模型参数误差,有效地更新机械手运动学模型。与传统标定方法相比,基于智能优化算法的标定方法更具有广泛性。

立即下载

坡印亭矢量简介及证明

对于天体,为了方便论述,把天体看成质点。坡印廷矢量强度跟物质质量成正比例关系,坡印亭矢量向外围空间辐射是呈辐射状的。如图1所示。

图1中,圆圈表示天体;箭头表示坡印亭矢量;直线AB 表示通过质心任何一个方向,质心为O。

在质点的模型中,坡印亭矢量向外围空间辐射在各个方向是均匀的。图1中,在直线AB 方向上,天体从OA 方向向外围空间辐射的坡印亭矢量和从OB 方向向外围空间辐射的坡印亭矢量大小相等,方向相反,则有:

SOA SOB=0

式中SOA、SOB 分别表示OA、OB 方向上的坡印亭矢量。

质点向外围空间辐射在各个方向总是成对的,而且大小相等。所以对包围质点的封闭曲面的坡印亭矢量的矢量积分恒等于零。我们把质点向外围空间辐射的坡印亭矢量的矢量积分记为:∮s*Sds

则有∮s*Sds=0

通过上述分析,我们可以看出天体自身辐射的坡印亭矢量不会改变自己的运动状态。

矢量之间的运算要遵循特殊的法则。矢量加法一般可用平行四边形法则。由平行四边形法则可推广至三角形法则、多边形法则或正交分解法等。矢量减法是矢量加法的逆运算,一个矢量减去另一个矢量,等于加上那个矢量的负矢量。A-B=A (-B)。矢量的乘法。矢量和标量的乘积仍为矢量。矢量和矢量的乘积,可以构成新的标量,矢量间这样的乘积叫标积;也可构成新的矢量,矢量间这样的乘积叫矢积。例如,物理学中,功、功率等的计算是采用两个矢量的标积。W=F·S,P=F·v,物理学中,力矩、洛伦兹力等的计算是采用两个矢量的矢积。M=r×F,F=qv×B。

我国各地兴建的许多地下停车场,不仅安装大量光源,并且24小时照明,浪费了大量电能。矢量照明的应用即当有人、车出入需要照明时,系统会在高亮状态下运行,反之则保持节电的低亮状态,比传统照明方式节电80%以上。

矢量照明的原理即矢量图像的原理。矢量图像由被称为矢量的数学对象定义的线条和曲线组成。 矢量根据图像的几何特性描绘图像。 例如,矢量图形中的靴带由特定的宽度和长度定义,设置在特定位置,并以特定颜色填色。 不论是移动靴带、调整其大小,还是更改其颜色,都不会降低图形的品质。同样光束也可以根据不同的照明需要和照明环境、照明风格设计进行调整,即达到了视觉美化效果,也保证了光源质量。

传统照明只有一个单一的亮度指标,只调明暗,而矢量照明则是一个多维度、多参量照明。相对传统照明而言,它的优势更加明显:不仅能调明暗,还能调色温、色调,如可以根据个人喜好和场所需要调成偏绿、偏蓝、偏红等不同风格。LED光源出现后,把照明的概念拓展了,不光是一个照亮的问题,更重要的是发挥了一种环境渲染、改变氛围、增加情趣、调节情绪、改变心情的功能,从而给照明灯具赋予了新的内涵。2100433B

由平面力偶理论知,作用于同一平面内的两个力偶等效的条件是两力偶的力偶矩大小相等,转向相同。但对空间力偶而言,若两个力偶的作用面不相互平行,即使满足平面力偶等效条件,这两个力偶对刚体的作用也是不同的。可见,空间力偶对刚体的作用效应取决于:力偶矩的大小、力偶的转向及力偶作用面在空间中的方位。因此,可用一矢量M来表示空间力偶,称为力偶矩矢量。如图1所示,M的模表示力偶矩的大小,且M=F・d。カ偶矢量方位与力偶作用面的法线方位相同,且M的指向与力偶转向的关系服从右手螺旋法则。

矢量空间模型相关推荐
  • 相关百科
  • 相关知识
  • 相关专栏