中文名 | 面向科技文献的引用摘要生成关键技术研究 | 项目负责人 | 李素建 |
---|---|---|---|
项目类别 | 面上项目 | 依托单位 | 北京大学 |
本课题围绕科技文献展开对科技论文的分析和自动摘要研究,四年来的主要研究内容归纳为如下三方面:(1)提出一套科技文献的篇章标注规范,引入依存结构对论文段落进行篇章表示,并结合深度学习方法探索有效的篇章分析方法;(2)研究科技论文的自动分析,从内容、引用内容、引用重要性等各个方面进行分析;(3)研究自动摘要和文本生成方法,提出引用摘要生成方法,并改进生成方法的错误事实问题。课题基本按项目预定的计划进行,达到了项目预期的目标,并完成了项目预期的研究成果。基于以上研究内容,形成了理论结合实践、规范和资源共建、技术实用化的一整套比较系统的研究成果。(1)理论成果:围绕社会媒体数据进行热点话题发现和摘要的相关研究成果整理论文31篇发表在国内外会议和期刊上。其中,期刊论文6篇,会议论文25篇,在国际高水平会议ACL,AAAI,EMNLP, COLING上共发表论文13篇。(2)规范和资源建设:构建和完善了一套篇章依存关系标注规范,并在此规范下完成798篇科技论文摘要的篇章依存标注,506篇摘要被标注了两遍。EDU标注采用两遍标注原则,保持两个标注员的一致性。(3)系统实践:基于深度学习算法,开发了自动引用摘要、自动篇章分析、自动关键词分析的demo,并和百度公司合作进行研究自动阅读理解技术,相关技术已产品化。(4)学术交流:与伦斯勒理工大学、香港理工大学、中央民族大学、北京理工大学、微软研究院、浪潮公司、Baidu公司等进行学术交流、资源转让与技术合作等。(5)人才培养:指导了2名博士生、4名硕士生、6名本科生顺利毕业。所指导的硕士生中1名获得国家奖学金,1名研究生获得ACL会议的杰出论文奖。多名本科生获北京大学信息学院优秀本科毕业论文。 2100433B
科技文献的爆炸式增长使得自动摘要成为减轻科研人员负担的一项关键技术,而论文引用能从多个角度去帮助理解论文的方法、应用、贡献和局限性。因此,本申请的目标是探究引用的真正动机和生成式摘要技术。在此基础上定义了不同于过去的引用摘要任务,不限于论文本身内容,而进一步依据引用的各个维度对论文的影响进行总结。研究内容主要包括:(1)研究面向科技文献的信息抽取技术,克服了传统信息抽取技术高度依赖人工的局限性,对特定领域的实体、事件、关系等进行自动提取;(2)提出一套科技文献的篇章标注规范,引入依存结构对论文段落进行篇章表示,并结合深度学习方法探索有效的篇章分析算法;(3)围绕引用摘要任务进行引用的多维度分析,其中包括引用重要性、引用内容、引用倾向性等方面;(4)研究基于模板的引用摘要生成框架,研究以概念为骨架的模板生成技术、基于篇章分析的文本连贯性计算模型、基于模板和引用维度分析的引用摘要生成技术。
彩叶树种近年来在各地的需求一直处于上升趋势,北京、上海、大连等大中城市还特别提出了在城区主干道两侧以及重点景区种植红色、金色等系列彩叶树种,以解决城市绿化色彩单调的问题。但是,设计师在做园林设计时依然...
放坡的坡度,边坡稳定验算,支护方案(如果有的话),分层厚度。 《深基坑工程施工技术》是虹桥综合交通枢纽深基坑工程技术策划和施工管理过程的总结。以基坑工程为主题,以基坑办案的确定、实施过程的控制...
开挖时要注意开挖进尺、控制超欠挖、支护时注意钢架(如果有)连接、防排水同样是非常重要的,不可忽视、二衬施工时要注意不能侵线。
介绍了面向机械设计的知识管理系统的体系结构,阐述了知 识表达、知识获取、知识利用、知识管理等关键技术。知识工程 为制造业机械设计中的创新设计和敏捷设计提供了有力的工具。
本文以面向机械产品设计的知识服务关键技术作为研究对象,简单对知识服务进行了阐述,并结合我国知识服务相关技术研究的现状,提出了基于PLM的知识服务系统架构。
提示:
从论文评价的形式标准上来讲,参考文献在体现研究成果层次上具有明显的评价意义。在参考文献的引用上有几个原则需要注意:
1. 该引而不引,学风有问题
如果论文中引用了他人的学术观点、数据、材料、结构等而不如实、规范地标注处处,则有缺乏严肃认真的科学态度或学术修养的嫌疑。文献的引用不仅是对他人劳动成果和著作权的尊重,也是对个人诚信的拷问。如果漏引的正好是审稿人的文献,则会造成极坏的影响。
2. 引用不规范,水平则有限
如果一篇论文的参考文献在文中文后标注的不规范,或者有错漏,或者格式不一,也从一个侧面反映出作者写作水平和态度,缺乏严禁的科学态度。这就如同论文写作主体部分表达不一致、错字别字等会使人怀疑在研究中是否也是如此粗心大意,那么论证过程、结果和结论都会让人生疑。
3. 文献多与少,充分为最好
文献量的多少体现出作者占有资料的程度,特别是对相关方面的代表性文献的遗漏会直接影响着立论的充分性和必要性。文献引用量的多少,一定程度上代表资料的占有程度、选题的前沿热点和选题的重要程度,一般来讲中文论文的文后参考文献都偏少,这也是事实。但是,也不能简单以文献引用量达到多少简单划分,不同学科、不同性质的论文之间的文献引用量也相差很大。
4. 文献失效短,表明是热点
参考文献过于陈旧虽然不能说研究没有创新,但说明并非当前研究的热点,没有人研究和解决可以认为是前沿但选题的重要性也就值得怀疑。一些经典性文献长期以来被人引用,文献被引用的半衰期长短也是评价期刊和论文的理论性强弱的指标,但是从现有研究的文献引用情况来看,近五年的研究成果应该占有较大的比例。如果近五年里有很少相关的文献发表,那只能讲论文的选题并不被人们广泛关注。
5. 文献有层次,增强说服力
文献的作者团队和发表的期刊,一定程度上体现出研究选题的高度和层次,特别是行业内的权威文献往往具有一定的说服力。无论是期刊还是作者的权威性并不是自封的,而是其长期以来严谨科学作风的积累和体现,能够引用权威期刊或者权威作者的文献自然会得到同行的认可,这是建立在人们对权威的信赖基础上的。
6. 文献范围广,自信能力强
文献引用贵在科学合理,如果局限在很窄的一个范围也容易造成“攀龙附凤”“狐假虎威”的嫌疑,实事求是地引用不同层次期刊和作者、不同语种的相关文献,更能体现作者对自己研究成果的自信和对研究背景的掌握的全面性。与前一条相呼应,正好是一个问题的两个方面。
版权声明:
来源:网络。
特别声明:本微信转载文章出于非商业性的教育和科研目的,如转载稿涉及版权等问题,请立即联系我们,我们会予以更改或删除相关文章,保证您的权益。
项目针对SAR影像用于矿区沉陷监测信息提取中的若干关键问题展开了研究。主要研究成果如下: (1)对比分析了ERS、ALOS和TerraSAR-X等数据提取开采沉陷的能力,实验发现,ALOS和TerraSAR-X数据是相对比较理想的,但两者仍有缺点,前者时间间隔太长,而后者波长过短,综合分析而言,ALOS对提取开采沉陷更有帮助,且成本较低。 (2)将Contourlet变换引入到干涉图滤波方法中,使得在能达到干涉图去噪的同时,较好的保留了纹理细节信息。 (3)研究了GPS与 MODIS联合实现大气延迟改正量提取方法,利用两期GPS观测数据及相应时间的MODIS数据,分析GPS-PWV与MODIS-PWV的关系,进一步优化了MODIS水汽的校正模型。 (4)研究了一种基于多级匹配策略的干涉SAR影像自动配准新方法,该方法首先利用SIFT算法提取SAR影像上的特征点并完成特征点初始匹配,之后基于RCM算法剔除相关性较低的匹配点,为减少影像整体匹配误差,采用PRM算法进行匹配点对的二次筛选,最终完成SAR影像的精确匹配。 (5)探索了大变形条件下两种干涉SAR技术解算方法:一种是相干性不好的情况下,采用下沉盆地边缘点的D-InSAR结果同少量实测点结合,联合解算概率积分法参数;另一种是在相干性较好的情况下,直接采用D-InSAR的结果反算概率积分法参数。最后再由概率积分法模型解算地表的总体沉降情况。 (6)对多基线时序SAR中的短基线技术进行了分析,并利用该技术提取了矿区地表沉降,试验证明:SBAS方法对干涉图中相干点的识别是有利的,但对矿区开采沉陷的监测效果并不好。 (7)研究了基于支持向量机的概率积分法参数及地表下沉预报方法;构建了概率积分法修正模型的老采空区残余移动变形预测模型及方法; 建立了老采空区残余沉降计算模型,分析了残余下沉系数与覆岩岩性、开采厚度、开采深度及建筑物载荷的关系。 本项目发表相关科研论文36篇,其中SCI检索1篇,EI检索8篇,完成了既定的研究目标和任务。 2100433B
大型专用设备、舰艇、航天器等项目制造产品是为满足客户个性化要求开发的,往往关系到国计民生和军事国防。本项目从设计方法学入手,研究面向项目制造产品的协同设计方法,将研究对象从产品、设计过程扩展到设计团队以及他们之间的协同关系,并将协同设计的技术和环境要求也视为协同设计方法的组成部分;将协同设计从单一的详细设计阶段或单一的学科系统扩展到设计阶段- - 多学科领域二维空间,建立项目制造产品多视图信息模型;基于设计结构矩阵技术,建立集成设计团队、任务管理和产品结构的动态工作流程管理模型;在网格技术支持下,构建基于知识网格服务、集成网格工作流和产品多视图信息模型的项目制造产品协同设计体系结构。以专用船舶为目标对象,开发协同设计原型系统,验证本项目研究的方法先进性和技术可行性。本项目的研究对协同设计理论进行拓展,对协同设计技术进行深化,对促进项目制造产品开发水平和提高产品质量具有重要的理论研究价值。