• 工作总结
  • 工作计划
  • 读后感
  • 发言稿
  • 心得体会
  • 思想汇报
  • 述职报告
  • 作文大全
  • 教学设计
  • 不忘初心
  • 打黑除恶
  • 党课下载
  • 主题教育
  • 谈话记录
  • 申请书
  • 对照材料
  • 自查报告
  • 整改报告
  • 脱贫攻坚
  • 党建材料
  • 观后感
  • 评语
  • 口号
  • 规章制度
  • 事迹材料
  • 策划方案
  • 工作汇报
  • 讲话稿
  • 公文范文
  • 致辞稿
  • 调查报告
  • 学习强国
  • 疫情防控
  • 振兴乡镇
  • 工作要点
  • 治国理政
  • 十九届五中全会
  • 教育整顿
  • 党史学习
  • 建党100周
  • 当前位置: 蜗牛文摘网 > 实用文档 > 公文范文 > 基于GloVe词向量的“技术

    基于GloVe词向量的“技术

    时间:2022-09-08 19:30:11 来源:千叶帆 本文已影响


      摘要:[目的/意义]本文探讨挖掘技术和应用间的关联关系,便于把握技术的目标应用场景和了解应用需求的可选技术方案,为技术转化提供基础。[方法/过程]首先,建立基于改进GloVe词向量的“技术——应用”发现模型,提出改进词向量的算法;然后,以机器学习技术为例,获取该领域学术论文文摘数据,预处理后建立训练文本集合,再使用改进GloVe模型训练获得词向量;最后,对词向量聚类获得“技术”和“应用”类词汇集,通过共现获得两者之间的关联并分析。[结果/结论]实验结果表明,本文改进GloVe模型后训练的词向量性能获得提升,聚类效果好,最终实现“技术——应用”的关联分析。
      关键词:词向量;GloVe模型;文本聚类;共现分析
      DOI:10.3969/j.issn.1008-0821.2019.04.002
      〔中图分类号〕G203〔文献标识码〕A〔文章编号〕1008-0821(2019)04-0013-10
      Research on“Application-Technology”Discovery Based on
      GloVe Word Representation
      Ji JiumingShi ChenweiLi NanKang Jian
      (Institute of Science and Technology Information,East China University of Science and Technology,
      Shanghai 200237,China)
      
      Abstract:[Purpose/significance]The purpose of this paper was to mine the relationship between applications and technologies,and to know applications of technologies and optional technologies of applications,and provide the base for technology transformation.[Method/Process]Firstly,established an“application-technology”discovery model based on improved GloVe word vector and improved the word vector training algorithm.Then,collected academic literature abstracts in the field of machine learning,built the training text set after preprocessing,and used the improved GloVe model to obtain the word vector;finally,clustered the word vector to obtain the“application”and“technology”vocabulary sets,and acquired the relationship between them to analyze the cooccurence.[Result/Conclusion]The experimental results showed that the performance of the word vector obtained by the improved GloVe model was better,the clustering effect was good,and the correlation analysis of“application-technology”was finally realized.
      Key words:word vector;GloVe model;text clustering;co-occurrence analysis
      
      在人類历史发展的长河中,“技术”从来都是为“应用”服务的,没有应用需求,就没有技术。但由于“技术”开发往往存在一定的门槛,很难一蹴而就,因此存在技术迭代现象,针对同一“应用”会开发多项“技术”(本文对于同一“技术”的各种升级改造视为不同的技术,如,同一种人脸识别算法的不同优化或各种不同的人脸识别算法)。因此,“技术”与“应用”不仅只有一一对应的关系。某项“技术”可以同时满足多项“应用”需求,如深度学习;还有一些“技术”最初只是为了满足少数的“应用”需求而开发,后来衍生出更多的应用,如互联网起初仅用于军事,逐渐成为改变世界的技术。
      对于专业技术人员而言,如果某项较复杂的“应用”仅有少量“技术”与之对应,则表明该项“应用”的技术机会较多。而对于技术投资方而言,一对一或多对一的“技术——应用”关系分别表明某项“应用”市场的成熟度不够或者基本成熟;为满足少数人的“需求”而开发的“技术”往往预示着该应用当前为高端市场;处于初期且能同时满足多项“应用”需求的某项“技术”的投资价值必然很高。对于应用需求方而言,如果存在多项技术可供选择,则能降低技术选择成本,最大程度避免因技术缺陷导致的损失。因此挖掘各类文献(主要包括学术论文和专利文献)中的“技术”与“应用”对应关系,可以为技术研究和投资提供相应的情报。挖掘此类关联关系的难点主要在于:“技术”和“应用”的文本距离有时候并非很近,且自然语言表达随意,存在名称不规范的情况,很难采用常规的“规则”匹配法。
      因此,本文拟采取以下方案挖掘学术文献文本中的“技术”与“应用”关联:先将文献文本向量化,再聚类找出其中的“技术”和“应用”词汇,最后使用共现分析法发现它们的关联关系。本文以机器学习领域为例,验证改进算法的有效性,并做了“技术——引用”发现的实证。
    相关热词搜索:向量技术GloVe

    • 名人名言
    • 伤感文章
    • 短文摘抄
    • 散文
    • 亲情
    • 感悟
    • 心灵鸡汤