国产一区h_色翁荡息又大又硬又粗又视频图片_91.app_91av手机在线_中文一区二区_亚洲一级黄色片

面向学术资源的术语区分能力的测度方法研究

摘要:改进索引术语质量的衡量方法可以有效提高IR系统的检索效率,但术语的固有属性易受文档长度影响,难以全面衡量术语质量。对此,本文从术语内在的区分性出发,借鉴词袋模型的基本思想,提出了术语区分能力(term discriminative capacity,TDC)这一理论及3种不同的计算方法。本文还采集了Web of Science的3个子数据库中包含4个著录项的900条记录作为实验数据,来实现TDC的大规模计算,并观察3种算法在实践中的差异。经过实验分析得出,计算术语区分能力的最佳方法为TDC-T,该算法在多个方面表现稳定,且不受DF值的影响,可以作为衡量术语质量的全新指标,记为TDC。但是本研究所选取的A&HCI数据库的记录较少,这或许会造成另两个领域计算结果的失衡。

关键词:
  • 索引术语  
  • 词袋模型  
  • 术语区分能力  
  • 术语空间密度  
  • 术语质量评价  
作者:
王昊; 唐慧慧; 张海潮; 张进; 张紫玄
单位:
南京大学信息管理学院; 南京210023; 江苏省数据工程与知识服务重点实验室; 南京210023; 威斯康星大学密尔沃基分校信息研究学院; 密尔沃基53201
刊名:
情报学报

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

期刊名称:情报学报

情报学报紧跟学术前沿,紧贴读者,国内刊号为:11-2257/G3。坚持指导性与实用性相结合的原则,创办于1982年,杂志在全国同类期刊中发行数量名列前茅。

主站蜘蛛池模板: 天堂福利在线 | 国产成人网 | 99精品视频免费在线观看 | 麻豆国产一区二区三区四区 | 色妞ww精品视频7777 | 一级毛片在线播放免费 | 欧美一区二区三区国产精品 | 免费日本在线视频 | 国产精品久久久久尤物 | 四虎国产永久在线观看 | 亚洲色图50p | 亚洲一区中文字幕 | www视频在线观看免费 | 国产精品 欧美 亚洲 制服 | 波多野结衣绝顶大高潮 | 欧美 亚洲 在线 | 精品无码人妻被多人侵犯av | 又刺激又黄的一级毛片 | 国产在线乱码一区二区三区 | 国产成+人+综合+亚洲专 | 免看一级a一片成人123 | 人妻熟女αⅴ一区二区三区 | 午夜影院视频 | 亚洲欧美国产精品专区久久 | 韩国乱码伦视频免费 | 午夜福利院电影 | 四虎永久在线精品视频免费观看 | 国产亚洲精品一区二区久久 | 全部孕妇毛片丰满孕妇孕交 | 业余 自由 性别 成熟偷窥 | 尤物av无码色av无码 | 国产一级又色又爽又黄大片 | 孕妇奶水仑乱a级毛片免费看 | 精品久久久无码中文字幕天天 | 中文字幕亚洲欧美专区 | 强伦人妻一区二区三区视频18 | 久久se精品一区精品二区国产 | 九九热这里只有国产精品 | 91精品国产欧美一区二区 | 日韩一区二区三区免费视频 | 久久天堂|