首 页 用户登录 | ![]() |
|||
|
|||
按字母检索 | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z |
按声母检索 | A | B | C | D | E | F | G | H | J | K | L | M | N | O | P | Q | R | S | T | W | X | Y | Z | 数字 | 符号 |
|
![]() |
您的位置: 5VAR论文频道 → 论文中心 → 计算机论文 → 计算机应用 |
|
|||||
用户行为学习的元搜索结果聚类的方式分析和探讨 | |||||
收集整理:佚名 来源:本站整理 时间:2012-07-06 19:49:01 点击数:[] ![]() |
|||||
[本篇论文由5var5VAR论文频道为您收集整理,5VAR论文频道http://paper.5var.com将为您整理更多优秀的免费论文,谢谢您的支持] |
徐洋 王文生 谢能付 中国农业科学院农业信息研究所 北京 100081 中华人民共和国农业部重点开放实验室智能化农业预警技术重点开放实验室
1 引言
计算机技术和网络技术的飞速发展带来了Web信息量指数级的急剧增加,传统的综合性搜索引擎已经无法满足人们快速有效地寻找自己需要的信息的需求。据统计,任何一个搜索引擎索引的Web页面实际上都不到页面总数的三分之一,而且由于检索机制、范围、算法等的不同,导致同样一个查询请求在不同搜索引擎中的查询结果的重复率比较低。元搜索引擎是解决此问题的主要方法之一,被称为搜索引擎之上的搜索引擎,它通过整合、处理各个成员搜索引擎的查询结果来提高系统的查询覆盖率。
但是,现有的元搜索引擎仍存在一定的问题。尽管通过对成员搜索引擎所递交的结果的分析处理,可以增大查询覆盖率,去除不必要的噪音,但是仍无法给用户以最精确的结果或者检索指导。聚类是将一个数据单位的集合分割成几个称为簇或类别的子集,每个类中的数据都有相似性,而不同聚簇中的对象具有尽可能大的相异性。通过聚类,用户可以方便地选择自己所需要结果的类别来查看结果,从而提高检索效率,优化搜索体验。
现实中,各大搜索引擎还没有加入聚类处理,但是通过Ajax实现的搜索提示可以算作聚类的提示。用户选择相应的提示可以作为直接搜索相应的结果类别,但是鉴于返回结果的数量依然比较大,所以深度的聚类仍是必要的。学术研究中,现有的聚类方法大都是基于一种算法,如基于关联规则的聚类算法、准确描述所有配对方法(CAPP)、基于特征名词(Salient Phrase)的聚类算法等,但是这些算法都忽略了用户作为信息的最终使用者对信息如何有效分类具有决定作用。把用户纳入搜索体系,将其看作信息的挖掘者或提供者而不仅仅是使用者,利用用户在搜索过程中提供的信息对信息进行深加工才能最大限度地迎合用户的需求。因此,本文尝试设计并实现一个基于学习的元搜索框架,提出一种通过学习用户行为来对检索结果进行聚类的方法,以期从用户角度最大限度地提高信息结果的可浏览性,优化检索体验。
2 基于模块的元搜索体系及各模块设计
2.1 系统体系设计
系统总体设计如图1所示。
图1 系统总体设计图
该系统分为两层:基本流程层是一个改进的元搜索引擎框架,在基本框架的基础上添加了用户行为搜集模块;学习推理层是基于用户行为学习的聚类方法,其中的推理模块在规则库的指导下对用户行为搜集模块递交过来的信息进行推理学习,并将所得知识存入到知识库,用以指导后续结果处理模块对所搜集的成员搜索引擎的结果的处理。
2.2 具体模块设计
所有模块都有统一的整体架构,包括通信子模块、功能子模块和知识子模块三部分,具体如图2所示。
图2 模块基本架构
通信子模块负责所属模块主体同其他协作模块主体的通信交互,对外提供接受服务和请求服务的接口;功能子模块隐藏在通信子模块后,负责具体任务的处理;知识子模块负责本模块功能子模块的工作指导。各模块具体功能介绍如下:
(1)用户交互模块
负责整个系统同用户的交互,其任务包括:为用户提供统一的检索入口,并提供最终检索结果的展示,对用户对结果的类组选择做出具体反应。其知识子模块包括用户对结果类别选择相应的处理方法,可扩展包括注册用户的偏好信息等,用以指导提供给特定用户的制定信息组织方式的处理。
(2)用户行为搜集模块
负责搜集用户行为的初始信息,包括用户的检索输入和用户对类别标示的点击、删除操作行为两部分信息,并对信息进行初步加工。其知识子模块包含基本的分词方法,可扩展包含各种诸如最大左向匹配、基于统计的分词或者混合分词方法的知识。
(3)成员搜索引擎调度及结果收集模块
负责成员搜索引擎的调度和结果的收集及成员搜索引擎任务执行的生命周期控制,并负责成员搜索引擎所递交的结果的收集。其知识子模块包括各个成员搜索引擎针对不同搜索内容的能力差别和状态信息,用以指导对其调度。
(4)结果处理模块
负责成员搜索引擎所递交结果的处理。结合知识库的知识指导,
提供人:佚名 | |
【返回上一页】【打 印】【关闭窗口】 |
![]() |
5VAR论文频道 |
![]() |
5VAR论文频道 |
![]() |
关于本站 -
网站帮助 -
广告合作 -
下载声明 -
网站地图
Copyright © 2006-2033 5Var.Com. All Rights Reserved . |