成功申报-浙江省教育厅科研项目申请书 - 图文 下载本文

.

了OpenGL,对场景进行更新遍历,拣选遍历,绘制遍历 和光照、物理粒子处理、雾化,纹理、碰撞等特效处理。 7)用户界面处理:主要处理用户交互操作,应用数据显示等。 (3)基于多Agent系统的空间信息个性化检索与推荐 一个基于Web点击流数据挖掘的分布式个性化信息推荐系统模型(如图2),其主要包括离线部分和在线部分。 1)离线部分:主要基于点击流数据挖掘技术对Web Server的历史数据进行分析处理,以发现用户的使用模式,从而构建一个基于用户的在线知识库供在线部分查询参考。 Click stream Mining StageData Preparation StageTransaction ClusteringUsage ClusteringURL ClustersUser Transaction FileUsage Mining AgentFrequent ItemsetsUser Preference AgentRecommendation ServicesKnowledge BasePreference BaseOffline Processing控制流数据流Online ProcessingResource BaseRecommendation AgentWeb ServersUsersSite FilesServer LogsData cleaningUser IdentificationTransaction IdentificationUsage StatisticsSupport FilteringDecision AgentAssociation Rule Discovery 图2 分布式智能学习推荐系统框架模型 (2)在线部分:采用多Agent系统封装完成,其利用知识库和用户偏好信息来丰富用户的在线资源内容。在线部分主要包括:决策代理(Decision Agent,DA)、推荐代理(Recommendation Agent, RA)模块、使用挖掘代理(Usage Mining Agent, UMA)、推荐服务(Recommendation Services, RS)模块、用户偏爱学习代理模块(UPA)。DA主要负责RA的协调(如RA的调用、多代理的任务调度等)、用户的信息接受与推荐及UMA的触发;RA模块包括多个派发的移动代理,其负责RS的发现与调用等;RS模块主要由多个web services构成,其主要实现基于用户信息知识库的推荐信息的构建并将该推荐信息返回给RA;UMA主要完成对WUM过程的调用;UPA实现用户偏爱的学习与实时更新。 (六)项目研究技术路线 为了使本项目研究工作最终取得高水平的、全面的、有重要理论价值和实际意义的成果,我们强调按照系统工程方法进行项目整体布局的总体设计,充分利用已有的研究基础和其他相关项目资源;在本项目中,集中强调分布式网络环境下图像协作渲染显示技术研究和Web点击流数据挖掘理论方法研究,突现本项目的创新性理论研究成果。我们将采用成熟的先进技术或本课题组以前积累的成熟先进方法和工具实现研究得出的理论模型和求解算法。另外,我们将利用已有的与国内多个单位的长期合作关系进一步开展合作,通过在国际会议、国内国际刊物上发表相关论文、与国内合作交流等形式扩大本项目成果在国内的影响。 项目本着“以理论指导实践,以实践推动理论创新”的科学研究方法,拟定研究技术路线为: (1)与本项目相关的理论基础、关键技术研究。 分布式环境下并行图像渲染技术、低配置下空间数据的整合与交互技术、基于Web点击流的空间数据挖掘相关理论基础与关键技术研究、多Agent系统理论基础与相关任务调度技术研究、个性化信息推荐技术研究等。 (2)海量数据的采集与处理研究 为了达到最大的数据处理效率,多个数据处理序列同时并行进行。采用自行研发的海量.

.

数据处理技术,在512K带宽和一般PC机配置的条件,实现三维数字城市信息快速交换海量数据的快速交换涉及到海量数据的数据高效传输和海量数据的数据快速加载与交互。海量数据的数据传输主要采用如下的技术:1)清除冗余数据;2)关键数据生成;3)数据压缩;4)本地数据快速缓存。为了提高快速访问,减少网络的访问量,系统在自身所在的机器上使用本地缓存,保存从网络下载的各种数据或者最近访问的数据。因为网络上的数据过于庞大,几乎没有哪个系统能够把所有的数据放到本地数据快速缓存中,所以根据适合自己的最优使用算法把本地缓存的数据作进一步的访问优化,对于这个算法我们采用的按照访问优先(要求访问时间是常量,与缓存的大小无关)的原则优化本地缓存。为了能够在普通的机器上运行数字城市系统,我们将采用如下的技术:1)视觉范围优化;2)用户意图优化;3)效果互补优化,在这些优化中,各种类型数据相互交错,互为补充,做到资源优化到最小。 (3)图像处理技术研究 将采用自行研发的图像处理技术,在512K带宽和一般PC机配置的条件,实现三维数字城市图像的逼真显示一般三维渲染传统都是模型加贴图,贴图越多就越可以到达与真实环境相仿的效果,但是对于数字城市系统,所有的模型数字化,不仅仅是表面,还有内部。如果所有的情况采用贴图,这样的缺点是对硬件要求高,特别一个城市的数据搬上来的时候,那么就不是一般的硬件配置能够承受的,甚至大型图像工作站都难以完全胜任,更不用说普通用户的机器配置了。 本项目将采用自己独特的模型与图像处理技术,在效果上做到接近真实效果,但是对于硬件的要求却是指数级别降低,硬件的需求只要当前普通的PC机配置就可以流畅的运行,整个处理流程包括:1)消除重复点面优化;2)剔除不可见的模型和图像数据优化;3)图像/模型性能质量优化;4)图像/模型分页处理优化 (4)网络分布式虚拟现实技术研究 目前各个行业各个部门的数据都有自成一体的格式和通信协议,在这种状况下共享几乎是很困难。并且在很多的部门数据过于庞大,对于一般机器处理能力都是一个很大的挑战,数据量大,也给服务器带来很大负荷问题,这样的困难给推广应用带来很大的阻力。为了解决这个问题,本项目将采用异构分布式处理,拟采取技术包括:1)多Agent系统协同计算;2)提供专门的数据格式转换模块;3)采用网络分布式数据传输;4)采用网络分布式数据处理。 (5)分布式环境下多Agent系统构建及基于多Agent系统的相关任务调度算法研究 多Agent系统主要完成分布式信息采集、转换、采集、过滤与存储、分布式在线个性化信息推荐等功能。 (1)基于移动Agent的分布式的信息收集方法:将多个智能Agent分布到网络上的不同节点,以实现信息收集的分散化和局部化,从而减少过于集中的网络传输压力。在分布式信息收集时,可以将整个Web 视为一个有向加权图,图中的节点代表各资源网站,有向边则表示网站之间的链接情况,图中的边权则表示沿链接方向传输单位信息所需的网络代价。因此,分布式信息资源收集中有关Agent的位置分布问题,就转化为对图的划分,使得划分之后的信息收集代价最低。 (2)多Agent间的相关任务调度:基于多Agent的调度系统模型分为3个层次:上层是推荐作业Agent,负责从上层或外界接受任务信息,进行学习任务分解与调度,负责任务的排队,并通过网络协调与合作伙伴的关系;中间层由动态单元任务控制Agent和相关资源调度Agent构成,其根据动态到来的任务即时生成,并负责某一任务的资源组织和协调;下层是代表多种用户资源Agent。各Agent间通过KQML语言进行协作通信。 (5)面向兴趣漂移的用户兴趣学习模型研究 拟采用隐马尔可夫模型(HMM),通过对Web Log文件的分析,建立带有兴趣漂移的用户.

.

点击流模型为一六元组(Q,?,?,?,q0,F),具体内涵如下: -Q为有限状态集; -∑=σ1,σ2,…,σM为符号集,本项目中为节点位置; -?:Q->∑为命名函数,其将某个符号e∈∑赋给各状态q∈Q; -?:Q×Q->[0,1]为一函数,其返回某个与状态迁移相关的概率; -q0为初始状态; -F:Q->[0,1]为终止函数,其返回某个状态为终态的概率; 从初始开始,用户转移到一个新的状态,观测到一个输出符号,如此反复,直到最终状态,于是便产生一个符号集X=x1,x2,…,xi.每一次转移存在一个转移概率P(q->q’),在某个状态观测到一个特殊符号的概率为P(σ|q)。则在HMM模型M上一个串X被观测的概率为在所有可能路径上求概率和: P(X,M)??l?1q1,...,ql?Qlk?1?P(qk?1?qk)P(xk|qk) 这里ql+1为最终状态,xl+1为终止符。 假设Web站点的节点为HMM的状态节点q,给定一个虚拟的初始状态qI,存在概念集∑=σ1,σ2,…,σT ,qj节点包含∑的一个子集(σj1,σj2,…,σjt),两个节点qi,qj间存在一个漂移概率P(qi->qj)。获取用户点击流兴趣模式就是寻求一个状态序列V(X|M),使其具有观测序列的最大概率: V(X|M)?argmax?P(qk?1?qk)P(xk|qk). q1,...,ql?Qlk?1l?1(6)用户个性化信息推荐算法研究 面向用户兴趣漂移的个性化信息推荐算法研究主要包括:带有兴趣漂移的用户兴趣获取、基于当前兴趣或知识库的在线推荐、在线推荐信息个性化排序等方面。基于此,设计一种优化的个性化空间信息推荐算法,主要包括:带有兴趣漂移的用户兴趣获取算法、在线推荐算法、推荐信息排序算法等。 (7)演示系统开发与测试 本项目产品的开发是要发展到现实与虚拟的接轨,二维向三维的过渡,致力使国际互联网应用虚拟现实化、3D可视化、信息交互人性化。在建立整个虚拟数字地球的基础上,实现各个方面的数据对接和应用。因为三维数字城市需要高的运行效率,所以主要功能包括现有的三维引擎都采用C/C++语言实现,这可以尽可能的得到高的执行效率。对于一些对效率不是要求太严格的采用RAD工具开发,或者直接通过网站开发实现应用。这解决了执行效率与开发效率的均衡。 (七)计划进度安排 本项目研究期限为1年(2009.1.1-2010.12.31): 1)理论基础研究阶段(2009.1.1-2009.5.31)。全面开展相关理论与关键技术研究,包括:分布式环境下并行图像渲染技术、低配置下空间数据的整合与交互技术、基于Web点击流的空间数据挖掘相关理论基础与关键技术研究、多Agent系统理论基础与相关任务调度技术研究、个性化信息推荐技术等相关研究。 2)理论深入与系统开发阶段(2009.6-2010.10.31):整理和深化课题组已有的和本项目研究相关的理论成果,在国内外重要学术刊物上发表高水平学术论文;与此同时,开展行业应用调查与需求分析,全面开展演示系统软件和相关工具的研发,形成相关的软件产品原型。 3)应用验证与成果总结阶段(2010.11.1-2010.12.31):在前面研究开发与应用的基础.

.

上,进一步提炼完善方法技术体系,形成系列成果;验证本项目提出的理论方法和策略及技术成果。最后,对课题进行全面总结,准备结题验收。 3.与本项目有关的工作条件(包括研究工作基础、实验条件等) (一)研发基础与条件 现有的主要相关研究基础与工作条件: (1)研发团队:本项目负责人现为浙江省计算机应用技术专业带头人,浙江省首届青年教师科研基金资助对象,获浙江省首届“教坛新秀”称号;近五年来,主持并完成浙江省教育厅科研项目2项;参与省教育厅科研项目1项、宁波市自然科学基金项目1项、浙江省新世纪教改项目1项;以第1作者在国家二级(浙江大学标准)以上核心期刊公开发表学术论文10多篇,其中EI检索4篇,ISTP检索1篇。主持开发“宁波市公安系统数据交换平台(”与上海IBM合作)等大型信息管理系统多个。 本项目组直接从事研究开发人员6人,在图形图像处理、数据挖掘、多Agent系统分布式计算、模式识别等方面开展工作多年,承担过多个省级或国家级项目。项目产品开发人员18人,专门从事相关技术研究的高级职称(含高工)人员5名,已拥有一支结构合理、经验丰富的技术研发队伍,在该技术领域具有雄厚的技术实力和丰富的实践经验。 (2)本项目的研发技术基础: 2007年,在宁波市科技局的科研项目资助下已开始基于Web的3d虚拟景观系统的研发工作,对基于Web的3d虚拟景观系统的实现技术有了全面而深入的了解,对今后项目的研究路线以及要解决的关键问题也有了比较清晰的认识。 校企合作项目研发2年来,一直致力于Web环境下3D景观生成应用系统的研制、开发、生产,实现了部分关键技术的突破,并取得一定的研发经验,并于2008年3月通过了浙江省宁波市软件评测与服务中心软件评测中心的检测,前期模块已经软件产品著作权已受理。已完成的研究内容包括: 1)在低带宽(512K)下海量数据高效率传输与分布式传输; 2)在普通PC机的配置下,以很少的图像自动优化到适配当前环境从而达到逼真显示三维数字城市场景; 3)完美的组合二维空间数据和三维场景中的三维空间数据的互动; 4)根据当前的应用环境进行海量数据的加载优化; 5)三维GIS方面应用的测量与导航。 (3)项目的研发条件:本项目研究工作的开展将主要依托校外合作企业和我校计算机应用研究所。 合作企业成立以来,一直致力于低配置下3D数据交换3D景观生成应用系统的研制、开发、生产。目前,公司已拥有一支结构合理、经验丰富的技术研发队伍,直接从事研究开发人员占员工总数的32%,在本行业多年的经验,以及一大批年富力强的工程师和技术员,在该技术领域具有雄厚的技术实力和丰富的实践经验;另外,公司拥有高档图形图像处理设备5台(套);承担企业已投入研究开发费30万元,以后公司每年提取年销售收入的10 %的费用作为项目的研究开发经费。这些均将为项目的成功实施提供有力的保障。 我校计算机应用研究所内配有研究开发所需的PC Server(Intel Pentium 多核处理器,2G内存,120G硬盘,Linux/Windows OS)多台,具有基于网格技术的Oracle10g数据库服务平台及基于J2EE技术的WebLogic应用服务环境。这些均为本项目的开展奠定了厚实的物资基础。项目承担单位拥有服务器、工作站、高档微机数十余台,有丰富的软件平台及开发工具,为本项目的研究与开发工作提供了优越的条件。 (二)已取得的研究开发成果 目前项目协作单位已开发出具有代表性的核心产品:基于Web的3d虚拟城市信息系统.