增值电信业务经营许可证(SP许可证)申请-可行性分析报告范文模版[方案之家]1 下载本文

欣晨制作

运营分析系统主要包括:

? 为根据不同管理部门的需求进行各种主题分析处理,形成规定格式的报

表,并向相关的部门提供业务预测和决策分析。 ? 提供报表功能和展示功能。

以数据仓库(Data Warehousing)、在线分析处理(OLAP)、数据挖掘(Data Mining)3种技术的整合为基础,通过对业务支撑系统中的用户数据、产品数据、帐务结算数据、日志数据进行抽取,建立数据中心和业务分析模型,提供全面的、多视角的、面向主题、灵活的主题分析,为广电各级管理者提供经营和决策的支持。

运营分析系统主要分为三大部分:

第一部分是数据源,这一部分是现有系统数据源(包括现有的以及历史的用户数据、产品数据、客服数据、计费数据、帐务数据、系统数据等等数据),其特点是分散、很难相互共享和再次分析利用;

第二部分是数据中心和应用服务器,由数据仓库(ORACLE)及多维数据库(ORACLE EXPRESS OLAP引擎)组成,源数据经过抽取、清洗和转换之后装载到数据仓库中,数据仓库中数据的特点是集中的、经过清洗和转换的,便于进行分

欣晨制作

析;存储于多维数据库中数据的经过再次加工的数据,这些数据为商业智能分析模型提供了必要的分析基础;应用服务器,负责连接用户对多维数据库的查询访问;

第三部分是前端展示和数据挖掘工具,负责为用户展示分析后的结果。

3.2.4.2 先进的内存数据库技术

在当今电信领域,传统的一些业务支撑系统的架构已经逐渐不能满足日益增长的业务需求和客户需求,大量来自用户对数据访问的压力也开始日益成为被越来越多的技术人员所关注的一个热点话题。很多系统采取的较为普遍的解决方案便是:缓存+数据库。用缓存技术来减轻前台对后端数据库的访问压力。然而,如此一来,原有对应用系统的存储设计便分为两个不同的层次,即需要对缓存和数据库分别进行考虑,这无疑给那些架构设计人员带来了更多的负担和挑战。面对市场上五花八门的数据库产品和缓存技术解决方案,架构人员不得不认真筛选和考量,以选择适合不同场合应用场景的解决方案。

3G视频客户系统采用了内存数据库技术,使得缓存和数据库的设计问题可以合二为一,将数据放在内存中直接操作的数据库。相对于磁盘,内存的数据读写速度要高出几个数量级,将数据保存在内存中相比从磁盘上访问能够极大地提高应用的性能。同时,内存数据库抛弃了磁盘数据管理的传统方式,基于全部数据都在内存中重新设计了体系结构,并且在数据缓存、快速算法、并行操作方面也进行了相应的改进,所以数据处理速度比传统数据库的数据处理速度要快很多,一般都在10倍以上。内存数据库的最大特点是其“主拷贝”或“工作版本”常驻内存,即活动事务只与实时内存数据库的内存拷贝打交道。

3.2.4.3 丰富的3G视频呼叫接入方式

视频呼叫中心系统通过视频媒体网关接入3G网络;

视频媒体网关与3G网络的互联支持两种接入方式:3G 324M中继接入或SIP

欣晨制作

中继接入;

3G 324M中继接入时,可支持多种的信令控制,如SS7、ISDN等; 用户可以采用3G手机以视频电话的方式拨打特服号码,进入视频呼叫中心系统,获取IVVR或者视频坐席的服务;

对于3G 324M中继端口较少的运营商,也可以将3G视频呼叫转换为SIP呼叫,走SIP中继路由到视频媒体网关;

互联网用户支持直接采用IP视频终端或者计算机终端发起支持视频的SIP网络电话,进入视频媒体网关;

视频媒体网关支持多级集群接入,每一个节点同时支持3G 324M中继和SIP中继的接入。视频媒体网关主要由Dialogic网络接口卡+Dialogic HMP软件构成;

核心控制服务器作为视频呼叫中心系统的关首,管理所有周边通信设备,并提供接口与应用服务器开发和集成。支持双机热备方案。

视频坐席终端既可以支持IP视频终端,也可以直接采用计算机终端。

3.2.4.4 自动摘要

在舆情分析过程中,通过自动摘要简明、确切地描述聚出来话题的中心内容,摘要是以提供文献内容概括为目的,不加评论和补充解释。

基于统计的自动摘要也称为自动摘录,是将文本视为句子的线性序列,将句子视为词的线性序列。包括以下步骤:

欣晨制作

? 原始文本处理:按照计算机能够识别的形式输入文本信息,比如:键盘输

入、手写录入、文本扫描、图形识别、语音识别等。 ? 词语权重计算:对原始文本信息中的\关键词\进行词频统计。

? 句子权重计算:根据句子中词频等信息计算句子权重。其标准为:句子权

重与句中所含\关键词\的数量成正比;文本信息中包含提示词,则提高句子权重;文本信息中特殊位置上的句子权重增加;若句子中包含废弃指示词则句子权重减小;句子长度与句子权重成反比。

? 文摘句提取:对原文中所有句子按权值高低降序排列,权值最高的若干句

子被确定为文摘句。

? 文摘句输出:将所有文摘句按照它们在原文中的出现顺序输出。

3.2.4.5 自动聚类、分类

采集回的互联网数据包罗万象,为减轻人工巡检舆情事件的负担以及撑控舆情事件的发展态势,系统定期对采集回的互联网数据进行自动聚类,形成近期互联网上最新、最热、敏感等话题。

自动聚类是基于相似性算法的自动聚类技术。根据文本内容的相似度,将内容聚合成不同的类别,同时对每一个聚得的类别,给出精确的类别主题词,包括最热话题、最新话题、敏感话题。主要包括以下几个步聚:

? 特征提取。

? 建立聚类相似矩阵,因为相似度是定义一个聚类的基础。 ? 用算法进行聚类。

同时,目前,大部分网站采用了AJAX架构,页面代码分析无法获取网站分