北京物资学院2008届毕业论文(设计)
企业的根本属性是以盈利为目的,不仅是短期盈利,更重要的是可持续的长期盈利。传统的业绩评价中反映盈利能力的指标主要是从企业的角度来反映盈利水平,而没有从市场角度来反映股票的增值水平。经营业绩良好的上市公司应该表现出较高的成长性,成长性好的上市公司在总资产扩张能力、股本扩张能力、资产重组等方面都比较强。
因此,应增加市场投资回报率、股价波动率等指标来反映股票的增值水平,即市场表现,充分体现上市公司的投入回报特性。
3、评价指标权数的确定不够科学。
在一个指标集合中,指标权数是每项指标所占有的比重。在传统的评价体系中,采用专家意见法和相关性权重法来确定每个指标的权数。前者的权数一般凭经验来确定,主观性较强,综合评价的结果与实际状况出入较大;后者的权数中考虑到财务指标之间的相关性问题,因此在确定权数时进行相应调整。
如果能将多个相关指标转换成少数几个个不相关的综合指标,就可以避免确定权数时因调整带来的偏差。因子分析就是将大量的彼此可能存在相关关系的变量转换成较少的,彼此不相关的综合指标的一种多元统计方法。这样既可减轻收集信息的工作量,且各综合指标代表的信息不重叠,便于分析。
准确、有效地反映上市公司当前的经营状况是评价的最终目标。因此,本文将使用数据挖掘中的因子分析技术从复杂的财务指标中提取几个不相关的主要因子,建立基于因子分析的业绩评价模型。
2.2财务业绩评价的基本指标
现代财务管理理论认为,企业的财务状况主要取决于企业的盈利能力、偿债能力、运营能力和成长能力。依据这一思路以及综合考虑目前我国股市和上市公司的实际情况,本人认为要从上市公司的财务效益、资产质量、偿债风险、发展能力和主营业务鲜明状况等几个方面来反映上市公司的经营业绩,对每个方面均设置若干财务指标来反映其真实状况。每项指标只反映公司的某一方面情况,因此选取指标必须具有代表性,这样综合起来进行分析才能客观反映企业的真实业绩,对公司的业绩做出准确、全面的评价。
本文提出用数据挖掘中比较成熟的多元统计方法来评价企业的财务业绩状况,能够比较客观地反映了企业的实际状况,同时避免了人为因素带来的偏差。本文以财政部评价指标体系中的基本指标为主,选择以下指标:
X1:每股收益(元)
X2:加权平均净资产收益率(%) X3:主营业务利润率(%)
5
[2]
北京物资学院2008届毕业论文(设计)
X4:总资产周转率(%) X5:流动资产周转率(%) X6:资产负债率(%) X7:主营业务增长率(%) X8:总资产利润率(%) X9:市场投资回报率(%) X10:股价波动率(%) X11:年末资产总额(亿元) X12:主营业务收入净额(亿元) X13:净利润(亿元)
上述这些指标基本上能涵盖上市公司的财务效益、资产质量、偿债能力、发展能力和主营业务鲜明状况等状况,可以客观地反映公司情况。
2.3分析方法
对上市公司的业绩评价必须建立在对各种历史数据分析的基础上。数据挖掘就是在对大量历史数据探索后,揭示出其中隐藏着的规律性内容,并由此进一步形成模型化的分析方法。只要有分析价值与需求的数据,皆可利用数据挖掘工具进行有目的的发掘分析[3]。 2.3.1数据挖掘概述
数据挖掘采用数学的、统计的、人工智能和神经网络等领域的科学方法,如记忆推理、聚类分析、关联分析、决策树、神经网络、等技术,从大量数据中挖掘出隐含的、先前未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程[4]。
数据挖掘综合了各个学科技术,有许多功能,主要有:
1、分类:按照分析对象的属性、特征,建立不同的组来描述事物。分类的目的是学会一个分类模型,该模型能把数据映射到给定类别中的某一个类别。分类可用于预测。
2、聚类:识别出分析对内在的规则,按照这些规则把对象划分成若干类或簇。划分的原则是同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。与分类不同的是,聚类时类事先未知,类的形成由数据驱动。
3、关联规则:关联是某种事物发生时其他事物会发生的这样一种联系。数据之间的关联是复杂的,而且大部分是蕴藏的。关联知识挖掘的目的就是找出数据中隐藏的关联信息,因而对商业决策产生价值。
4、预测:数据挖掘是为了揭示分析对象发展的规律,把握事物发展的趋势,
6
北京物资学院2008届毕业论文(设计)
对未来的趋势做出预见。
5、偏差的检测:对分析对象少数的、极端的特例描述,揭示内在原因。 除了以上所列出的功能外还有时间序列分析等一些其他功能。数据挖掘的各项功能并不是独立存在的,必须在数据挖掘中互相联系才能发挥作用。 2.3.2数据挖掘流程
使用数据挖掘方法建立评价模型包括以下几个步骤:
1、获取原始数据,对原始数据进行抽样,选取有代表性的数据形成一定数量的子集作为样本;
2、对样本数据进行初步分析,从众多的相关变量中提取能描述大多数信息的少量几个不相关因子代替原始指标;
3、通过计算、分析,确定各因子权数,建立评价模型; 4、根据模型计算上市公司因子得分和综合得分; 5、利用模型对各上市公司财务业绩做出综合评价。 建立评价模型的流程见图1。
图1 数据挖掘流程
评价 Assess 综合 评价 建立模型 Model 因子分 析模型 数据分析 Analysis 提取 因子 数据取样 Sample 选取 样本 [5]
数据探索 Explore 聚类 分析 目前,我国有上千家上市公司,年度报表中反映公司业绩状况的数据成千上万,对所有数据进行分析是不可能的也是没有必要的,怎样在众多原始数据上进
7
北京物资学院2008届毕业论文(设计)
行抽样,得到能反映真实情况的数据样本非常关键。因此,建立模型流程中的第一步就是在众多企业中选取有代表性的行业、有代表性的上市公司,选取在评价中起重要作用的指标,形成构建模型的样本数据,以此作为数据分析的基础。
本文应用数据挖掘中多元统计的知识,对提取的样本数据进行初步分析,使用SPSS10.0 for Windows软件计算样本数据的财务指标值,利用因子分析法从关系错综复杂的指标中综合出数量较少的因子,根据数据挖掘的目标和数据的特征,建立基于因子分析的业绩评价模型。
2.4实证分析的原始数据
截至2005年末,我国信息技术行业A股上市公司共有82户,其中:沪市53户,占64.6%,深市29户,占35.4%。本文以中国所有信息技术业上市公司为例,根据中国上市公司资讯网(www.cnlist.com)公布的2005年报数据,以此为样本进行计算,构建财务业绩评价模型。选择信息技术行业上市公司的数据作为样本进行实证分析的意义有以下几点。
1、信息产业具有其他行业无法比拟的优势。
二十一世纪进入信息时代,席卷全球的信息科技给人类的生产和生活方式带来了深刻变革,信息产业已成为推动国家经济发展的主导产业之一,信息技术已经成为推动科学技术和国民经济高速发展的关键技术。在过去5年中,信息技术业经历了年28%的增长速度,是同期国家GDP增长速度的三倍,对GDP增长的拉动作用已进一步增强,对我国国民经济增长的贡献率不断提高,这是其他行业所无法比拟的优势。
2、信息业面临难得的发展机遇。
信息技术行业中大部分个股的收益水平比较高,整体素质较好。根据我国加入世界贸易组织信息技术产品协议2005年实行零关税的承诺,从2005年1月1日起,信息技术产品所涉及的251个税目全部实现零关税,中国信息技术业享受与其他世贸组织国家同样的基本权利,这对国内的信息技术业是难得的发展机遇,再加上我国人力资源低成本的优势,该行业在国际市场上的竞争力将有所加强。
3、信息技术业具有较强的创新能力。
IT行业是最具有创新能力的行业,与其他行业不同,技术创新是IT行业发展的根本推动力。《国家中长期科学和技术发展规划纲要》指出,要使我国信息产业技术水平进入世界先进行列,要掌握集成电路及关键元器件、大型软件、高性能计算机、宽带无线移动通信等核心技术,提高自主开发能力和整体技术水平。在国家大力扶持自主创新的政策下,信息技术行业上市公司的业绩将会取得长期增长。
8