(二)常见概率分布
1.Discrete uniform distribution 离散型均匀分布
所有可能的结果概率相等,且结果是不连续的 股票报价是离散的。 2.Binomial distribution
二项式分布,来源于贝努力试验(bernoulli) 是做n次贝努力试验(如抛掷硬币)
E(X)=np
Variance of X=np(1-P)(此处是方差公式,标准差还要开根号) 3.continious uniform distribution 连续均匀分布
4.Normal distribution
X~(μ, σ^2) (1) 决定其形态的变量有μ和σ两个,当μ=0且 σ=1时为标准正态分布 (2) Skewness=0,kurtosis=3 (3) 如果X、Y都服从正态分布,那么aX+bY也服从正态分布 (4) 两尾逐渐接近X轴但不相交,英文表达为:the tail gets thin and go to zero but extend infinitely。 (5) 置信区间
(6)
standard normal distribution
17
Z-value
5.Lognormal distribution 对数正态分布
(1)如果lnX服从正态分布,则X服从对数正态分布 (2)右偏
(3)随机变量取值一定是正数
(三)其他 1.第一安全比率
Roy’s safety-first criterion (第一安全比率)越大,那么投资面临的shortfall risk(价格掉到某个水平之下的风险)越低。
RL为某一警戒收益率,也被称为threshold level return 用第一安全比率来选择组合: 2.Monte carlo simulation & historical simulation 两种分析方法的比较
MC考虑进了极特殊的情况,缺点是需要复杂的假设分布 HS操作简单,但是没有考虑极端情况
18
六、sampling and estimation
(一)相关概念 1.抽样:
Simple random sampling——简单随机抽样 Systematic sampling——系统抽样
Stratified random sampling——分层随机抽样
Sampling error——抽样误差,是样本统计量与总体参数的差值,由于抽样造成的误差。如mean的抽样误差=?x—? 2.Data分类:
Time-series data——时间序列,如不同公司不同时间段数据对比
Cross-sectional data——横截面数据,如同一时间段上不同公司数据对比 Longitudinal data——纵向数据 Panel data——横向数据 3.Centra limit theory
中心极限定理
从总体population中进行简单随机抽样
当样本容量n≥30且总体均值方差已知(分别为?,σ^2),那么无论总体服从什么分布,仍有以下结论:
?x~N(?,σ^2/n)(样本均值服从正态分布) 4.Standard error of the sample mean
总体方差已知用中体,未知用样本方差
(二)估计方法 1.Point estimate
点估计
即用单个样本统计量估计总体参数,例如?x即为?的点估计量 2.Student’s T distribution
(1)正态分布的普遍形式,对称
(2)决定t分布的变量为自由度n-1,自由度越大越接近正态分布 (3)低峰肥尾,因为不要求与正态分布的离散程度一样
(4)相同的显著性水平下,t分布比正态分布对应的置信区间更宽 3.Confidence interval估计 (1)步骤
Level of significance——显著性水平α Degree of confidence——置信度1—α
19
Reliability factor——Zα/2
以总体均值置信区间估计为例,可以有以下两种公式
由于公式所示,σ上升或者n下降会让置信区间变宽 估计方法选择:
总体方差已知用Z,总体方差未知用t,非正态总体小样本不可估计 α和Zα/2是反向变化的。 (2)结果的表述方法
4.好的估计量特点
(1)unbiased 无偏性——E(?x)= ?
(2)efficient 有效性——选择方差小的估计量
(3)consistent一致性——当样本size越大,估计越来越准确(常考)6.误差分类
(1)data-mining bias,把偶然当必然
(2)sample selection bias,无意识地选择了一些特定样本
(3)survivorship bias存活偏差,比如hedge fund会高估收益率 (4)look ahead bias用将来才能知道的数据 (5)time-period bias
七、Hypothesis test
(一)假设检验步骤 1.Critical value method
关键值法
(1)设H0和Hα
set null hypothesis and alternative hypothesis H0原假设——比较怀疑的放在原假设里 Hα备择假设——想证明的放在备择假设里 等号一般在原假设
One tailed & two tailed hypothesis (2)确定Test statistic 检验统计量的确定
(不用记,只对t分布和Z分布有用)
20