华为硬件总体设计模板 下载本文

请输入密级

8.4 大规模逻辑与其他单元的接口

<给出单板与大规模逻辑之间的接口说明。主要可以从以下几个方面入手:

1、加载说明:FPGA支持的加载模式,为了支持这些加载模式,单板应该在硬件上有什么配合等;

2、FPGA的时钟要求:FPGA有哪些输入时钟,这些时钟应该满足哪些要求; 3、CPU接口的要求:寄存器的配置次序等;

4、业务接口的要求:业务配置可以有哪些方案,哪些配置是不支持的等。

本节应给出框架配套方案。本节主要是需要证实相关模块的方案是配套的,并且经过理论和实验的验证是可行的、能够达到系统功能和性能要求>

9 单板的产品化设计方案

<本章主要是考虑单板的设计如何满足、支撑产品系统(整机)的工程设计要求,大部分内容必须与产品整机系统的工程设计方案配套考虑>

9.1 可靠性综合设计

<为满足系统可靠性要求,给出单板设计的可靠性的综合要求(本节只是给出综合指标和方案。对于支撑实际可靠性的具体专项的细节,在其他章节中说明)。 给出各单板失效率(FITs)、故障定位率要求,并给出达到这些指标要求的措施。 本节由硬件开发人员负责,可靠性工程师提供指导和审核。>

9.1.1 单板可靠性指标要求

<根据产品需要满足的任务可靠性指标(可用度)和基本可靠性指标(产品平均年返修率)要求,分解分配得到各单板的基本可靠性指标要求(失效率或单板年返修率)。

注意:本节给出的失效率估算数据,是根据器件本身特性,在假定工作条件良好的情况下的数据。实际的数据,则会受到实际条件的影响;要求有关热设计、EMC、信号质量、等影响因素,必须保证器件手册和相关规范的要求,才能使单板可靠性达到甚至超过估算值。

这个估算值,作为单板可靠性指标的评估和可靠性试验的参考标准(即设计要求)。>

1)产品规格书文件中对本板的可靠性指标要求(直接引用):

Page 17,Total 31 第17页,共31

请输入密级

2)单板失效率(FITs)估算表,1FIT=1×10exp(-9) (1/h)

<本节需要填写单板的估计器件数量。最右边一列利用表格文件的公式计算功能,不要手工计算。>

表4 单板失效率估算表

单板型号 预计人员 注意:一般情况下只需要填写“器件数量”一列;如有必要,可以修改下列λ经验值,或增加新的特殊器件(替换“其他”项,并修改λ经验值)。 1FIT=10 exp(-9)(1/h) 器件类型 估计器件数量(N) 单个器件故障率λ 所有该类器件的故障经验值(FIT) 率 N×λ(FIT) 0.1 0.0 0.2 0.0 100 0 20 0 5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.0 !除数为零 0 电阻 0 电容器 0 二次模块电源 0 专用集成芯片 数字逻辑电路芯片、接口电路芯0 片、线性电路芯片 5 厚膜、音频及通信网口变压器 0 0 1 感性器件 0 8 继电器及接触器 0 40 晶体振荡器 0 15 滤波器 0 12 接插件 10 开关、保险管套件、显示器件 0 0 4 晶体管、光电耦合器 0 40 传感器 0 1800 光电器件 0 700 激光驱动器 0 1200 光分路器 0 500 波分复用器 0 300 光纤衰减器 0 600 光开关 0 80 射频功率放大器IC 0 100 射频开关 0 25 电池 0 3000 风扇 0 0 其他1 0 0 其他2 总计λ (10 (exp-9)·1/h) 估计等效MTBF = 1 / 总计λ (小时) 注意:如果以上的单元格发生了更改,请务必选定最右列,然后按 F9,更新计算结果。 提示: 上表中的数据仅用于估算,不需要严格准确。一般要求关键器件(单个FIT值较大的)应当精确到一个;对于数量较多、单个FIT值较小的阻容类元件和普通集成电路,数量误差小于20%即可。 估算结果是否能符合系统产品规格书文件中要求的标准:

Page 18,Total 31 第18页,共31

请输入密级

<上述估算的准确性,主要是为了区分失效率较高的单元和关键器件,原则上只需要精确到数量级一致;其中个别特殊器件/单元可以单独估算比较。如果发现不能符合要求(差别很大),请务必及时向系统工程师和硬件经理反馈,并讨论制订补偿优化措施。几种参考措施如下:

1、修改器件选型方案,把最失效率最高的器件换成其他功能性能相近的器件,例如采用更高等级的器件、其他供应商的器件等;

2、修改电路方案,必要时可修改系统方案。例如进行单元电路备份设计,或改变电路实现原理(避开失效率较高的器件)等;

3、强化降额设计。即;比通用的降额标准更进一 步降额;

4、增强故障管理、可维护性设计。把容易损坏的器件或电路单元,通过系统监控电路和软件,进行重点监控,并且进行易于维护更换的设计,一旦损坏,可以立即更换,从而把器件损坏造成的业务影响降到最低。需要软件配合实现。>

有关本板可靠性指标的实际保障措施参见本章其他各小节。

3)故障定位率

<对于致命故障(I类)、严重故障(II类)故障定位到单个现场可更换单元(如单板)通常要求为100%,对于一般故障(III类)通常要求为85%。对轻微故障(IV类)通常不做要求; 目标值:>

措施:

9.1.2 单板故障管理设计

<说明单板设计对故障检测、故障隔离、故障恢复等故障管理的要求。本节属于板间信号级FMEA分析,介于系统级FMEA和器件级FMEA之间。其中器件级FMEA在详细设计中完成。

本部分需要事先完成产品系统级FMEA分析,相关内容可引述《系统级可靠性FMEA分析报告》的描述。>

1)主要故障模式(FMEA)和检测措施分析

<需要给出本单板不同故障严酷度级别的定义(各产品的严酷度级别是各自定义的),与背板接口信号的可靠性系统级FMEA(故障模式影响分析)分析,以及经过可靠性分析对软件、硬件分别提出的故障管理需求和对测试提出的故障验证需求。并给出减小发生故障可能性的方案。注意参考相关的器件失效分析案例。有关严酷度的概念和评估原则,参见可靠性系统工程培训材料。

本节需要给出本板所有外部接口信号的具体故障模式分析。 可以引用单板系统级(接口信号) Page 19,Total 31 第19页,共31

请输入密级

的FMEA分析报告。>

表5 板间接口信号故障模式分析表

<对于较简单的情况,请直接在下表中填写;对于较复杂的情况,请填写《板间信号级FMEA

分析表格.xls》、《板间信号级可靠性FMEA分析报告.doc》 ,并将此文件作为附件嵌入本节。(表中的文字是示例,编写正式文档时请删除):>

严酷检测灵补偿措施故障模对本板度类故障检测方法(建敏度信号名称 对系统的最终影响 (建议增式 的影响 别(改议增加) (建议加) 进前)增加) state_ne常高,MPU对对MMPU板无意II 从控制通道,定时定时检如发现某t[0:1] 断路 网板主义,有GE接口单板冗余读取MNET测 NET板状备状态如LPU板需要利用板主备状态 态信号错判断错该信号控制误,告警 误 VSC7132。 常低,MPU对对MMPU板无意II 从控制通道,定时定时检如发现某短路 网板主义,有GE接口单板冗余读取MNET测 NET板状备状态如LPU板需要利用板主备状态 态信号错判断错该信号控制误,告警 误 VSC7132。 PWR_C常高、与电源与电源框、风扇框II 协议保证检测频 OM0_R常低、框、风扇串口通信中断 率,与风扇框通信X+- 短路、框串口中断后,建议查询严酷度类别(改 进后)III III 断路 通信中断

2)硬件故障管理需求

各单板温度,必要时可单板断电 <根据板间信号级FMEA分析结论,确定单板原始告警信息,对硬件故障检测、隔离、恢复提出需求。需要区分在线检测、离线检测(装备检测)、功能检测和调试测试、自检的需求和差异>

3)软件故障管理需求

<根据板间信号级级FMEA分析结论,对相关软件支持硬件故障检测、隔离、恢复的功能提出需求。需要区分在线检测、离线检测(装备检测)、功能检测和调试测试、自检的需求和差异>

4)测试验证需求

Page 20,Total 31 第20页,共31