2) 密文:加密后的数据
3) 密码:将明文与密文进行相互转换的算法
4) 密钥:在密码中使用且仅仅只为收发双方知道的信息 2. 对称密钥加密
1) 加密方法的安全性依赖于密钥的秘密性,而不是算法的秘密性。 2) 密钥越复杂(长度越长),使用逐个试验的方法进行破解时就越困难。 3) 有n个用户的网络,需要n(n-1)/2个密钥 3. 公共密钥加密
1) n个用户的网络,就只需要n个私有密钥和n个公共密钥 2) 典型:RSA系统
A. 安全性建立在大整数质因子分解的难度之上 B. RSA需要1024位以上才有安全保障
3) 应用:信息的加密解密、数字签名(鉴别信息来源)
(三) 数字签名
1. 作用:真实性鉴别、防止否认 2. 实现方式:公共密钥加密方法 (四) 身份鉴别与访问控制
1. 身份鉴别
1) 又名:真实性鉴别、身份认证
2) 定义:证实某人或某物(消息、文件、主机等)的真实身份与其所声称的身份是否相符的
过程。
3) 目的:防止欺诈和假冒攻击。
4) 认证方式:IC卡、磁卡、USB钥匙、口令、眼底虹膜??
5) 在计算机系统中,单纯采用令牌(如IC卡,磁卡等)进行身份认证的缺点是丢失令牌
将导致他人能轻易进行假冒,而带来安全隐患。
2. 访问控制 (授权管理 authorization)
1) 通过对信息资源进行授权管理来实施的信息安全措施 2) 身份鉴别是访问控制的基础 3) 任务:
A. 对信息资源的访问进行有序控制
B. 根据用户的不同身份(类别)进行授权访问
C. 规定各个用户对系统内的每个文件或资源的操作权限(必须互不冲突)
(五) 防火墙
1. 定义:将因特网的子网(包括单机)与因特网的其余部分相隔离,以维护网络与信息安全的
一种软、硬件设备。
2. 功能:对流入流出防火墙的所有网络通信进行扫描检查(例如:使校外的IP地址不能直接访
问校内的网站)
3. 防火墙对网络或单台计算机均具有很好的保护作用 4. windows XP带有软件防火墙 5. 因特网防火墙可集成在路由器中 6. 局限性:
1) 防火墙防外不防内
2) 防火墙难于管理和配置,容易造成安全漏洞
(六) 计算机病毒防范
1. 计算机病毒:
1) 定义:一些人蓄意编制的一种具有寄生性和自我复制能力的计算机程序,它能在计算机
系统中生存,通过自我复制来传播,在一定条件下被激活,从而给计算机系统造成一定损害甚至严重破坏。
2) 特点:破坏性、隐蔽性、传染性和传播性、潜伏性(感染病毒后不立即产生破坏作用) 3) 主要传播途径:电子邮件等
A. 一般情况下只要不打开电子邮件的附件,系统就不会感染它所携带的病毒 B. 即使不上网,仍可能染毒
2. 计算机病毒防范
29
1) 安装杀毒软件(检测与消除计算机病毒最常用的方法) 2) 闪存盘写保护
3. 杀毒软件对计算机病毒的检测与消除能力通常滞后于病毒的出现,即杀毒软件、防病毒卡等
都不100%可靠
第5章 数字媒体及应用
一. 西文字符的编码——ASCII
(一) ASCII=美国标准信息交换码
基本ASCII 扩展ASCII (二) 标准ASCII:
相同 用一个字节(8b)存放 1. 采用7个二进位进行编码 不同点 高位为“0” 高位为“1” 2. 共有128个字符,包含96个可打印字符(常用字母、数字、标点符号等)和32个控字符 十进制 大小顺序 13 回车符(控制字符) 制字符
32 空格(控制字符) (三) 基本ASCII与扩展ASCII的比较:
48~57 数字0~9 (四) 常见字符的ASCII码对照表:
65~90 大写字母A~Z 二. 汉字的编码
97~122 小写字母a~z (一) GB2312
1. 1981年我国颁布了第一个汉字编码国家标准GB2312—80(6763个汉字) 2. 组成:
? 第一部分:字母、数字和各种符号
? 第二部分:一级常用汉字(共3755个),按汉语拼音排列 ? 第三部分:二级常用汉字(共3008个),按偏旁部首排列 3. 具体实现:
? 区位码:GB2312国标字符集构成一个二维平面,它分成94行(行号称为区号)、94列
(列号称为位号)。每个汉字的区号和位号分别用1个字节来表示。 ? 国标交换码:每个汉字的区号和位号分别加上32D(0010 0000B)。 ? 机内码(内码):把一个汉字看作两个扩展ASCII码,在国标交换码的基础上使两个字
节的最高位都等于“1”,即分别加上128D(1000 0000B)
GB2312-80字符集位号: 3………………9400 7E A1 FE 00 尾字节 区1号9:1655568712 字母、数字和各种符号一级汉字(3755个) 81 A1 GB2312图形符号 B0 GB2312汉字 代码空间 (6763个汉字) 94? 区位码、国标码、机内码的关系 4. 特点:早、小、双、简 (二) GBK
1. 1995年发布
2. 共有21003个汉字和883个图形符号
3. 支持繁体字,包含了中、日、韩认同的全部CJK汉字; 4. 双字节编码
5. 向下兼容GB2312-80 (三) GB18030
1. 2000年发布
2. 产生原因:保护我国已有的大量信息资源,既能与UCS/Unicode编码标准接轨,又能向下
兼容GB2312和GBK汉字编码标准
? 备注:UCS/Unicode:Windows、UNIX、Linux操作系统和许多最新的软件标准都在使
用UCS/Unicode。
30
…… ……二级汉字(3008个)(扩充使用) FE 首字节 F7 3. 共有27000多个汉字(收录字符最多) 4. 不等长编码
(四) BIG5:台湾地区的字符编码,不支持简体中文,与GB2312等大陆标准不兼容 (五) GB2312、GBK、GB18030、UCS/Unicode的比较 出现时间 GB2312 1981年 GBK 1995年 UCS/Unicode 能实现全球所有不同语言文字统一编码的国际编码标准 2万多汉字 是 不等长编码 1B、2 B、3 B 不兼容 GB18030 2000年 意义 最早 首次支持繁体 支持汉字数目最多 汉字数目 支持繁体 包含CJK 编码方式 6763个 否 否 双字节 21003个 是 是 双字节 27484个 是 是 不等长编码 1B、2B、4B 向下兼容GB2312和GBK 与UCS/Unicode接轨 兼容性 向下兼容GB2312 三. 文本的准备(输入) 文本信息输入
人工输入
键盘输入
联机手写输入
语音输入 自动识别输入
印刷体识别
手写体识别
(一) 汉字的键盘输入编码(即汉字的外部码)
1. 要求:易学、易记、效率高、重码少、容量大 2. 分类:数字编码、字音编码(字音编码)、字形编码(五笔字形)、形音编码 3. 注意:用不同的输入编码方法输入同一个汉字,其内码是一样的。 (二) 联机手写汉字识别——笔输入设备
(三) 印刷体汉字识别输入——扫描仪、OCR 四. 文本的分类
(一) 按是否具有编辑排版格式分:
1. 简单文本
1) 又称为纯文本、ASCII文本,其文件的后缀为“ .txt”(文本文件)
2) 定义:由一连串用于表达正文内容的字符的编码组成,几乎不包含任何其他的格式信息
和结构信息
3) 特点:没有字体、字号的变化,不能插入图片、表格、超链接 2. 丰富格式文本
1) 在简单文本中增加格式控制和结构说明信息
2) 标记:用来说明文本的版面结构、内容组织、文字的外貌属性等 3) 组成:正文 + 标记 4) 标记语言:
A. 普通:RTF
B. 网页:HTML(超文本标记语言)、XML(可扩展的标记语言) 5) 不同的文字处理软件使用的标记语言不同,Word无法打开“*.pdf”文件
(二) 按文本内容的组织方式分:
1. 线性文本 2. 超文本
1) 采用网状结构组织信息
2) 可以通过导航、跳转、回溯等操作,实现对文本内容更为方便的访问 3) 典型代表:Windows中的“帮助”文件(“*.hlp”文件)
(三) 按文本内容是否变化和如何变化分:
31
1. 静态文本:每次访问相同结果
2. 动态文本:文档内容变化(天气查询)
3. 主动文本:持续更新显示文档内容(股票行情查询)
五. 文本的编辑、排版与处理
(一) 文本的编辑、排版
1. 文本编辑软件“所见即所得” (WYSIWYG) 2. 解决文本的外观问题:
? 使文本正确、清晰、美观
? 例如:添加页眉和页脚、设置字体和字号、设置行间距,首行缩进 3. 常用排版软件:PDF Writer、PageMaker、方正飞腾 (二) 文本处理
1. 对文本中所含文字信息的形音义等进行分析和处理 2. 例如:
1) 字数统计 2) 文语转换 3) 文摘生成 4) 文本检索
A. 工作原理:用户先给出查询要求,然后由文本检索系统将查询近似结果返回给用户 B. 分类:
a) 关键词检索
b) 全文检索:允许用户对文本中所包含的字或词进行查询(查全率高) C. 用于Web信息检索的搜索引擎大多采用全文检索,使用robot软件遍历Web上的信
息资源
a) 如Google、Yahoo、天网、搜狐和百度等
b) Web信息是动态变化的,因此搜索引擎要不断的更新索引数据库
3. 常用文字处理软件:WPS、Microsoft Word、FrontPage、PDF Writer
? 微软公司的网页制作软件FrontPage也是一种功能丰富、操作方便的文字处理软件,它
不仅可以对字体段落进行格式编排,而且能够定义超链。
(三) 面向电子出版的最流行的软件是美国Adobe公司
各种输入码 的Acrobat,它使用PDF格式(Portable Document
Format)
交换码(国标码)
六. 文本的展现
(一) 文本展现过程: 内码
1. 对文本的格式描述进行解释 2. 生成文字和图表的映像 字形码 3. 传送到显示器或打印机输出
显示汉字 打印汉字 (二) 文本阅读器(浏览器):Word、Acrobat Reader、IE
(三) 字型库:
1. 简称字库,同一种字体的所有字符的形状描述信息的集合。
2. 字体VS字库:不同的字体(宋体、仿宋、楷体、黑体等)对应不同的字库 3. 字符集VS字库:在同一个字符集下,文本的输出所使用的字库不同 4. 2种不同的字库:点阵描述(计算存储空间)、轮廓描述(Truetype)
七. 计算机图像
(一) 定义:从现实世界中通过数字化设备(扫描仪)获取的图 (二) 又名:取样图像、点阵图像、位图图像 (三) 图像数字化过程:
1. 扫描:将画面划分为M x N个网格,每个网格称为一个取样点。 2. 分色:将彩色图像取样点的颜色分解成三个基色 3. 取样:测量每个取样点每个分量(基色)的亮度值 4. 量化:对取样点每个分量的亮度值进行A/D转换 (四) 数字图像获取设备:
1. 例如:扫描仪、数码相机等
2. 基本原理:通过光敏器件(CMOS或CCD)将光的强弱转换为电流的强弱,然后通过取样、
量化等步骤,进而得到数字图像
3. 可以通过参数设置,得到彩色图像或黑白图像
32