数据库系统工程师笔记
第一章第一章 计算机系统知识计算机系统知识 1.1. CPU 由运算器和控制器组成; 控制器由程序计数器 (PC) 、 指令寄存器 (IR) 、 指令译码器(ID) 、状态条件寄存器、时序产生器和微操作信号发生器组 成。 a) PC: pc 自动增加一个值, 指向下一条要执行的指令, 当程序转移 时将地址送入 PC。 b) IR:用于存放当前要执行的指令。 c) ID:对现行的指令进行分析,确定指令类型、指令要完成的操作和寻 址方式。 2.2. CPU 的基本功能: a) 程序控制 b) 操作控制 c) 时间控制 d) 数据处理——CPU 的根本任务 3.3. 计算机体系结构和计算机组成的区别: 体系结构要解决的问题是计算机系 统在总体上、 功能上需要解决的问题, 而计算机组成要解决的是逻辑上如 何具体实现的问题。 4.4. 输入/输出:直接程序控制、中断方式、直接存储器存取(DMA) 。 5.5. 输入输出处理机。 6.6. 流水线技术------------------------------P30 7.7. 信息安全的基本要素: a) 机密性 b) 完整性 c) 可用性 d) 可控性 e) 可审查性 8.8.计算机安全等级(技术安全性、管理安全性、政策法律安全性) :分为四组七个等级。 组 1 2 安全级别 A1 B3 B2 B1 C2 C1 D(最低级) 3 4 9.9.计算机病毒的特点: a) b) c) d) e) 寄生性 隐蔽性 非法性 传染性 破坏性 计算机病毒的类型: 系统引导型病毒————BOOT 型病毒 文件外壳型病毒————攻击 文件 混合型病毒————Flip 病毒、One Half 病毒(幽灵) 目录型病毒————改变目录项不敢变相关文件 宏病毒————用宏的 word 或是 excel 文件 计算机可靠性:平均无故障时间(MATBF=1/λ) ;计算机正常工作的概率 MTBF 10.10. a) b) c) d) e) 11.11. A= MTBF+MTRF(MTRF 平均修复时间) 。——————P55 12.12. 13.13. 计算机的 RAS 技术是指可靠性(R) 、可用性(A) 、可维性(S) 。 计算机可靠模型: a) 串联系统:可靠性等于 R=R 1R2…RN;失效率 λ=λ1+λ2+…+λN b) 并联系统:可靠性等于 R=1-(1-R 1)(1-R2)…(1-RN) c) N 模冗余系统: 14.14. 计算机故障诊断技术 a) 计算机的故障: i.永久性故障 ii.间隙性故障 iii.瞬时性故障 第二章第二章数据结构与算法数据结构与算法 1.1. 线性表的顺序存储结构: 查找表中第 i 个元素LOC(a i) = LOC(a1)+(i-1)*L 2.2. 线性表的链式存储结构: 数据域指针域 3.3. 线性表的插入和删除 a) 顺序存储:E insert = n/2 Edelete =(n-1)/2 b) 链式存储: 4.4. 栈的顺序存储:采用两个顺序栈共享一个数据空间: 栈底 1栈顶 1…栈顶 2栈底 2 5.5. 队列:只允许在表的一端插入元素(队尾) ,另一端删除元素(队头) 。 6.6. 数组————————————————P73 第三章第三章 操作系统知识操作系统知识 1.1. 操作系统的类型: a) 批处理操作系统(单道和多道) b) 分时系统(多路性(同时性) 、独立性、交互性、及时性)注:UNIX 是多用户多任务的分时系统。 c) 实时系统——高可靠性 d) 网络操作系统 e) 分布式操作系统 f) 微机操作系统 g) 嵌入式操作系统 2.2. 利用 PV 操作实现进程的互斥和同步。 3.3. 网络操作系统 a) 集中模式 b) 客户机/服务器模式 c) 对等模式 第四章第四章程序设计基础程序设计基础 第五章第五章网络基础知识网络基础知识 第六章第六章多媒体基础知识多媒体基础知识 1.1. 多媒体的特征: a)a) 多样性 b)b) 集成性 c)c) … 2.2. 波形声音:——————P326 a)a) 未经过压缩的 数据传输率(b/s)=采样频率(Hz)*量化位数(b)*声道数 b)b) 经过数字化后所需的存储空间 声音信号数据量=数据传输率*持续时间/8(B) 注: 语音信号的采样频率一般为 8KHz, 音乐信号的采样频率则应该在 40KHz 以上。 第七章第七章数据库技术基础数据库技术基础 1.1. 数据库(DB)是指长期存储在计算机内的,有组织的, 可共享的数据的集 合。 2.2. 数据库系统(DBS)由数据库、硬件、软件和人员组成。 3.3. 数据库技术的发展: a)a) 人工管理阶段 b)b) 文件管理阶段 c)c) 数据库系统阶段(有较高的数据独立性) 4.4. 数据模型的三要素: a)a) 数据结构 b)b) 数据操作 c)c) 数据的约束条件 5.5. 数据模型分为:概念数据模型(E-R 模型)和基本数据模型(层次、网状、 关系模型)和目前提出的对象模型。 6.6. 实体属性 a)a) 简单属性(不可再分)和复合属性(可分如地址(省份、市…) ) b)b) 单值属性(只有一个值)和多值属性(如电话号码可有多个) c)c) NULL 属性(没有或是未知) d)d) 派生属性(从其他属性可推出来) 7.7. E-R 法的构件: 8.8. 扩充的 E-R 模型 a)a) 弱实体(要依赖另一个实体而存在) b)b) 特殊化————P375 9.9. 数据库系统的体系结构 a)a) 三级模式结构(三层两映像) i. ii. 数据物理独立性 数据逻辑独立性 b)b) 集中式数据库系统 c)c) 客户/服务器数据库体系结构 d)d) 并行数据库系统(多个 CPU)————P387 i. ii. 共享内存式多处理器 无共享式并行体系结构 e)e) 分布式数据库系统 f)f) Web 数据库 10.10.数据库的控制功能 a)a) 事物管理(不可分割的逻辑工作单位) i. ii. iii. iv. 原子性:要么都做要么都不做 一致性:只包含成功提交的是事物 隔离性:多个事物并发执行时是相互隔离的 持久性:一旦事物成功提交则永久的反应到数据库中 b)b) 故障恢复 i. ii. iii. iv. 事物内部故障 系统故障 介质故障 计算机病毒 v.恢复方法:静态转存和动态转存、海量转存和增量转存、日志文 件 vi.事物恢复步骤:反向扫描文件日志、对事物的更新操作执行逆操 作、继续反向扫描日志文件,直到事物的开始标志 vii.数据库镜像 c)c) 并发控制 i.并发操作带来的问题:带来数据的不一致性(丢失更新、不可重 复读和读脏数据) ;破坏了事物的隔离性。 ii. iii. 并发控制的技术:封锁,排他锁(X 锁)和共享锁(S 锁) 三级封锁协议:一级:解决丢失更新;二级:解决读脏数据;三 级:解决不可重复读 iv.并发调度的可串行性:可串行化是并发事物正确性准则,当且仅 当可串行化时才是正确的并发调度 v. vi. 封锁的粒度:封锁的范围 事物是不能嵌套的,因为违背了事物的原子性;当且仅当当前没 有事物执行时才能开