数据库与数据管理:基础概念与最佳实践

   日期:2024-12-29     作者:xhb273511       评论:0    移动:http://w.yusign.com/mobile/news/6830.html
核心提示:1、什么是数据库? 使用数据结构存储数据的仓库。2、什么是关系型数据库? 使用关系模型存储数据的数据库。 关系模

1、什么是数据库

使用数据结构存储数据的仓库。

2、什么是关系型数据库

使用关系模型存储数据的数据库。

关系模型指表与表之间的关系,包含一对一、一对多、多读多。

3、什么是非关系型数据库

使用非关系模型保存数据的数据库。例如列存储、键值对、文件形式。

4、说一说数据库三大范式

第一范式,表中字段是原子的,不可再分

第二范式,表中字段必须依赖主键的全部字段,不能只依赖一部分

第三范式,表中字段必须直接依赖主键,不能存在传递依赖。

其实真正的数据库设计并没有遵循三大范式,特别是OLAP型数据库

5、说一说对DML、DDL、DCL语言的理解

DML:数据库操纵语言,例如update、insert、delete对表中数据操作的语言

DDL:数据库定义语言,例如create、drop、alter、truncate等对数据库对象操作的语言

DCL:数据库控制语言,例如grant、revoke、commit、rollback、savepoint对事物控制的语言。

6、delete与truncate的区别

1)Delete是DML语言,truncate是DDL语言

2)delete删除时写undo日志,truncate不写undo日志

3)delete删除后可以找回数据,truncate是永久删除

4)delete可以全删也可以删除部分数据,truncate只能全部删除数据

5)delete删除高水位线不变,truncate删除会重置高水位线。

7、表的分类

1)堆组织表,我们最常用的一种表,分配的存储空间是不连续的,无组织的

2)索引组织表,将表中所有字段有序存储的一张表,可以把整张表看作一个索引;关键字

3)临时表,用来临时存储数据的表,可以用在存储过程中保存中间结果。关键字

4)聚簇表,如果一些表有一些共同的列,则将这样一组表存储在相同的数据块中

聚簇还表示把相关的数据存储在同一个块上。分为:Hash clustered table与索引聚簇表。Hash clustered table与索引聚簇表非常相似,只有一个主要区别:聚簇键索引被一个hash函数所取代,表中的数据就是索引.

5)对象表,先定义一个对象类型,再创建一个对象类型的表

6)嵌套表,一个表作为另一个表的字段

7)外部表,使用外部文件存储数据,需要先在磁盘空间中指定一个目录存储数据文件

8、分区表的分类

范围分区、列表分区、哈希分区、复合分区(范围—列表、范围—哈希

范围分区:每个分区给分区字段指定一个区间,最后需要创建一个maxvalue分区

列表分区:每个分区给分区字段设置一个或多个值,有时候需要创建一个default分区

哈市分区:分区的范围不可控,系统使用hash函数自动计算数据应存储在哪个分区

9、分区的优点和缺点

优点

1)提高查询速度

2)减少IO操作

3)提高可用性,一个分区出错,不影响其他分区数据使用

4)减少恢复时间,一个分区出错,只对当前分区恢复

5)操作分区表可以像操作普通表一样简单

缺点

数据如果没有映射到分区,将会报错

按时间划分的分区,需要定期增加分区

10、索引的是什么?使用索引的优缺点

索引是一种排好序的数据结构。

优点:提高查询速度

缺点:占用空间,insert、delete、update需要维护索引

11、索引分类

主键索引:作为主键的字段不能全空,主键必须唯一

唯一索引:作为索引的字段可以全为空,索引字段必须唯一

普通索引

组合索引:一个索引包含两个及以上字段

函数索引:使用函数创建的索引

倒叙索引:将字段倒排序之后创建索引

反向键索引:将字段中数据从头到尾颠倒过来后创建索引

位图索引:与以上所有的数据结构不同,是一张表,对索引字段值组合出所有情况,并比较每一行数据的索引字段值的分部。

12、创建索引的注意事项

1)一个表上的索引个数不应超过5个

2)对经常一起使用的字段,建组合索引

3)不要在频繁修改的字段上建索引

4)不要对识别率不高的字段建索引

5)不要对持续增加分区的分区表建全局索引

13、避免索引失效的注意事项

1)不要对非函数索引的字段使用函数

2)不要在索引字段上运算

3)防止索引字段的类型发生转换

4)使用like 时不要将通配符放在字符首位

5)非位图索引不要用is null、is not null

6)不要使用<>

6)不要使用not in

14、存储过程与函数的区别

存储过程和函数的本质区别是:存储过程是为了解决某个业务逻辑组合起来的plsql代码块;函数是为了实现某中计算并返回计算结果的plsql代码块

1)函数能返回结果;存储过程不能返回结果

2)调用方式不通

15、什么是包

包是对一个业务模块的封装,为了提高代码的安全性,防止代码被其他人员删除。

包分为包头和包体

包头:定义包中的对象,包含存储过程、函数、游标、变量、数组等

包体:对包头中存储过程和函数的实现

16、什么是触发器

触发器是在做一个数据库操作时触发的一个事假,常用的就是对表中数据修改时的触发器

表级触发器:对表操作时触发的,一次操作只触发一次

行级触发器:对表中每一行数据操作都触发一次

事前触发器:在对表修改前触发,可以获得新值和旧值

事后触发器:在对表修改后触发,可以获得新值

对表的触发事件有insert、delete、update

17、触发器中可以commit吗

不可以,因为触发器的提交是与操作提交是一起的,如果触发器可以提交,操作报错,将无法回滚到开始时的状态。

18、使用视图的优缺点

优点

1)隐藏内部实现环节,提高安全性

2)减少查询字段,减少IO

3)降低开发复杂度,前端开发可以像使用表一样使用视图

缺点

写的不好的视图将会降低查询效率

19)数据库优化

数据库优化是个工程量很大的工作包括很多方面

1)sql语句方面

2)数据库方面

3)业务方面

4)IO方面

5)硬件网络方面

下面分开来说

Sql语句优化

保证正确结果的情况下,提高sql语句的执行速度,SQL优化的好坏只能用实际执行速度衡量,以下只是减少写出劣质SQL的建议

a)避免索引失效(注意点比较多

b)不要关联不需要的表

c)不要写多余的关联条件和筛选条件

d)尽量使用系统函数而不是自定义函数

e)规范书写where子句(注意点比较多

   in替换or

   union all替换or

   union替换union all

   >=替换>、<=替换<

   Exists替换in、not exists替换not in

   能在where中过滤的条件不写到having中去

f)全表删除用truncate替换delete

g)去重时使用rowid做条件删除

h)较少解析时间

   给表取别名,全大写

   绑定变量

   不用动态sql

i)一条sql语句关联大表应少于5个

j)用with tab as减少重复表的复杂关联

k)组合索引的第一个字段要的出现在条件中

l)避免对那些经常会被删除的的字段建索引

m)避免为那些唯一度不高的字段创建B*树索引

数据库级别优化

a)创建索引

b)使用分区表

c)多张大表关联,使用并行

d)olap型数据库增加large pool大小、增加临时表空间大小

f)oltp型数据库增加database buffer cache命中率,减少磁盘IO

业务方面优化

要根据实际业务优化数据加工的过程,需要熟悉非常熟悉业务逻辑

IO方面

减少物理和网络IO

a)使用分区表

b)前端代码查询时不要用select *

c)使用存储过程,避免前端代码与数据库频繁交互

硬件网络方面

a)增加cpu和内存

b)使用千兆光纤和高性能交换机

20、事务的四大特性

1)原子性:事务要么全做,要么全不做

2)一致性:事务完成签后状态一致,不能产生错误结果

3)隔离性:各个事务见状态不可见,且互补影响

4)永久性:事务一旦完成,结果永远不会改变,即使机器故障,也能通过日志恢复

21、对数据操作时存在的问题

脏读、不可重复读、幻读、覆盖

22、事务隔离级别

读未提交:不解决问题

读提交:解决脏读、覆盖 (Oracle默认支持级别

可重复读:解决脏读、覆盖、不可重复读

序列化:解决脏读、不可重复读、幻读、覆盖 (Oracle支持级别

23、锁的分类

1两种锁机制

独占锁(Exclusive Lock:即X锁,又称排它锁,是用来防止同时共享相同资源的锁。加了独占锁的数据库对象不能被其它事务读取和修改。
共享锁(Share Lock:即S锁,是通过对数据存取的高并行性来实现的。加了共享锁的数据库对象可以被其它事务读取,但是不能被其它事务修改。

2)锁类型

DML锁(data locks,数据锁:用于保护数据的完整性,能够防止同步冲突的DML和DDL操作的破坏性交互。
DDL(dictionary locks,字典锁:用于保护数据库对象的结构,如表、索引等的结构定义。
内部锁和闩(internal locks and latches:保护数据库的内部结构,如数据文件,对用户是不可见的。

3)DML锁

DML锁主要包括TM锁和TX锁,其中TM锁称为表级锁,TX锁称为事务锁或行级锁

TM锁:当Oracle执行DML语句时,系统自动在所要操作的表上申请TM类型的锁。当TM锁获得后,系统再自动申请TX类型的锁,并将实际锁定的数据行的锁标志位进行置位

TX锁:Transaction Exclusive Lock行级排它锁,对一条记录加上TX锁后,其他用户不能修改、删除该记录

4)DDL锁

DDL锁包括三种类型排它的DDL锁定、共享的DDL锁定、可打破的解析锁定

排它的DDL锁定:大部分的DDL操作都会在被操作的对象上添加排他的DDL锁定,从而防止在DDL命令执行期间,对象被其他用户所修改。

共享的DDL锁定:用来保护被DDL的对象不被其他用户进程所更新,但是允许其他进程在对象上添加共享的DDL锁定。如果是对表进行DDL命令,则其他进程可以同时修改表里的数据。比如我们发出create view命令创建视图时,在视图的所引用的表(这种表也叫基表)上添加的就是共享的DDL命令。

5)内部锁和闩

内部锁保护内部数据库结构,如数据文件,对用户是不可见的。

24、实例与数据库的区别

实例是内存中一块空间和一些进程的组合,用来管理数据库,数据库是磁盘上的文件,为实例运行提供支持。实力和数据库关系,单机:一对一;RAC多对一

25、SGA的组成部分

数据库缓冲区缓存(Database buffer cache)、重做日志缓冲区(redo buffer)、共享池(share pool)、大池(large pool)、Java池(Java pool)、流池(stream pool

共享池包含:库缓存(library cache)、数据字典缓存

数据库缓冲区缓存:存储从数据文件中读取到的数据块

重做日志缓冲区:保存重做日志

库缓存:存储sql语句解析以及执行计划

数据字典缓存:存储解析sql语句以及管理数据库的信息

大池:并行操作时、数据库恢复时使用

26、后台进程

SMON:系统管理进程,管理

PMON:进程管理进程

DBWn:将数据库缓冲区缓存中的脏块写入数据文件

      每3秒一次

      遇到检查点进程执行时

      缓存满时

      脏块达到1/4时

      表空间只读或脱机时

LGWR:将重做日志缓冲区中的日志写入在线重做日志文件

Commit

日志1/3时

DBWn写脏数据时

CKPT:检查点,定时执行,更新更新控制文件和数据文件头

ARCn:归档模式下,将在线重做日志写入归档日志

27、数据库文件包含

参数文件、控制文件、数据文件、重做日志文件、归档日志文件

28、数据库数据文件逻辑结构

表空间:一个表属于一个表空间,一个表空间包含多个数据文件

:通常理解一张表就是一个段,分区表一个分区就是一个段

    数据段:对应数据表

索引段:对应索引

临时段:用来保存执行过程中的临时数据

LOB段:保存表中LOB字段类型的数据

undo段:update、delete时保存操作之前的数据

:IO读写的最小粒度

29、数据导入导出方式

Exp/imp

数据泵

Plsql工具

Sqlldr、spool

30、数据库冷备份与热备份以及他们的优缺点

冷备份:在数据库关闭状态下备份,拷贝参数文件、控制文件、数据文件、日志文件。

热备份:在数据库运行时,开启归档模式下进行备份

冷备份优缺点

优点

备份简单,出错率低。只需找到数据文件备份即可

缺点

备份期间数据库需要关闭

只能恢复到某一时间点的数据

只能全库恢复

热备份优缺点

优点

不需要关闭数据库,备份和恢复时时数据库也可以工作

可以按照数据库文件和表空间进行备份

可以恢复到秒级的数据

缺点

备份不能出错,一旦出错此次备份不可用。

31、什么是游标?隐式游标与显式游标的区别

游标是用例执行SQL时保存其数据结果集

32、Awr工具

1)授权

2)执行awr工具sql语句

@/u01/app/oracle/product/11.2.0/db_1/rdbms/admin/awrrpt.sql

3)选择报错报告文件格式

Type Specified:  html

4)要查询近几天的快照

Enter value for num_days: 7

5)输入开始快照号

Enter value for begin_snap: 1457

6)输入结束快照号

Enter value for end_snap: 1458

7)输入报告文件名称

Enter value for report_name: /home/oracle/23.html

8)执行结束,找到文件

Report written to /home/oracle/123.html

33、Awr报告使用说明

主要查看

1)Top 5 Timed Foreground Events

2)CPU内存利用率

3SQL ordered by Elapsed Time(执行时间排序

34、sqlldr工具

1)ctl控制文件格式

·  LOAD DATA

·  TRUNCATE|APPEND|DELETE| REPLACE INTO TABLE MANAGER

·  FIELDS TERMINATED BY "," 外部文件的数据以“,”分隔

·  OPTIONALLY ENCLOSED BY '"' 部分字段可以用双引号包起来

·  railing nullcols  表中的字段没有对应的值时填充空值

·  (MGRNO,MNAME,JOB,REMARK char(100000))

2)sqlldr命令

Sqlldr user/passwd@22.22.22.22/ora11g data=1.txt control=1.ctl log=1.log bad=1.bad skip=1

35、spool命令

spool的作用可以用一句话来描述:在sqlplus中用来保存或打印查询结果。

方式一

set trimspool on

set linesize 120

set pagesize 2000

set newpage 1

set heading off

set term off

spool 路径+文件名

select col1||','||col2||','||col3||','||col4||'..' from tablename;

spool off

方式二

#!/bin/sh

DB_USER=zxdbm_ismp                                 #DB USER

DB_PWD=zxin_smap                                    #DB PASSWORD

DB_SERV=zx10_40_43_133                           #DB SERVICE NAME

sqlplus -s $DB_USER/$DB_PWD@$DB_SERV<

set trimspool on

set linesize 120

set pagesize 2000

set newpage 1

set heading off

set term off

spool promt.txt

select taskindex||'|'||commonindex||'|'||tasktype||'|'||to_number(to_char(sysdate,'YYYYMMDD')) from ssrv_sendsms_task;

spool off

EOF

参数说明

set arraysize 5000;  //此参数可提高SPOOL卸载的速度,最大可以设置为5000
set autotrace on;    //设置允许对执行的sql进行分析
set colsep ',';   //域输出分隔符
set echo off;    //显示start启动的脚本中的每个sql命令,缺省为on
set feedback off;  //回显本次sql命令处理的记录条数,缺省为on,设置显示“已选择XX行”
set heading off;   //输出域标题,字段的名称,缺省为on
SET LINESIZE 2500;   //每行允许的最大字符数,设置大些,免得数据被截断,但不宜过大,太大会大大降低导出的速度(注意必须与trimspool结合使用防止导出的文本有太多的尾部空格)
set newpage 1;       //设置页与页之间的分隔{1|n|NONE};当值为0时在每页开头有一个小的黑方框;当值为n时在页和页之间隔着n个空行;当为none时,会在页和页之间没有任何间隔
set newp none;       //设置查询出来的数据分多少页显示,如果需要连续的数据,中间不要出现空行就把newp设置为none,这样输出的数据行都是连续的,中间没有空行之类的
set num 18;          //设置数字的长度,如果不够大,则用科学记数法显示
set numwidth 12;    //输出number类型域长度,缺省为10
SET NULL text;       //显示时,用text值代替NULL值
set pagesize 2000;  //输出每页行数,页面大小,缺省为24,为了避免分页,可设定为0
set serveroutput on; //设置允许显示输出类似dbms_output;--编写存储过程时,大多会将必要的信息输出
SET SPACE 0;
set term off;        //不在屏幕上输出执行结果
set termout off;   //显示脚本中的命令的执行结果,缺省为on
set timing on;       //显示每个sql语句花费的执行时间,设置显示“已用时间:XXXX”
set trimout on;   //去除标准输出每行的拖尾空格,缺省为off
set trimspool on;  //去除重定向(spool)输出每行的拖尾空格,缺省为off
set verify off       //是否显示替代变量被替代前后的语句
SET wrap on;         //输出行长度大于设置行长度时(用set linesize n命令设置);值为on时,多余的字符另起一行显示,否则多余的字符将被切除,不予显示

36、Rman工具

RMAN(Recovery Manager)恢复管理器,它是一种oracle的专用备份恢复工具。

RMAN实际上是物理备份,任意时间点的恢复可以做到。

archivelog模式,归档模式

noarchivelog模式,非归档模式

RMAN都可以执行脱机备份。

如果数据库处于归档模式,RMAN既可以做脱机备份(冷备份)也可以做联机备份(热备份)。

如果数据库处于非归档模式,RMAN是不能进行联机备份的。

热备份:数据库OPEN状态

冷备份:数据库MOUNT状态

37、RAC

集群分为高可用集群和负载均衡集群,下面我将不区分这两个概念,以防迷糊,我下面说的集群直接是指负载均衡集群。所谓集群就是通过配置搭建一个这样的环境,环境中有两个或两个以上的服务器(节点,这些节点上分别运行着同一个服务,对于服务请求,这些节点将均衡请求负载,而当一个节点down掉之后,原本在这个节点处理的请求会自动的转移到其他可用的节点上面。而对于用户而言,整个环境内部是透明的,就如同一台服务器一样。这就是集群的概念。

36、Grid

在oracle 10g中,grid方案的实现所需的软件包含在不同的地方,主要有clusterware集群软件,database中的RAC实现,以及database中dbca建库中的ASM的实现等。到了oracle  11g后,oracle公司讲实现grid的这些个组件整合到了一起,构成了Grid Infrastructure(GI,这样就像clusterware对于集群一样,GI就是用来实现grid的软件。这时候要注意,GI不等于grid。

GI主要包括了两个主要部分,即clusterware和ASM,当然还有一些其他组件,比如grid control、data pump等。从11gR2开始,如果用户想使用clusterware或者ASM的话,则必须下载安装这个软件。

37、data guard

DATA GUARD的最主要的功能是冗灾。当然根据配置的不同,DATA GUARD还可以具备以下特点:高可用、性能提升、数据保护以及故障恢复等。

     本文地址:http://w.yusign.com/news/6830.html    述古往 http://w.yusign.com/static/ , 查看更多
 
特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。

举报收藏 0打赏 0评论 0
 
更多>同类资讯
0相关评论

相关文章
最新文章
推荐文章
推荐图文
资讯
点击排行
{
网站首页  |  关于我们  |  联系方式  |  用户协议  |  隐私政策  |  版权声明  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号