作者
LemonCoder
一个典型的互联网产品架构包含接入层、逻辑处理层以及存储层,其中存储层承载着数据落地和持久化的任务,同时给逻辑处理层提供数据查询功能支持。说到存储层就要说到数据库,数据库知识掌握程度也是面试考察的知识点。
典型服务架构
数据库分为关系型数据库和非关系型数据库,也就是我们常说的SQL和NoSQL,这两个方向的数据库代表产品分别是MySQL和Redis,这次我们主要以面试问答的形式,来学习下关系型数据库MySQL基础知识。
面试开始,准备接受面试官灵魂拷问吧!
关系型数据库
什么是关系型数据库?
关系型数据库,是指采用了关系模型来组织数据的数据库,其以行和列的形式存储数据,以便于用户理解,关系型数据库这一系列的行和列被称为表,一组表组成了数据库。用户通过查询来检索数据库中的数据,而查询是一个用于限定数据库中某些区域的执行代码。
简单来说,关系模式就是二维表格模型。
关系型数据库有什么优势?
关系型数据库的优势:
易于理解。关系型二维表的结构非常贴近现实世界,二维表格,容易理解。支持复杂查询。可以用SQL语句方便的在一个表以及多个表之间做非常复杂的数据查询。支持事务。可靠的处理事务并且保持事务的完整性,使得对于安全性能很高的数据访问要求得以实现。
MySQL数据库
什么是SQL
结构化查询语言(StructuredQueryLanguage)简称SQL,是一种特殊目的的编程语言,是一种数据库查询和程序设计语言程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统。
什么是MySQL?
MySQL是一个关系型数据库管理系统,MySQL是最流行的关系型数据库管理系统之一,常见的关系型数据库还有Oracle、SQLServer、Access等等。
MySQL在过去由于性能高、成本低、可靠性好,已经成为最流行的开源数据库,广泛地应用在Internet上的中小型网站中。
MySQL和MariaDB傻傻分不清楚?
MySQL最初由瑞典MySQLAB公司开发,MySQL的创始人是乌尔夫·米卡埃尔·维德纽斯,常用昵称蒙提(Monty)。
在被甲骨文公司收购后,现在属于甲骨文公司(Oracle)旗下产品。Oracle大幅调涨MySQL商业版的售价,因此导致自由软件社区们对于Oracle是否还会持续支持MySQL社区版有所隐忧。
MySQL的创始人就是之前那个叫Monty的大佬以MySQL为基础成立分支计划MariaDB。
MariaDB打算保持与MySQL的高度兼容性,确保具有库二进制奇偶校验的直接替换功能,以及与MySQLAPI(应用程序接口)和命令的精确匹配,而原先一些使用MySQL的开源软件逐渐转向MariaDB或其它的数据库。
所以如果看到你公司用的是MariaDB不用怀疑,其实它骨子里还是MySQL,学会了MySQL也就会了MariaDB。
一个彩蛋
MariaDB是以Monty的小女儿Maria命名的,就像MySQL是以他另一个女儿My命名的一样,两款鼎鼎大名的数据库分别用两个女儿的名字命名,老爷子厉害!
如何查看MySQL当前版本号?
在系统命令行下:mysql-V
连接上MySQL命令行输入
/p>
status;
Server:MySQLServerversion:5.5.45Protocolversion:10
或selectversion();
+------------------------+
version()
+------------------------+
5.5.45-xxxxx
+------------------------+
基础数据类型
MySQL有哪些数据类型?
MySQL数据类型非常丰富,常用类型简单介绍如下:
整数类型:BIT、BOOL、TINYINT、SMALLINT、MEDIUMINT、INT、BIGINT。
浮点数类型:FLOAT、DOUBLE、DECIMAL。
字符串类型:CHAR、VARCHAR、TINYTEXT、TEXT、MEDIUMTEXT、LONGTEXT、TINYBLOB、BLOB、MEDIUMBLOB、LONGBLOB。
日期类型:Date、DateTime、TimeStamp、Time、Year。
其他数据类型:BINARY、VARBINARY、ENUM、SET...
CHAR和VARCHAR的区别?
CHAR是固定长度的字符类型,VARCHAR则是可变长度的字符类型,下面讨论基于在MySQL5.0以上版本中。
共同点
CHAR(M)和VARCHAR(M)都表示该列能存储M个字符,注意不是字节!!
CHAR类型特点
CHAR最多可以存储个字符(注意不是字节),字符有不同的编码集,比如UTF8编码(3字节)、GBK编码(2字节)等。对于CHAR(M)如果实际存储的数据长度小于M,则MySQL会自动会在它的右边用空格字符补足,但是在检索操作中那些填补出来的空格字符会被去掉。VARCHAR类型特点
VARCHAR的最大长度为个字节。VARCHAR存储的是实际的字符串加1或2个字节用来记录字符串实际长度,字符串长度小于字节用1字节记录,超过就需要2字节记录。VARCHAR(50)能存放几个UTF8编码的汉字?
存放的汉字个数与版本相关。
mysql4.0以下版本,varchar(50)指的是50字节,如果存放UTF8格式编码的汉字时(每个汉字3字节),只能存放16个。
mysql5.0以上版本,varchar(50)指的是50字符,无论存放的是数字、字母还是UTF8编码的汉字,都可以存放50个。
int(10)和bigint(10)能存储的数据大小一样吗?
不一样,具体原因如下:
int能存储四字节有符号整数。bigint能存储八字节有符号整数。所以能存储的数据大小不一样,其中的数字10代表的只是数据的显示宽度。[^13]
显示宽度指明Mysql最大可能显示的数字个数,数值的位数小于指定的宽度时数字左边会用空格填充,空格不容易看出。如果插入了大于显示宽度的值,只要该值不超过该类型的取值范围,数值依然可以插入且能够显示出来。建表的时候指定zerofill选项,则不足显示宽度的部分用0填充,如果是1会显示成。如果没指定显示宽度,bigint默认宽度是20,int默认宽度11。
存储引擎相关
MySQL存储引擎类型有哪些?
常用的存储引擎有InnoDB存储引擎和MyISAM存储引擎,InnoDB是MySQL的默认事务引擎。
查看数据库表当前支持的引擎,可以用下面查询语句查看:
#查询结果表中的Engine字段指示存储引擎类型。showtablestatusfromyour_db_namewherename=your_table_name;
InnoDB存储引擎应用场景是什么?
InnoDB是MySQL的默认「事务引擎」,被设置用来处理大量短期(short-lived)事务,短期事务大部分情况是正常提交的,很少会回滚。
InnoDB存储引擎特性有哪些?
采用多版本并发控制(MVCC,MultiVersionConcurrencyControl)来支持高并发。并且实现了四个标准的隔离级别,通过间隙锁next-keylocking策略防止幻读的出现。
引擎的表基于聚簇索引建立,聚簇索引对主键查询有很高的性能。不过它的二级索引secondaryindex非主键索引中必须包含主键列,所以如果主键列很大的话,其他的所有索引都会很大。因此,若表上的索引较多的话,主键应当尽可能的小。另外InnoDB的存储格式是平台独立。
InnoDB做了很多优化,比如:磁盘读取数据方式采用的可预测性预读、自动在内存中创建hash索引以加速读操作的自适应哈希索引(adaptivehashindex),以及能够加速插入操作的插入缓冲区(insertbuffer)等。
InnoDB通过一些机制和工具支持真正的热备份,MySQL的其他存储引擎不支持热备份,要获取一致性视图需要停止对所有表的写入,而在读写混合场景中,停止写入可能也意味着停止读取。
InnoDB引擎的四大特性是什么?
插入缓冲(Insertbuffer)
InsertBuffer用于非聚集索引的插入和更新操作。先判断插入的非聚集索引是否在缓存池中,如果在则直接插入,否则插入到InsertBuffer对象里。再以一定的频率进行InsertBuffer和辅助索引叶子节点的merge操作,将多次插入合并到一个操作中,提高对非聚集索引的插入性能。
二次写(Doublewrite)
DoubleWrite由两部分组成,一部分是内存中的doublewritebuffer,大小为2MB,另一部分是物理磁盘上共享表空间连续的个页,大小也为2MB。在对缓冲池的脏页进行刷新时,并不直接写磁盘,而是通过memcpy函数将脏页先复制到内存中的该区域,之后通过doublewritebuffer再分两次,每次1MB顺序地写入共享表空间的物理磁盘上,然后马上调用fsync函数,同步磁盘,避免操作系统缓冲写带来的问题。
自适应哈希索引(AdaptiveHashIndex)
InnoDB会根据访问的频率和模式,为热点页建立哈希索引,来提高查询效率。索引通过缓存池的B+树页构造而来,因此建立速度很快,InnoDB存储引擎会监控对表上各个索引页的查询,如果观察到建立哈希索引可以带来速度上的提升,则建立哈希索引,所以叫做自适应哈希索引。
缓存池
为了提高数据库的性能,引入缓存池的概念,通过参数innodb_buffer_pool_size可以设置缓存池的大小,参数innodb_buffer_pool_instances可以设置缓存池的实例个数。缓存池主要用于存储以下内容:
缓冲池中缓存的数据页类型有:索引页、数据页、undo页、插入缓冲(insertbuffer)、自适应哈希索引(adaptivehashindex)、InnoDB存储的锁信息(lockinfo)和数据字典信息(datadictionary)。
MyISAM存储引擎应用场景有哪些?
MyISAM是MySQL5.1及之前的版本的默认的存储引擎。MyISAM提供了大量的特性,包括全文索引、压缩、空间函数(GIS)等,但MyISAM不「支持事务和行级锁」,对于只读数据,或者表比较小、可以容忍修复操作,依然可以使用它。
MyISAM存储引擎特性有哪些?
MyISAM「不支持行级锁而是对整张表加锁」。读取时会对需要读到的所有表加共享锁,写入时则对表加排它锁。但在表有读取操作的同时,也可以往表中插入新的记录,这被称为并发插入。
MyISAM表可以手工或者自动执行检查和修复操作。但是和事务恢复以及崩溃恢复不同,可能导致一些「数据丢失」,而且修复操作是非常慢的。
对于MyISAM表,即使是BLOB和TEXT等长字段,也可以基于其前个字符创建索引,MyISAM也支持「全文索引」,这是一种基于分词创建的索引,可以支持复杂的查询。
如果指定了DELAY_KEY_WRITE选项,在每次修改执行完成时,不会立即将修改的索引数据写入磁盘,而是会写到内存中的键缓冲区,只有在清理键缓冲区或者关闭表的时候才会将对应的索引块写入磁盘。这种方式可以极大的提升写入性能,但是在数据库或者主机崩溃时会造成「索引损坏」,需要执行修复操作。
MyISAM与InnoDB存储引擎5大区别
InnoDB支持事物,而MyISAM不支持事物InnoDB支持行级锁,而MyISAM支持表级锁InnoDB支持MVCC,而MyISAM不支持InnoDB支持外键,而MyISAM不支持InnoDB不支持全文索引,而MyISAM支持一张表简单罗列两种引擎的主要区别,如下图:
mysql引擎对比
SELECTCOUNT(*)在哪个引擎执行更快?
SELECTCOUNT(*)常用于统计表的总行数,在MyISAM存储引擎中执行更快,前提是不能加有任何WHERE条件。
这是因为MyISAM对于表的行数做了优化,内部用一个变量存储了表的行数,如果查询条件没有WHERE条件则是查询表中一共有多少条数据,MyISAM可以迅速返回结果,如果加WHERE条件就不行。
InnoDB的表也有一个存储了表行数的变量,但这个值是一个估计值,所以并没有太大实际意义。
MySQL基础知识
说一下数据库设计三范式是什么?
1范式:1NF是对属性的原子性约束,要求属性具有原子性,不可再分解;(只要是关系型数据库都满足1NF)
2范式:2NF是对记录的惟一性约束,要求记录有惟一标识,即实体的惟一性;
3范式:3NF是对字段冗余性的约束,即任何字段不能由其他字段派生出来,它要求字段没有冗余,没有冗余的数据库设计可以做到。
但是,没有冗余的数据库未必是最好的数据库,有时为了提高运行效率,就必须降低范式标准,适当保留冗余数据,具体做法是:在概念数据模型设计时遵守第三范式,降低范式标准的工作放到物理数据模型设计时考虑,降低范式就是增加字段,允许冗余。
SQL语句有哪些分类?
DDL:数据定义语言(createalterdrop)DML:数据操作语句(insertupdatedelete)DTL:数据事务语句(