Redis介绍

一 Redis简介

本文将主要讲解Redis是什么,Redis的安装(包括Docker安装Redis)和Redis核心配置文件Redis.conf。

什么是Redis

Redis 是完全开源免费的,遵守BSD协议,是一个高性能(NOSQL)的key-value数据库,Redis是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。

NoSQL

NoSQL,泛指非关系型的数据库,NoSQL即Not-OnlySQL,它可以作为关系型数据库的良好补充。
传统的关系数据库在应付web2.0网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心,暴露了很多难以克服的问题,例如:

  1. Highperformance-对数据库高并发读写的需求
    web2.0网站要根据用户个性化信息来实时生成动态页面和提供动态信息,所以基本上无法使用动态页面静态化技术,因此数据库并发负载非常高,往往要达到每秒上万次读写请求。关系数据库应付上万次SQL写数据请求,硬盘IO已经无法承受了。其实对于普通的BBS网站,往往也存在对高并发写请求的需求,例如网站的实时统计在线用户状态,记录热门帖子的点击次数,投票计数等,因此这是一个相当普遍的需求。
  2. HugeStorage-对海量数据的高效率存储和访问的需求
    类似Facebook,twitter,Friendfeed这样的SNS网站,每天用户产生海量的用户动态,以Friendfeed为例,一个月就达到了2.5亿条用户动态,对于关系数据库来说,在一张2.5亿条记录的表里面进行SQL查询,效率是极其低下乃至不可忍受的。再例如大型web网站的用户登录系统,例如腾讯,动辄数以亿计的帐号,关系数据库也很难应付。
  3. HighScalability&&HighAvailability-对数据库的高可扩展性和高可用性的需求
    在基于web的架构当中,数据库是最难进行横向扩展的,当一个应用系统的用户量和访问量与日俱增的时候,你的数据库却没有办法像webserver那样简单的通过添加更多的硬件和服务节点来扩展性能和负载能力。对于很多需要提供24小时不间断服务的网站来说,对数据库系统进行升级和扩展是非常痛苦的事情,往往需要停机维护和数据迁移。

NoSQL的类别

键值(Key-Value)存储数据库

Key/value模型对于IT系统来说的优势在于简单、易部署。但是如果只对部分值进行查询或更新的时候,Key/value就显得效率低下了。

  • 代表产品:Redis
  • 典型应用:内容缓存,主要用于处理大量数据的高访问负载
  • 数据模型:一系列键值对
  • 优势:快速查询
  • 劣势:存储的数据缺少结构化

列存储数据库

列存储数据库通常是用来应对分布式存储的海量数据。键仍然存在,但是它们的特点是指向了多个列。这些列是由列家族来安排的。

  • 代表产品:HBase
  • 典型应用:分布式的文件系统
  • 数据模型:以列簇式存储,将同一列数据存在一起
  • 优势:查找速度快,可扩展性强,更容易进行分布式扩展
  • 劣势:功能相对局限

文档型数据库

文档型数据库同第一种键值存储相类似。半结构化的文档以特定的格式存储,比如JSON。文档型数据库可以看作是键值数据库的升级版,允许之间嵌套键值。而且文档型数据库比键值数据库的查询效率更高。

  • 代表产品:MongoDB
  • 典型应用:Web应用(与Key-Value类似,Value是结构化的)
  • 数据模型:一系列键值对
  • 优势:数据结构要求不严格
  • 劣势:查询性能不高,而且缺乏统一的查询语法

图(Graph)数据库

图形结构的数据库同其他行列以及刚性结构的SQL数据库不同,它是使用灵活的图形模型,并且能够扩展到多个服务器上。NoSQL数据库没有标准的查询语言(SQL),因此进行数据库查询需要制定数据模型。许多NoSQL数据库都有REST式的数据接口或者查询API。

  • 代表产品:Neo4J
  • 典型应用:社交网络
  • 数据模型:图结构
  • 优势:利用图结构相关算法
  • 劣势:需要对整个图做计算才能得出结果,不容易做分布式的集群方案

总结:

因此,我们总结NoSQL数据库在以下的这几种情况下比较适用:

  1. 数据模型比较简单;
  2. 需要灵活性更强的IT系统;
  3. 对数据库性能要求较高;
  4. 不需要高度的数据一致性;
  5. 对于给定key,比较容易映射复杂值的环境

NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用难题(高并发)。

Redis描述

Redis优势

Redis是一个简单的,高效的,分布式的,基于内存的缓存工具。架设好服务器后,通过网络连接,提供Key-Value式缓存服务。简单,是Redis突出的特色。简单可以保证核心功能的稳定和优异。

  • 性能极高 – Redis能读的速度是110000次/s,写的速度是81000次/s 。
  • 丰富的数据类型 – Redis支持的类型 String,Hash,List, Set 及 Ordered Set 数据类型操作。
  • 原子性 – Redis的所有操作都是原子性的。单个操作是原子性的。多个操作也支持事务,即原子性,通过MULTI和EXEC指令包起来。
  • 丰富的特性 – Redis还支持 publish/subscribe, 通知, key 过期等等特性。
  • 高速读写,redis使用自己实现的分离器,代码量很短,没有使用lock(MySQL),因此效率非常高。

Redis缺点

  • 持久化。Redis直接将数据存储到内存中,要将数据保存到磁盘上,Redis可以使用两种方式实现持久化过程。定时快照(snapshot):每隔一段时间将整个数据库写到磁盘上,每次均是写全部数据,代价非常高。第二种方式基于语句追加(aof):只追踪变化的数据,但是追加的log可能过大,同时所有的操作均重新执行一遍,回复速度慢。
  • 耗内存,占用内存过高。

Redis的应用场景

企业级开发中:可以用作数据库、缓存、热点数据(经常会被查询,但是不经常被修改或者删除的数据)和消息中间件等大部分功能。
redis常用的场景示例如下:

  1. 缓存
    合理的利用缓存不仅能够提升网站访问速度,还能大大降低数据库的压力。Redis提供了键过期功能,也提供了灵活的键淘汰策略,所以,现在Redis用在缓存的场合非常多。
  2. 排行榜
    很多网站都有排行榜应用。Redis提供的有序集合数据类构能实现各种复杂的排行榜应用。
  3. 计数器
    为了保证数据时效,每次浏览都得+1,并发量高时如果每次都请求数据库操作无疑是种挑战和压力。Redis提供的incr命令来实现计数器功能,内存操作,性能非常好,非常适用于这些计数场景。
  4. 分布式会话
    集群模式下,在应用不多的情况下一般使用容器自带的session复制功能就能满足,当应用增多相对复杂的系统中,一般都会搭建以Redis等内存数据库为中心的session服务,session不再由容器管理,而是由session服务及内存数据库管理。
  5. 分布式锁
    分布式技术带来的技术挑战是对同一个资源的并发访问,如全局ID、秒杀等场景,并发量不大的场景可以使用数据库的悲观锁、乐观锁来实现,但在并发量高的场合中,利用数据库锁来控制资源的并发访问大大影响了数据库的性能。可以利用Redis的setnx功能来编写分布式的锁,如果设置返回1说明获取锁成功,否则获取锁失败,实际应用中要考虑的细节要更多。
  6. 社交网络
    点赞、关注、共同好友等是社交网站的基本功能,社交网站的访问量通常来说比较大,而且传统的关系数据库类型不适合存储这种类型的数据,Redis提供的哈希、集合等数据结构能很方便的的实现这些功能。
  7. 最新列表
    Redis列表结构,LPUSH可以在列表头部插入一个内容ID作为关键字,LTRIM可用来限制列表的数量,这样列表永远为N个ID,无需查询最新的列表,直接根据ID去到对应的内容页即可。
  8. 消息系统
    消息队列是大型网站必用中间件,如ActiveMQ、RabbitMQ、Kafka等流行的消息队列中间件,主要用于业务解耦、流量削峰及异步处理实时性低的业务。Redis提供了发布/订阅及阻塞队列功能,能实现一个简单的消息队列系统。另外,这个不能和专业的消息中间件相比。

二 Redis安装

安装前准备

安装gcc

Redis是C语言开发,安装Redis需要先将官网下载的源码进行编译,编译依赖gcc环境,如果没有gcc环境,需要安装gcc。
gcc的安装很简单,确保root登录:

yum -y install gcc automake autoconf libtool make

安装Redis

可以根据需要下载不同版本。
下载redis5.0二进制安装包

wget http://download.redis.io/releases/redis-5.0.0.tar.gz

解压到/opt目录下

tar zxvf redis-5.0.0.tar.gz -C /opt

编译

cd /opt/redis-5.0.0 && make MALLOC=libc   

成功输出如下:

... ...
Hint: It's a good idea to run 'make test' ;)

make[1]: Leaving directory `/opt/redis-5.0.0/src'

指定安装位置

make PREFIX=/usr/local/redis install 

注意:PREFIX必须大写、同时会自动为我们创建redis目录,并将结果安装到此目录。
查看安装后的文件

# cd /usr/local/redis/bin
# ll
total 12876
-rwxr-xr-x. 1 root root  353792 Mar 11 15:01 redis-benchmark
-rwxr-xr-x. 1 root root 4016176 Mar 11 15:01 redis-check-aof
-rwxr-xr-x. 1 root root 4016176 Mar 11 15:01 redis-check-rdb
-rwxr-xr-x. 1 root root  770992 Mar 11 15:01 redis-cli
lrwxrwxrwx. 1 root root      12 Mar 11 15:01 redis-sentinel -> redis-server
-rwxr-xr-x. 1 root root 4016176 Mar 11 15:01 redis-server

三 Redis启动

启动Redis服务端

启动Redis 服务端命令语法:

./bin/redis-server ./redis.conf

进入对应的安装目录并执行命令:

cd /usr/local/redis
./bin/redis-server

启动Redis客户端

启动Redis 客户端命令语法:

redis-cli -h host -p port -a password    //redis-cli –h IP地址 –p 端口 –a 密码

redis的客户端,即redis-cli(Redis Command Line Interface),它是Redis自带的基于命令行的Redis客户端。
进入Redis客服端(克隆一个窗口)进入对应的安装目录并执行命令:

cd /usr/local/redis 
./bin/redis-cli

检测是否服务端启动:

127.0.0.1:6379> PING
PONG

退出客户端命令:

127.0.0.1:6379> shutdown

四 Redis配置详解

Redis定义了很多默认配置。但在实际开发中,一般我们都会通过手动配置完成。Redis 的配置文件位于 Redis 安装目录下,文件名为 redis.conf。

配置Redis

命令:解压目录下的redis.conf 配置文件复制到安装文件的目录下

cp /opt/redis-5.0.0/redis.conf /usr/local/redis

redis.conf

**1. Redis默认不是以守护进程的方式运行,可以通过该配置项修改,使用yes启用守护进程
    daemonize no

2. 当Redis以守护进程方式运行时,Redis默认会把pid写入/var/run/redis.pid文件,可以通过pidfile指定
    pidfile /var/run/redis.pid

**3. 指定Redis监听端口,默认端口为6379,因为6379在手机按键上MERZ对应的号码取自意大利歌女AlessiaMerz的名字
    port 6379

**4. 绑定的主机地址
    bind 127.0.0.1

5. 当客户端闲置多长时间后关闭连接,如果指定为0,表示关闭该功能
    timeout 300

6. 指定日志记录级别,Redis总共支持四个级别:debug、verbose、notice、warning,默认为verbose
    loglevel verbose

7. 日志记录方式,默认为标准输出,如果配置Redis为守护进程方式运行,而这里又配置为日志记录方式为标准输出,则日志将会发送给/dev/null
    logfile stdout

**8. 设置数据库的数量,默认数据库为0,可以使用SELECT<dbid>命令在连接上指定数据库id
    databases 16

**9. 指定在多长时间内,有多少次更新操作,就将数据同步到数据文件,可以多个条件配合
    save <seconds> <changes>
    Redis默认配置文件中提供了三个条件:
    save 900 1
    save 300 10
    save 60 10000
    分别表示900秒(15分钟)内有1个更改,300秒(5分钟)内有10个更改以及60秒内有10000个更改。

**10. 指定存储至本地数据库时是否压缩数据,默认为yes,Redis采用LZF(压缩算法)压缩,如果为了节省CPU时间,可以关闭该选项,但会导致数据库文件变的巨大
    rdbcompression yes

**11. 指定本地数据库文件名,默认值为dump.rdb
    dbfilename dump.rdb

**12. 指定本地数据库存放目录
    dir ./

13. 设置当本机为slav服务时,设置master服务的IP地址及端口,在Redis启动时,它会自动从master进行数据同步
    slaveof <masterip> <masterport> 

14. 当master服务设置了密码保护时,slav服务连接master的密码
    masterauth <master-password>
 
**15. 设置Redis连接密码,如果配置了连接密码,客户端在连接Redis时需要通过AUTH<password>命令提供密码,默认关闭
    requirepass foobared

16. 设置同一时间最大客户端连接数,默认无限制,Redis可以同时打开的客户端连接数为Redis进程可以打开的最大文件描述符数,如果设置maxclients 0,表示不作限制。当客户端连接数到达限制时,Redis会关闭新的连接并向客户端返回max number of clients reached错误信息     
    maxclients 128

17. 指定Redis最大内存限制,Redis在启动时会把数据加载到内存中,达到最大内存后,Redis会先尝试清除已到期或即将到期的Key,当此方法处理后,仍然到达最大内存设置,将无法再进行写入操作,但仍然可以进行读取操作。Redis新的vm机制,会把Key存放内存,Value会存放在swap区
    maxmemory <bytes>

18. 指定是否在每次更新操作后进行日志记录,Redis在默认情况下是异步的把数据写入磁盘,如果不开启,可能会在断电时导致一段时间内的数据丢失。因为redis本身同步数据文件是按上面save条件来同步的,所以有的数据会在一段时间内只存在于内存中。默认为
    noappendonly no

19. 指定更新日志文件名,默认为appendonly.aof
    appendfilename appendonly.aof

20. 指定更新日志条件,共有3个可选值:
    no:表示等操作系统进行数据缓存同步到磁盘(快)
    always:表示每次更新操作后手动调用fsync()将数据写到磁盘(慢,安全)
    everysec:表示每秒同步一次(折衷,默认值)
    appendfsync everysec

21. 指定是否启用虚拟内存机制,默认值为no,VM机制将数据分页存放,由Redis将访问量较少的页即冷数据swap到磁盘上,访问多的页面由磁盘自动换出到内存中(在后面的文章我会仔细分析Redis的VM机制)
    vm-enabledno

22. 虚拟内存文件路径,默认值为/tmp/redis.swap,不可多个Redis实例共享
    vm-swap-file /tmp/redis.swap

23. 将所有大于vm-max-memory的数据存入虚拟内存,无论vm-max-memory设置多小,所有索引数据都是内存存储的(Redis的索引数据就是keys),也就是说,当vm-max-memory设置为0的时候,其实是所有value都存在于磁盘。默认值为0
vm-max-memory 0

24.Redis swap文件分成了很多的page,一个对象可以保存在多个page上面,但一个page上不能被多个对象共享,vm-page-size是要根据存储的数据大小来设定的,作者建议如果存储很多小对象,page大小最好设置为32或者64 bytes;如果存储很大大对象,则可以使用更大的page,如果不确定,就使用默认值
    vm-page-size32

25.设置swap文件中的page数量,由于页表(一种表示页面空闲或使用的bitmap)是在放在内存中的,在磁盘上每8个pages将消耗1 byte的内存。
    vm-pages134217728

26.设置访问swap文件的线程数,最好不要超过机器的核数,如果设置为0,那么所有对swap文件的操作都是串行的,可能会造成比较长时间的延迟。默认值为4
vm-max-threads 4

27.设置在向客户端应答时,是否把较小的包合并为一个包发送,默认为开启
    glueoutputbuf yes

28.指定在超过一定的数量或者最大的元素超过某一临界值时,采用一种特殊的哈希算法
    hash-max-zip map-entries 64 
    hash-max-zipmap-value 512

29.指定是否激活重置哈希,默认为开启(后面在介绍Redis的哈希算法时具体介绍)
    activerehashing yes

30.指定包含其它的配置文件,可以在同一主机上多个Redis实例之间使用同一份配置文件,而同时各个实例又拥有自己的特定配置文件
    include/path/to/local.conf

Redis中的内存维护策略

redis作为优秀的中间缓存件,时常会存储大量的数据,即使采取了集群部署来动态扩容,也应该即时的整理内存,维持系统性能。在redis中有两种解决方案

1. 为数据设置超时时间

expirekeytime(以秒为单位)--这是最常用的方式
setex(Stringkey,intseconds,Stringvalue)--字符串独有的方式
  • 除了字符串自己独有设置过期时间的方法外,其他方法都需要依靠expire方法来设置时间
  • 如果没有设置时间,那缓存就是永不过期
  • 如果设置了过期时间,之后又想让缓存永不过期,使用persist key

2. 采用LRU算法动态将不用的数据删除

内存管理的一种页面置换算法,对于在内存中但又不用的数据块(内存块)叫做LRU,操作系统会根据哪些数据属于LRU而将其移出内存而腾出空间来加载另外的数据。

  1. volatile-lru:设定超时时间的数据中,删除最不常使用的数据。
  2. allkeys-lru:查询所有的key中最近最不常使用的数据进行删除,这是应用最广泛的策略。
  3. volatile-random:在已经设定了超时的数据中随机删除.。
  4. allkeys-random:查询所有的key,之后随机删除。
  5. volatile-ttl:查询全部设定超时时间的数据,之后排序,将马上将要过期的数据进行删除操作。
  6. noeviction:如果设置为该属性,则不会进行删除操作,如果内存溢出则报错返回。
  7. volatile-lfu:从所有配置了过期时间的键中驱逐使用频率最少的键。
  8. allkeys-lfu:从所有键中驱逐使用频率最少的键。

自定义配置Redis

进入对应的安装目录 /usr/local/redis修改 redis.conf 配置文件vim redis.conf (进入命令模式通过/内容查找相应字符串)

daemonize no 修改为daemonize yes 守护进程启动
bind 127.0.0.1 注释掉 允许除本机外的机器访问Redis服务
requirepass 设置密码 设定数据库密码(保证服务安全/有些情况下 不设定密码是无法进行远程连接访问的)

Redis采用的是单进程多线程的模式。当redis.conf中选项daemonize设置成yes时,代表开启守护进程模式。在该模式下,redis会在后台运行,并将进程pid号写入至redis.conf选项pidfile设置的文件中,此时redis将一直运行,除非手动kill该进程。
因为redis速度相当快,所以一台比较好的服务器下,一个外部用户在一秒内可以进行15W次密码尝试,这意味着你需要设定非常强大的密码来防止暴力破解。可以通过 redis 的配置文件设置密码参数,这样客户端连接到 redis 服务就需要密码验证,这样可以让你的redis 服务更安全。

五 Docker 安装Redis

安装单机版Redis

1、搜索redis

docker search redis

2、下载镜像

docker pull docker.io/redis:5.0.0

3、创建并运行容器

docker run --rm -d --name redis6379 -p 6379:6379 redis:5.0.0 --requirepass "xiaowangzi"

4、测试Redis

docker exec -it redis6379 bash    //进入redis命令 
redis-cli -a "xiaowangzi"    //开启客户端功能

发表评论