首先我们看一个场景:一个网站,需要统计一周内连续登陆的用户,以及一个月内登陆过的用户或者是用户留存率。
如果用传统的数据库如Mysql来实现的话,很难做到。但如果用Redis来做的话,就很简便。Redis的集合类型和Bitmap类型都可以很容易的做到。今天,我们主要来谈谈如何用Bitmaps来实现统计活跃用户的功能。
什么是 Bitmaps
Bitmaps 并不是实际的数据类型,而是定义在String类型上的一个面向字节操作的集合。因为字符串是二进制安全的块,他们的最大长度是512M,最适合设置成2^32个不同字节。
Bitmaps 的最大优势之一在存储信息时极其节约空间。例如,在一个以增量用户ID来标识不同用户的系统中,记录用户的四十亿的一个单独bit信息(例如,要知道用户是否想要接收最新的来信)仅仅使用512M内存。
在计算机系统中,最小的信息单位是字节,1个字节等于8位,每一位都只可能是0或1(计算机只认识这两个数)。使用Bitmaps可以直接对位进行操作。
可以把bigmaps看做一个数组,数组里每一位只可能是0或者1,数组的下标在这里看做偏移量。
下面我们来介绍几个和Bitmaps相关的命令:
从以下结果可以看出 Bitmaps实际上存的就是String
127.0.0.1:6379> set hello big
OK
127.0.0.1:6379> getbit hello 0
(integer) 0
127.0.0.1:6379> getbit hello 1
(integer) 1
127.0.0.1:6379> getbit hello 2
(integer) 1
setbit
setbit key offset value
:给对应的位设置值
比如今天有用户3、8、23、32访问了网站,则
setbit user:view:2020-5-17 3 1
setbit user:view:2020-5-17 8 1
setbit user:view:2020-5-17 23 1
setbit user:view:2020-5-17 32 1
开发提示:很多应用id都不是从1开始,有许多是从指定数字开始的,比如1001、10001开始。对于这些,我们在设置的时候可以先减去初始值,防止浪费空间
getbit
getbit key offset
获取指定位的值
如果我想知道今天8号用户和45号用户是否登录过,则
127.0.0.1:6379> getbit user:view:2020-5-17 8
(integer) 1
127.0.0.1:6379> getbit user:view:2020-5-17 45
(integer) 0
可以看到8号用户今天登录过,但是45号用户今天还没有登录。
bitcount
bitcount key [start] [end]
获取指定范围为1的个数
我想知道今天有多少用户登陆过了,则
127.0.0.1:6379> bitcount user:view:2020-5-17
(integer) 4
Bitmaps间的操作
bitop op destkey key [key ...]
bitop
命令可以对多个bitmaps做交集(and)、并集(or)、非(not)、异或(xor),并将操作结果存放在destkey
中。
如果想知道连续三天都登陆过的用户,即5月17日、18日、19日都登陆的用户数量。
这三天登陆情况如下:
- 5月17日3、8、23、32用户登陆过
- 5月18日3、23、43、54号用户登陆过
- 5月19日3、5、23、 32、56、78号用户登陆过
127.0.0.1:6379> bitop and three:and user:view:2020-5-17 user:view:2020-5-18 user:view:2020-5-19
127.0.0.1:6379> bitcount three:and
(integer) 2
如果想知道,这三天有多少用户登陆过。
127.0.0.1:6379> bitop or three:or user:view:2020-5-17 user:view:2020-5-18 user:view:2020-5-19
(integer) 10
127.0.0.1:6379> bitcount three:or
(integer) 9
可以看到,这三天共有9位用户登陆过。
实战
讲完上面所讲知识后,我们就可以来完成想要的需求:需要统计一周内连续登陆的用户,以及一个月内登陆过的用户。
首先模拟用户30天内登陆情况,伪代码如下:
for ($i = 0; $i < 20000; $i++) {
$userId = mt_rand(1, 10000);
$date = time() - 86400 * mt_rand(0, 30);
$key = 'userlogin_'.date('Ymd', $date);
$redis->setBit($key, $userId, 1);
}
获取一周内都登陆的用户,当然我们不会一次性全部取,而是想分页那样,一次取一定数量的,伪代码如下:
for ($i = 1; $i <= 7; $i ++) {
$key = "userlogin_".date('Ymd', time() - (86400*$i));
if ($i == 1) {
$redis->bitOp('and', 'week_logined', $key);
} else {
$redis->bitOp('and', 'week_logined', 'week_logined', $key);
}
}
// 获取前50个用户
$userIds = [];
for ($i=1; $i<=10000; $i++) {
$ret = $redis->getBit('week_logined', $i);
$ret && $userIds[] = $i;
if (count($userIds) >=50) break;
}
这里面有一个注意点,也是易错点,在bitop时候,第一次的时候,因为week_logined还不存在,所以进行op的键只有一个。当从第二次开始时候,进行op的键就为2个了。
获取一个月内登陆的用户,思路基本和上面一样,只是将and改为or
for ($i = 1; $i <= 3; $i ++) {
$key = "userlogin_".date('Ymd', time() - (86400*$i));
$redis->bitOp('or', 'month_loginOnce', 'month_loginOnce', $key);
}
// 获取一个月内登陆过的用户
$userIds = [];
for ($i=1; $i<=10000; $i++) {
$ret = $redis->getBit('month_loginOnce', $i);
$ret && $userIds[] = $i;
}
可以看到,在进行or的时候和and还是有些区别的。or的时候,无需对第一次进行判断。个中缘由,大家自己体会体会。
以上就是使用Redis的bitmaps统计活跃用户的详细内容,更多请关注php中文网其它相关文章!