傻傻分不清之 Cookie、Session、Token、JWT

什么是认证(Authentication)

  • 通俗地讲就是验证当前用户的身份,证实“你是你本身”(好比:你天天上下班打卡,都须要经过指纹打卡,当你的指纹和系统里录入的指纹相匹配时,就打卡成功)
  • 互联网中的认证:
    • 用户名密码登陆
    • 邮箱发送登陆连接
    • 手机号接收验证码
    • 只要你能收到邮箱/验证码,就默认你是帐号的主人

什么是受权(Authorization)

  • 用户授予第三方应用访问该用户某些资源的权限
    • 你在安装手机应用的时候,APP 会询问是否容许授予权限(访问相册、地理位置等权限)
    • 你在访问微信小程序时,当登陆时,小程序会询问是否容许授予权限(获取昵称、头像、地区、性别等我的信息)
  • 实现受权的方式有:cookie、session、token、OAuth

什么是凭证(Credentials)

  • 实现认证和受权的前提是须要一种媒介(证书) 来标记访问者的身份
    • 在战国时期,商鞅变法,发明了照身帖。照身帖由官府发放,是一块打磨光滑细密的竹板,上面刻有持有人的头像和籍贯信息。国人必须持有,如若没有就被认为是黑户,或者间谍之类的。
    • 在现实生活中,每一个人都会有一张专属的居民身份证,是用于证实持有人身份的一种法定证件。经过身份证,咱们能够办理手机卡/银行卡/我的贷款/交通出行等等,这就是认证的凭证。
    • 在互联网应用中,通常网站(如掘金)会有两种模式,游客模式和登陆模式。游客模式下,能够正常浏览网站上面的文章,一旦想要点赞/收藏/分享文章,就须要登陆或者注册帐号。当用户登陆成功后,服务器会给该用户使用的浏览器颁发一个令牌(token),这个令牌用来代表你的身份,每次浏览器发送请求时会带上这个令牌,就可使用游客模式下没法使用的功能。

什么是 Cookie

  • HTTP 是无状态的协议(对于事务处理没有记忆能力,每次客户端和服务端会话完成时,服务端不会保存任何会话信息):每一个请求都是彻底独立的,服务端没法确认当前访问者的身份信息,没法分辨上一次的请求发送者和这一次的发送者是否是同一我的。因此服务器与浏览器为了进行会话跟踪(知道是谁在访问我),就必须主动的去维护一个状态,这个状态用于告知服务端先后两个请求是否来自同一浏览器。而这个状态须要经过 cookie 或者 session 去实现。
  • cookie 存储在客户端: cookie 是服务器发送到用户浏览器并保存在本地的一小块数据,它会在浏览器下次向同一服务器再发起请求时被携带并发送到服务器上。
  • cookie 是不可跨域的: 每一个 cookie 都会绑定单一的域名,没法在别的域名下获取使用,一级域名和二级域名之间是容许共享使用的靠的是 domain)

cookie 重要的属性javascript

属性 说明
name=value 键值对,设置 Cookie 的名称及相对应的值,都必须是字符串类型
- 若是值为 Unicode 字符,须要为字符编码。
- 若是值为二进制数据,则须要使用 BASE64 编码。
domain 指定 cookie 所属域名,默认是当前域名
path 指定 cookie 在哪一个路径(路由)下生效,默认是 '/'
若是设置为 /abc,则只有 /abc 下的路由能够访问到该 cookie,如:/abc/read
maxAge cookie 失效的时间,单位秒。若是为整数,则该 cookie 在 maxAge 秒后失效。若是为负数,该 cookie 为临时 cookie ,关闭浏览器即失效,浏览器也不会以任何形式保存该 cookie 。若是为 0,表示删除该 cookie 。默认为 -1。
- 比 expires 好用
expires 过时时间,在设置的某个时间点后该 cookie 就会失效。
通常浏览器的 cookie 都是默认储存的,当关闭浏览器结束这个会话的时候,这个 cookie 也就会被删除
secure 该 cookie 是否仅被使用安全协议传输。安全协议有 HTTPS,SSL等,在网络上传输数据以前先将数据加密。默认为false。
当 secure 值为 true 时,cookie 在 HTTP 中是无效,在 HTTPS 中才有效。
httpOnly 若是给某个 cookie 设置了 httpOnly 属性,则没法经过 JS 脚本 读取到该 cookie 的信息,但仍是能经过 Application 中手动修改 cookie,因此只是在必定程度上能够防止 XSS 攻击,不是绝对的安全

什么是 Session

  • session 是另外一种记录服务器和客户端会话状态的机制
  • session 是基于 cookie 实现的,session 存储在服务器端,sessionId 会被存储到客户端的cookie 中

session.png

  • session 认证流程:
    • 用户第一次请求服务器的时候,服务器根据用户提交的相关信息,建立对应的 Session
    • 请求返回时将此 Session 的惟一标识信息 SessionID 返回给浏览器
    • 浏览器接收到服务器返回的 SessionID 信息后,会将此信息存入到 Cookie 中,同时 Cookie 记录此 SessionID 属于哪一个域名
    • 当用户第二次访问服务器的时候,请求会自动判断此域名下是否存在 Cookie 信息,若是存在自动将 Cookie 信息也发送给服务端,服务端会从 Cookie 中获取 SessionID,再根据 SessionID 查找对应的 Session 信息,若是没有找到说明用户没有登陆或者登陆失效,若是找到 Session 证实用户已经登陆可执行后面操做。

根据以上流程可知,SessionID 是链接 Cookie 和 Session 的一道桥梁,大部分系统也是根据此原理来验证用户登陆状态。html

Cookie 和 Session 的区别

  • 安全性: Session 比 Cookie 安全,Session 是存储在服务器端的,Cookie 是存储在客户端的。
  • 存取值的类型不一样:Cookie 只支持存字符串数据,想要设置其余类型的数据,须要将其转换成字符串,Session 能够存任意数据类型。
  • 有效期不一样: Cookie 可设置为长时间保持,好比咱们常用的默认登陆功能,Session 通常失效时间较短,客户端关闭(默认状况下)或者 Session 超时都会失效。
  • 存储大小不一样: 单个 Cookie 保存的数据不能超过 4K,Session 可存储数据远高于 Cookie,可是当访问量过多,会占用过多的服务器资源。

什么是 Token(令牌)

Acesss Token

  • 访问资源接口(API)时所须要的资源凭证
  • 简单 token 的组成: uid(用户惟一的身份标识)、time(当前时间的时间戳)、sign(签名,token 的前几位以哈希算法压缩成的必定长度的十六进制字符串)
  • 特色:
    • 服务端无状态化、可扩展性好
    • 支持移动端设备
    • 安全
    • 支持跨程序调用
  • token 的身份验证流程:

  1. 客户端使用用户名跟密码请求登陆
  2. 服务端收到请求,去验证用户名与密码
  3. 验证成功后,服务端会签发一个 token 并把这个 token 发送给客户端
  4. 客户端收到 token 之后,会把它存储起来,好比放在 cookie 里或者 localStorage 里
  5. 客户端每次向服务端请求资源的时候须要带着服务端签发的 token
  6. 服务端收到请求,而后去验证客户端请求里面带着的 token ,若是验证成功,就向客户端返回请求的数据
  • 每一次请求都须要携带 token,须要把 token 放到 HTTP 的 Header 里
  • 基于 token 的用户认证是一种服务端无状态的认证方式,服务端不用存放 token 数据。用解析 token 的计算时间换取 session 的存储空间,从而减轻服务器的压力,减小频繁的查询数据库
  • token 彻底由应用管理,因此它能够避开同源策略

Refresh Token

  • 另一种 token——refresh token
  • refresh token 是专用于刷新 access token 的 token。若是没有 refresh token,也能够刷新 access token,但每次刷新都要用户输入登陆用户名与密码,会很麻烦。有了 refresh token,能够减小这个麻烦,客户端直接用 refresh token 去更新 access token,无需用户进行额外的操做。

  • Access Token 的有效期比较短,当 Acesss Token 因为过时而失效时,使用 Refresh Token 就能够获取到新的 Token,若是 Refresh Token 也失效了,用户就只能从新登陆了。
  • Refresh Token 及过时时间是存储在服务器的数据库中,只有在申请新的 Acesss Token 时才会验证,不会对业务接口响应时间形成影响,也不须要向 Session 同样一直保持在内存中以应对大量的请求。

Token 和 Session 的区别

  • Session 是一种记录服务器和客户端会话状态的机制,使服务端有状态化,能够记录会话信息。而 Token 是令牌访问资源接口(API)时所须要的资源凭证。Token 使服务端无状态化,不会存储会话信息。
  • Session 和 Token 并不矛盾,做为身份认证 Token 安全性比 Session 好,由于每个请求都有签名还能防止监听以及重放攻击,而 Session 就必须依赖链路层来保障通信安全了。若是你须要实现有状态的会话,仍然能够增长 Session 来在服务器端保存一些状态。
  • 所谓 Session 认证只是简单的把 User 信息存储到 Session 里,由于 SessionID 的不可预测性,暂且认为是安全的。而 Token ,若是指的是 OAuth Token 或相似的机制的话,提供的是 认证 和 受权 ,认证是针对用户,受权是针对 App 。其目的是让某 App 有权利访问某用户的信息。这里的 Token 是惟一的。不能够转移到其它 App上,也不能够转到其它用户上。Session 只提供一种简单的认证,即只要有此 SessionID ,即认为有此 User 的所有权利。是须要严格保密的,这个数据应该只保存在站方,不该该共享给其它网站或者第三方 App。因此简单来讲:若是你的用户数据可能须要和第三方共享,或者容许第三方调用 API 接口,用 Token 。若是永远只是本身的网站,本身的 App,用什么就无所谓了。

什么是 JWT

  • JSON Web Token(简称 JWT)是目前最流行的跨域认证解决方案。
  • 是一种认证受权机制
  • JWT 是为了在网络应用环境间传递声明而执行的一种基于 JSON 的开放标准(RFC 7519)。JWT 的声明通常被用来在身份提供者和服务提供者间传递被认证的用户身份信息,以便于从资源服务器获取资源。好比用在用户登陆上。
  • 可使用 HMAC 算法或者是 RSA 的公/私秘钥对 JWT 进行签名。由于数字签名的存在,这些传递的信息是可信的。
  • 阮一峰老师的 JSON Web Token 入门教程 讲的很是通俗易懂,这里就再也不班门弄斧了

生成 JWT

jwt.io/
www.jsonwebtoken.io/
前端

JWT 的原理

  • JWT 认证流程:
    • 用户输入用户名/密码登陆,服务端认证成功后,会返回给客户端一个 JWT
    • 客户端将 token 保存到本地(一般使用 localstorage,也可使用 cookie)
    • 当用户但愿访问一个受保护的路由或者资源的时候,须要请求头的 Authorization 字段中使用Bearer 模式添加 JWT,其内容看起来是下面这样
Authorization: Bearer <token>
复制代码
  • 服务端的保护路由将会检查请求头 Authorization 中的 JWT 信息,若是合法,则容许用户的行为
  • 由于 JWT 是自包含的(内部包含了一些会话信息),所以减小了须要查询数据库的须要
  • 由于 JWT 并不使用 Cookie 的,因此你可使用任何域名提供你的 API 服务而不须要担忧跨域资源共享问题(CORS)
  • 由于用户的状态再也不存储在服务端的内存中,因此这是一种无状态的认证机制

JWT 的使用方式

  • 客户端收到服务器返回的 JWT,能够储存在 Cookie 里面,也能够储存在 localStorage。

方式一

  • 当用户但愿访问一个受保护的路由或者资源的时候,能够把它放在 Cookie 里面自动发送,可是这样不能跨域,因此更好的作法是放在 HTTP 请求头信息的 Authorization 字段里,使用 Bearer 模式添加 JWT。java

    GET /calendar/v1/events
    Host: api.example.com
    Authorization: Bearer <token>
    复制代码
    • 用户的状态不会存储在服务端的内存中,这是一种 无状态的认证机制
    • 服务端的保护路由将会检查请求头 Authorization 中的 JWT 信息,若是合法,则容许用户的行为。
    • 因为 JWT 是自包含的,所以减小了须要查询数据库的须要
    • JWT 的这些特性使得咱们能够彻底依赖其无状态的特性提供数据 API 服务,甚至是建立一个下载流服务。
    • 由于 JWT 并不使用 Cookie ,因此你可使用任何域名提供你的 API 服务而不须要担忧跨域资源共享问题(CORS)

方式二

  • 跨域的时候,能够把 JWT 放在 POST 请求的数据体里。

方式三

  • 经过 URL 传输
http://www.example.com/user?token=xxx
复制代码

项目中使用 JWT

项目地址git

Token 和 JWT 的区别

相同:github

  • 都是访问资源的令牌
  • 均可以记录用户的信息
  • 都是使服务端无状态化
  • 都是只有验证成功后,客户端才能访问服务端上受保护的资源

区别:web

  • Token:服务端验证客户端发送过来的 Token 时,还须要查询数据库获取用户信息,而后验证 Token 是否有效。
  • JWT: 将 Token 和 Payload 加密后存储于客户端,服务端只须要使用密钥解密进行校验(校验也是 JWT 本身实现的)便可,不须要查询或者减小查询数据库,由于 JWT 自包含了用户信息和加密的数据。

常见的先后端鉴权方式

  1. Session-Cookie
  2. Token 验证(包括 JWT,SSO)
  3. OAuth2.0(开放受权)

常见的加密算法

image.png

  • 哈希算法(Hash Algorithm)又称散列算法、散列函数、哈希函数,是一种从任何一种数据中建立小的数字“指纹”的方法。哈希算法将数据从新打乱混合,从新建立一个哈希值。
  • 哈希算法主要用来保障数据真实性(即完整性),即发信人将原始消息和哈希值一块儿发送,收信人经过相同的哈希函数来校验原始数据是否真实。
  • 哈希算法一般有如下几个特色:
    • 正像快速:原始数据能够快速计算出哈希值
    • 逆向困难:经过哈希值基本不可能推导出原始数据
    • 输入敏感:原始数据只要有一点变更,获得的哈希值差异很大
    • 冲突避免:很难找到不一样的原始数据获得相同的哈希值,宇宙中原子数大约在 10 的 60 次方到 80 次方之间,因此 2 的 256 次方有足够的空间容纳全部的可能,算法好的状况下冲突碰撞的几率很低:
      • 2 的 128 次方为 340282366920938463463374607431768211456,也就是 10 的 39 次方级别
      • 2 的 160 次方为 1.4615016373309029182036848327163e+48,也就是 10 的 48 次方级别
      • 2 的 256 次方为 1.1579208923731619542357098500869 × 10 的 77 次方,也就是 10 的 77 次方

注意:redis

  1. 以上不能保证数据被恶意篡改,原始数据和哈希值均可能被恶意篡改,要保证不被篡改,可使用RSA 公钥私钥方案,再配合哈希值。
  2. 哈希算法主要用来防止计算机传输过程当中的错误,早期计算机经过前 7 位数据第 8 位奇偶校验码来保障(12.5% 的浪费效率低),对于一段数据或文件,经过哈希算法生成 128bit 或者 256bit 的哈希值,若是校验有问题就要求重传。

常见问题

使用 cookie 时须要考虑的问题

  • 由于存储在客户端,容易被客户端篡改,使用前须要验证合法性
  • 不要存储敏感数据,好比用户密码,帐户余额
  • 使用 httpOnly 在必定程度上提升安全性
  • 尽可能减小 cookie 的体积,能存储的数据量不能超过 4kb
  • 设置正确的 domain 和 path,减小数据传输
  • cookie 没法跨域
  • 一个浏览器针对一个网站最多存 20 个Cookie,浏览器通常只容许存放 300 个Cookie
  • 移动端对 cookie 的支持不是很好,而 session 须要基于 cookie 实现,因此移动端经常使用的是 token

使用 session 时须要考虑的问题

  • 将 session 存储在服务器里面,当用户同时在线量比较多时,这些 session 会占据较多的内存,须要在服务端按期的去清理过时的 session
  • 当网站采用集群部署的时候,会遇到多台 web 服务器之间如何作 session 共享的问题。由于 session 是由单个服务器建立的,可是处理用户请求的服务器不必定是那个建立 session 的服务器,那么该服务器就没法拿到以前已经放入到 session 中的登陆凭证之类的信息了。
  • 当多个应用要共享 session 时,除了以上问题,还会遇到跨域问题,由于不一样的应用可能部署的主机不同,须要在各个应用作好 cookie 跨域的处理。
  • sessionId 是存储在 cookie 中的,假如浏览器禁止 cookie 或不支持 cookie 怎么办? 通常会把 sessionId 跟在 url 参数后面即重写 url,因此 session 不必定非得须要靠 cookie 实现
  • 移动端对 cookie 的支持不是很好,而 session 须要基于 cookie 实现,因此移动端经常使用的是 token

使用 token 时须要考虑的问题

  • 若是你认为用数据库来存储 token 会致使查询时间太长,能够选择放在内存当中。好比 redis 很适合你对 token 查询的需求。
  • token 彻底由应用管理,因此它能够避开同源策略
  • token 能够避免 CSRF 攻击(由于不须要 cookie 了)
  • 移动端对 cookie 的支持不是很好,而 session 须要基于 cookie 实现,因此移动端经常使用的是 token

使用 JWT 时须要考虑的问题

  • 由于 JWT 并不依赖 Cookie 的,因此你可使用任何域名提供你的 API 服务而不须要担忧跨域资源共享问题(CORS)
  • JWT 默认是不加密,但也是能够加密的。生成原始 Token 之后,能够用密钥再加密一次。
  • JWT 不加密的状况下,不能将秘密数据写入 JWT。
  • JWT 不只能够用于认证,也能够用于交换信息。有效使用 JWT,能够下降服务器查询数据库的次数。
  • JWT 最大的优点是服务器再也不须要存储 Session,使得服务器认证鉴权业务能够方便扩展。但这也是 JWT 最大的缺点:因为服务器不须要存储 Session 状态,所以使用过程当中没法废弃某个 Token 或者更改 Token 的权限。也就是说一旦 JWT 签发了,到期以前就会始终有效,除非服务器部署额外的逻辑。
  • JWT 自己包含了认证信息,一旦泄露,任何人均可以得到该令牌的全部权限。为了减小盗用,JWT的有效期应该设置得比较短。对于一些比较重要的权限,使用时应该再次对用户进行认证。
  • JWT 适合一次性的命令认证,颁发一个有效期极短的 JWT,即便暴露了危险也很小,因为每次操做都会生成新的 JWT,所以也不必保存 JWT,真正实现无状态。
  • 为了减小盗用,JWT 不该该使用 HTTP 协议明码传输,要使用 HTTPS 协议传输。

使用加密算法时须要考虑的问题

  • 毫不要以明文存储密码
  • 永远使用 哈希算法 来处理密码,毫不要使用 Base64 或其余编码方式来存储密码,这和以明文存储密码是同样的,使用哈希,而不要使用编码。编码以及加密,都是双向的过程,而密码是保密的,应该只被它的全部者知道, 这个过程必须是单向的。哈希正是用于作这个的,历来没有解哈希这种说法, 可是编码就存在解码,加密就存在解密。
  • 毫不要使用弱哈希或已被破解的哈希算法,像 MD5 或 SHA1 ,只使用强密码哈希算法。
  • 毫不要以明文形式显示或发送密码,即便是对密码的全部者也应该这样。若是你须要 “忘记密码” 的功能,能够随机生成一个新的 一次性的(这点很重要)密码,而后把这个密码发送给用户。

分布式架构下 session 共享方案

1. session 复制

  • 任何一个服务器上的 session 发生改变(增删改),该节点会把这个 session 的全部内容序列化,而后广播给全部其它节点,无论其余服务器需不须要 session ,以此来保证 session 同步

优势: 可容错,各个服务器间 session 可以实时响应。
缺点: 会对网络负荷形成必定压力,若是 session 量大的话可能会形成网络堵塞,拖慢服务器性能。算法

2. 粘性 session /IP 绑定策略

  • 采用 Ngnix 中的 ip_hash 机制,将某个 ip的全部请求都定向到同一台服务器上,即将用户与服务器绑定。 用户第一次请求时,负载均衡器将用户的请求转发到了 A 服务器上,若是负载均衡器设置了粘性 session 的话,那么用户之后的每次请求都会转发到 A 服务器上,至关于把用户和 A 服务器粘到了一块,这就是粘性 session 机制。

优势: 简单,不须要对 session 作任何处理。
缺点: 缺少容错性,若是当前访问的服务器发生故障,用户被转移到第二个服务器上时,他的 session 信息都将失效。
适用场景: 发生故障对客户产生的影响较小;服务器发生故障是低几率事件 。
实现方式: 以 Nginx 为例,在 upstream 模块配置 ip_hash 属性便可实现粘性 session。数据库

3. session 共享(经常使用)

  • 使用分布式缓存方案好比 Memcached 、Redis 来缓存 session,可是要求 Memcached 或 Redis 必须是集群
  • 把 session 放到 Redis 中存储,虽然架构上变得复杂,而且须要多访问一次 Redis ,可是这种方案带来的好处也是很大的:
    • 实现了 session 共享;
    • 能够水平扩展(增长 Redis 服务器);
    • 服务器重启 session 不丢失(不过也要注意 session 在 Redis 中的刷新/失效机制);
    • 不只能够跨服务器 session 共享,甚至能够跨平台(例如网页端和 APP 端)

4. session 持久化

  • 将 session 存储到数据库中,保证 session 的持久化

优势: 服务器出现问题,session 不会丢失
缺点: 若是网站的访问量很大,把 session 存储到数据库中,会对数据库形成很大压力,还须要增长额外的开销维护数据库。

只要关闭浏览器 ,session 真的就消失了?

不对。对 session 来讲,除非程序通知服务器删除一个 session,不然服务器会一直保留,程序通常都是在用户作 log off 的时候发个指令去删除 session。
然而浏览器历来不会主动在关闭以前通知服务器它将要关闭,所以服务器根本不会有机会知道浏览器已经关闭,之因此会有这种错觉,是大部分 session 机制都使用会话 cookie 来保存 session id,而关闭浏览器后这个 session id 就消失了,再次链接服务器时也就没法找到原来的 session。若是服务器设置的 cookie 被保存在硬盘上,或者使用某种手段改写浏览器发出的 HTTP 请求头,把原来的 session id 发送给服务器,则再次打开浏览器仍然可以打开原来的 session。
偏偏是因为关闭浏览器不会致使 session 被删除,迫使服务器为 session 设置了一个失效时间,当距离客户端上一次使用 session 的时间超过这个失效时间时,服务器就认为客户端已经中止了活动,才会把 session 删除以节省存储空间。

项目地址

在项目中使用 JWT

后语

  • 本文只是基于本身的理解讲了理论知识,由于对后端/算法知识不是很熟,若有谬误,还请告知,万分感谢
  • 若是本文对你有所帮助,还请点个赞~~

参考

百度百科-cookie

百度百科-session

详解 Cookie,Session,Token

一文完全搞懂Cookie、Session、Token究竟是什么

3种web会话管理的方式!!!

Token ,Cookie和Session的区别!!!

完全理解 cookie、session、token!!!

前端鉴权

SHA-1

SHA-2

SHA-3

不要再使用MD5和SHA1加密密码了!

廖雪峰 Node 教程之 crypto

推荐阅读

你真的了解 React 生命周期吗

React Hooks 详解 【近 1W 字】+ 项目实战

React SSR 详解【近 1W 字】+ 2个项目实战

从 0 到 1 实现一款简易版 Webpack