[python]记录关于websocket的原理和使用

[python]记录关于websocket的原理和使用

什么是websocket

WebSocket是一种在单个TCP连接上进行 全双工
通讯的协议。WebSocket使得客户端和服务器之间的数据交换变得更加简单,允许服务端主动向客户端推送数据。在WebSocket API中,浏览器和服务器只需要完成一次握手,两者之间就直接可以创建 持久性
的连接,并进行双向数据传输。

Websocket是一个持久化的协议,相对于HTTP这种非持久的协议来说的。

举个例子:

HTTP的生命周期通过 Request 来界定,也就是发送一次 Request,收到一次 Response ,那么在 HTTP1.0 中,这次HTTP请求就结束了

在HTTP1.1中进行了改进,使得有一个keep-alive,也就是说,在一个HTTP连接中,可以发送多个Request,接收多个Response。但是请记住 Request = Response , 在HTTP中永远是这样,也就是说一个request只能有一个response。而且这个response也是被动的,不能主动发起。

而对于websocket来说,在HTTP的握手基础上建立起链接,服务器端可以主动的向客户端发送数据。

为什么要使用websocket

现在,很多网站为了实现页面上的数据更新,都是通过ajax技术 轮询
去服务器拉取数据。轮询是在特定的时间间隔(如每1秒),由浏览器对服务器发出HTTP请求,然后由服务器返回最新的数据给客户端的浏览器。这种传统的模式带来很明显的缺点,即浏览器需要不断的向服务器发出请求,然而HTTP请求可能包含较长的头部,其中真正有效的数据可能只是很小的一部分,显然这样会浪费很多的带宽等资源。

而比较新的技术去做轮询的效果是 Comet
。Comet技术又可以分为长轮询和流技术。长轮询改进了上述的轮询技术,减小了无用的请求。它会为某些数据设定过期时间,当数据过期后才会向服务端发送请求;这种机制适合数据的改动不是特别频繁的情况。流技术通常是指客户端使用一个隐藏的窗口与服务端建立一个HTTP长连接,服务端会不断更新连接状态以保持HTTP长连接存活;这样的话,服务端就可以通过这条长连接主动将数据发送给客户端;流技术在大并发环境下,可能会考验到服务端的性能。这两种技术都是基于请求-应答模式,都不算是真正意义上的实时技术;它们的每一次请求、应答,都浪费了一定流量在相同的头部信息上,并且开发复杂度也较大。

在这种情况下,HTML5定义了WebSocket协议,能更好的节省服务器资源和带宽,并且能够更实时地进行通讯。

Websocket使用ws或wss的统一资源标志符,类似于HTTPS,其中wss表示在TLS之上的Websocket。如:

ws://example.com/wsapi
wss://secure.example.com/

Websocket使用和 HTTP 相同的 TCP 端口,可以绕过大多数防火墙的限制。默认情况下,Websocket协议使用80端口;运行在TLS之上时,默认使用443端口。

WebSocket 目前由 W3C 进行标准化。WebSocket 已经受到 Firefox 4、Chrome 、Opera 10.70 以及 Safari 5 等浏览器的支持。

一个典型的websocket的握手请求

  • 客户端请求:
GET / HTTP/1.1
Upgrade: websocket
Connection: Upgrade
Host: example.com
Origin: http://example.com
Sec-WebSocket-Key: sN9cRrP/n9NdMgdcy2VJFQ==
Sec-WebSocket-Version: 13
  • 服务端回应:
HTTP/1.1 101 Switching Protocols
Upgrade: websocket
Connection: Upgrade
Sec-WebSocket-Accept: fFBooB7FAkLlXgRSz0BT3v4hq5s=
Sec-WebSocket-Location: ws://example.com/

字段说明

  • Connection必须设置Upgrade,表示客户端希望连接升级。
  • Upgrade字段必须设置Websocket,表示希望升级到Websocket协议。
  • Sec-WebSocket-Key是随机的字符串,服务器端会用这些数据来构造出一个SHA-1的信息摘要。把“Sec-WebSocket-Key”加上一个特殊字符串“258EAFA5-E914-47DA-95CA-C5AB0DC85B11”,然后计算SHA-1摘要,之后进行BASE-64编码,将结果做为“Sec-WebSocket-Accept”头的值,返回给客户端。如此操作,可以尽量避免普通HTTP请求被误认为Websocket协议。
  • Sec-WebSocket-Version 表示支持的Websocket版本。RFC6455要求使用的版本是13,之前草案的版本均应当弃用。
  • Origin字段是可选的,通常用来表示在浏览器中发起此Websocket连接所在的页面,类似于Referer。但是,与Referer不同的是,Origin只包含了协议和主机名称。
  • 其他一些定义在HTTP协议中的字段,如Cookie等,也可以在Websocket中使用。

如何使用websocket

关于如何在Python后端使用websocket的技术有多种方式,可以参考这篇文章 《python使用websocket的几种方式》

我们的项目使用的是Django的框架,我这次的实践主要围绕Django 的websocket插件 dwebsocket
展开记录。 源码地址

安装dwesocket

话不多说, pip大法。

pip install dwesocket

使用

如果希望一个view视图既可以处理HTTP请求,也可以处理websocket请求,只需要将这个view函数用装饰器 @accept_websocket
包裹即可。也可以使用 @require_websocket
装饰器,这样的话这个视图只允许接受websocket请求,会拒绝正常的HTTP请求。

如果你希望在应用程序中为所有的url提供websocket请求支持,则可以使用中间件。只需要将 dwebsocket.middleware.websocketmiddleware
添加到设置中的的 MIDDLEWARE_CLASSES
中。 (如果没有需要自己定义,不定义会报错,这个有点尴尬,对于这一点的优化,我已经对主库提了一个
Pull Request

,希望作者还在维护….)

MIDDLEWARE_CLASSES = ['dwebsocket.middleware.WebSocketMiddleware']

如果允许每个单独的视图接受websocket请求,在settings中设置 WEBSOCKET_ACCEPT_ALL
True
.

WEBSOCKET_ACCEPT_ALL = True

接口和属性

  1. request.is_websocket() 如果是个websocket请求返回True,如果是个普通的http请求返回False,可以用这个方法区分它们。
  2. request.websocket 在一个websocket请求建立之后,这个请求将会有一个websocket属性,用来给客户端提供一个简单的api通讯,如果request.is_websocket()是False,这个属性将是None。
  3. WebSocket.wait() 返回一个客户端发送的信息,在客户端关闭连接之前他不会返回任何值,这种情况下,方法将返回None
  4. WebSocket.read() 如果没有从客户端接收到新的消息,read方法会返回一个新的消息,如果没有,就不返回。这是一个替代wait的非阻塞方法
  5. WebSocket.count_messages() 返回消息队列数量
  6. WebSocket.has_messages() 如果有新消息返回True,否则返回False
  7. WebSocket.send(message) 向客户端发送消息
  8. WebSocket.iter() websocket迭代器

实践例程

从客户端接收一条消息,将该消息发送回客户端并关闭连接(通过视图返回):

from dwebsocket import require_websocket

@require_websocket
def echo(request):
    message = request.websocket.wait()
    request.websocket.send(message)

我们也可以让服务端不自动关闭连接,下面的例程中,服务器端会将客户端发来的消息转为小写发送回去,并增加了普通的HTTP请求的响应,也做同样操作返回:

from django.http import HttpResponse
from dwebsocket import accept_websocket

def modify_message(message):
    return message.lower()

@accept_websocket
def lower_case(request):
    if not request.is_websocket(): # 普通HTTP请求
        message = request.GET['message']
        message = modify_message(message)
        return HttpResponse(message)
    else: # websocket请求
        for message in request.websocket:
            message = modify_message(message)
            request.websocket.send(message)

改变dwebsocket后端

目前dwebsocket支持两种后端,分别是 default
的和 uwsgi

默认 default
支持 Django自身的开发服务器
, eventlent
, gevent
, 和 gunicore

如果你想使用 uwsgi
后端,在 settings.py
文件中添加 WEBSOCKET_FACTORY_CLASS

WEBSOCKET_FACTORY_CLASS = 'dwebsocket.backends.uwsgi.factory.uWsgiWebSocketFactory'

运行 uwsgi :

uwsgi --http :8080 --http-websockets --processes 1 
--wsgi-file wsgi.py--async 30 --ugreen --http-timeout 300

websocket的优缺点

优点

  • 服务器与客户端之间交换的标头信息很小,大概只有2至10字节(和数据包长度有关);
  • 客户端与服务器都可以主动传送数据给对方;
  • 不用频率创建 TCP 请求及销毁请求,减少网络带宽资源的占用,同时也节省服务器资源;
  • 更强的实时性。由于协议是全双工的,所以服务器可以随时主动给客户端下发数据。相对于HTTP请求需要等待客户端发起请求服务端才能响应,延迟明显更少;
  • 更好的二进制支持。Websocket定义了二进制帧,相对HTTP,可以更轻松地处理二进制内容;
  • 可以支持扩展。Websocket定义了扩展,用户可以扩展协议、实现部分自定义的子协议。如部分浏览器支持压缩等。

缺点

下面这些出自知乎,优点鸡肋的缺点,就是对开发者技术要求高点应该不算缺点,新的技术总有个普及的过程。

对前端开发者:

  • 往往要具备数据驱动使用javascript的能力,且需要维持住ws连接(否则消息无法推送)

对于后端开发者:

  • 一是长连接需要后端处理业务的代码更稳定(不要随便把进程和框架都crash掉)
  • 二是推送消息相对复杂一些
  • 三是成熟的http生态下有大量的组件可以复用,websocket比较新

也可以看看GoEasy文库的其他资料。

发表评论

邮箱地址不会被公开。

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据