RAII概念与在Python中的应用

Posted on 2021-08-22 Edited on 2026-03-21 In python

RAII 概念与在 Python 中的应用

RAII(Resource Acquisition Is Initialization)，即资源获取即初始化，是一种设计模式，用于解决资源的获取与初始化的问题，最早在 C++中提出与推广。
在这篇文章我来简单地介绍一下 RAII 的概念，以及在 Python 中的应用。

RAII 的概念

在计算机与程序的世界中，有一些资源，比如文件、网络连接、数据库连接、线程、进程等，这些资源在使用的时候需要获取，在使用完成后需要释放。如果不及时释放，会导致资源泄露，造成资源的浪费，程序出错甚至系统崩溃。

一个简单的示例就是文件的读写。

f = open('test.json', 'r')
raw = f.read()
data = json.loads(raw)
f.close()

这段代码看起来没有什么问题，但是当test.json文件的内容不是合法的 JSON 格式时，第四行代码反序列化数据就会抛出异常，导致第五行代码无法执行，文件没有被关闭。

这个例子告诉我们在处理一些资源时，需要注意在操作过程中是否会发生一些意外情况，例如抛出异常，并且在意外情况发生后，也需要关闭资源。

在 Python2.5 之前的版本中，我们用try-finally来保证程序最终会关闭资源。

try:
    f = open('test.json', 'r')
    raw = f.read()
    data = json.loads(raw)
except JSONDecodeError:
    ...
finally:
    f.close()

在简单的文件读取操作中，使用try语句多少有点大材小用。为了更好地处理类似的资源管理问题，Python2.5 引入了with语句，做到无论语句块中的代码执行是否抛出异常，都可以在退出with语句块时执行清零代码。

事实上在 Python 中进行文件读写的标准方式就是使用with open语句。

1
2
3

with open('test.json', 'r') as f:
    raw = f.read()
    data = json.loads(raw)

配置一台开发Linux服务器

Posted on 2021-06-07 Edited on 2026-03-21 In linux

临近 618 年中大促，各大云服务商也会提供一些优惠。正好我三年前在腾讯云上买的一台 2 核 4G 的虚拟机到期了，看了一下腾讯云的优惠活动，下单了一台 2 核 4G 的的轻量应用服务器（一年期，288 元）。

轻量应用服务器一般都会提供一些常见的镜像（Wordpress，LAMP 等），我的目的不是建站，所以还是选了朴素的 Ubuntu18.04 的基础镜像。

下面大致介绍一下我配置服务器的过程（安装及配置方法基本来源于对应工具官网）。

配置密钥登录

轻量应用服务器默认是从腾讯云控制台直接登录到终端，可以将自己的公钥加到 ssh 配置里。

1 2	# Remote cat PUBLIC_KEY >> ~/.ssh/authorized_keys

为了方便登录，可以配置自己主机的ssh config 文件，随后就可以通过ssh light命令登录到服务器。

# ~/.ssh/config

Host light
  HostName 1.2.3.5
  Port 22
  User lighthouse

单元测试：概念、作用与实践

Posted on 2021-05-24 Edited on 2026-03-21 In python

最近公司越来越多的项目开始推动单元测试，而我在公司里很早就在进行单元测试实践。就用这篇文章作为一次内部技术分享的主题，同时也代表我自己对单元测试的认识和实践。

单元测试的概念

单元测试是软件测试的一种类型，测试对象是最基础的代码单元（函数、类、模块），属于白盒测试。在经典的测试金字塔中，单元测试处于最底层。

最简单的单元测试：

步行、跑步与骑车

Posted on 2021-05-09 Edited on 2026-03-21 In 闲谈

今天中午难得地去健身房跑了一会儿步。

使用Python对数据进行压缩

Posted on 2021-05-04 Edited on 2026-03-21 In python

使用 Python 对数据进行压缩

之前在工作中遇到一个需求，需要在手机小程序端获取到微信小商店店铺的所有商品数据。由于当时我们没有在后台维护用户的商品数据，选择的解决方案是现场调用商品列表接口，然后缓存在 Redis 里。
鉴于 Redis 的内存还是比较宝贵的，而用户的商品数据（转化为 json 格式后）又是一些比较有规律的文本数据，比较适合进行数据压缩，于是我调研了一下 Python 中的数据压缩的方案。

`zip`标准库

Python 中有一个标准库zip,常用来处理 zip 格式文件，提供的函数和方法也更适合文件操作。在这个案例中我们的数据是通过 http 接口获取的，额外进行一些文件操作有些麻烦和多余，zip标准库并不适合这个场景。

`zlib`标准库

zlib是一个常用的压缩、解压库，使用了 deflate 算法。zip和unzip工具背后其实用的就是zlib。Python 内置了zlib标准库，提供的接口也很简洁易用（zlib.compress和zlib.decompress）。

import zlib
raw = b'abc' * 100
compressed = zlib.compress(raw)
print(f'compress ratio =  {len(compressed)/len(raw):.2}') # compress ratio =  0.05
assert zlib.decompress(compressed) == raw

使用crontab运行简单的定时任务

Posted on 2021-04-06 Edited on 2026-03-21 In linux

前段时间遇到一个需要在本地开发环境定时执行某个脚本来同步数据的情景。

如果是线上业务的话，我一般会使用Celery Beat来执行定时任务。考虑到运行Celery Beat需要启动两个服务（celery worker和celery beat），还要管理虚拟环境并编写 Python 代码，用在简单的定时任务执行场景过于复杂。

说起定时任务，首先想到的就是crontab。于是我调研了一下crontab的使用方法，成功配置了定时任务，也在这里简单的介绍一下。

crontab 简介

crontab（守护进程为crond）是类 unix 平台下的一个定时任务管理工具，可用于周期性执行定时任务。

语义化版本与其在Python中的使用

Posted on 2021-03-24 Edited on 2026-03-21 In 开发

今天在公司处理了一个线上问题，涉及到在 Python 中处理语义化版本（Semantic Versioning），值得作为一个主题记录一下。

初探Deno.js

Posted on 2021-03-23 Edited on 2026-03-21 In 开发

Node.js 的作者 Ryan Dahl 在 2018 年 JSConf EU 上发布了一篇演讲：10 Things I Regret About Node.js，讲述了他认为自己在设计 Node.js 时的十个（实际上演讲中只提到七个）失误，包括：没有坚持使用 Promise，使用了 GYP 构建系统，package.json 和 node_modules 的设计失误等。

在演讲中 Ryan Dahl 宣布了一个新项目：Deno，一个新的服务端 Javascript 运行时。经过两年多的发展，Deno 已经发布了 1.8 版本，也有了一个活跃的开发者社区。我们今天就来简单的了解一下 Deno。

Deno 简介

Deno is a simple, modern and secure runtime for JavaScript and TypeScript that uses V8 and is built in Rust.

Deno 使用 V8 引擎，由 Rust 构建，是一个简单、现代、安全的 Javascript 和 Typescript 运行时。

Deno 的主要特性有：

默认安全。外部代码没有文件系统、网络、环境的访问权限，除非显式开启。
支持开箱即用的 TypeScript 的环境。
只分发一个独立的可执行文件 (deno)。
有着内建的工具箱，比如一个依赖信息查看器 (deno info) 和一个代码格式化工具 (deno fmt)。
有一组经过审计的标准模块，保证能在 Deno 上工作。
脚本代码能被打包为一个单独的 JavaScript 文件。

Python 3.10中的模式匹配

Posted on 2021-03-19 Edited on 2026-03-21 In python

Python 3.10 版本还在开发之中，目前释出的 dev 版本实现了新语法特性 Structural Pattern Matching(PEP 634)：可以利用match语句和case语句匹配对象的不同模式，并应用不同的行为。

我先前自己尝试体验了一下Structural Pattern Matching语法（使用pyenv安装dev版本 Python 3.10），感觉很好用的，并且有很大的发挥空间。

Structural pattern matching has been added in the form of a match statement and case statements of patterns with associated actions. Patterns consist of sequences, mappings, primitive data types as well as class instances. Pattern matching enables programs to extract information from complex data types, branch on the structure of data, and apply specific actions based on different forms of data.

官方介绍

语法

match subject:
    case <pattern_1>:
        <action_1>
    case <pattern_2>:
        <action_2>
    case <pattern_3>:
        <action_3>
    case _:
        <action_wildcard>

最简单的模式匹配

我们可以使用match case直接匹配字面量。

def http_error(status):
    match status:
        case 400:
            return "Bad request"
        case 404:
            return "Not found"
        case 418:
            return "I'm a teapot"
        case _:
            return "Something's wrong with the Internet"

为异步Python代码编写单元测试

Posted on 2020-12-26 Edited on 2023-02-16 In python

最近使用 FastAPI 框架开发了一个 WEB 服务。

为了充分利用 FastAPI 作为一个 ASGI 框架的原生异步支持特性，很多业务代码也改成了异步函数，并且使用了异步的 HTTP 库httpx和 MongoDB 的异步 Python drivermotor。

由此带来的一个问题就是异步 Python 代码的单元测试的编写问题。

测试异步函数

编写测试代码

Python 的异步函数返回的是一个协程对象（coroutine），需要在前面加await才能获取异步函数的返回值，而只有在异步函数中才能使用await语句，这也意味着一般异步函数的测试代码本身也需要是一个异步函数。

async def add(a:int, b:int):
    return a + b

async def testAdd():
    ret = await add(1, 2)
    assert ret == 3

运行测试代码

与 Javascript 不同，Python 的异步代码需要显示地运行在事件循环中。

Python3.7 以上的版本中可以直接调用asyncio.run函。

如果使用的是更早的 Python 版本，就需要指定一个事件循环对象来运行异步代码。

import asyncio

# Python3.7+
asyncio.run(testAdd())

# Python3.6
loop = asyncio.new_event_loop()
loop.run_until_complete(testAdd())

RAII 概念与在 Python 中的应用

RAII 的概念

配置密钥登录

单元测试的概念

使用 Python 对数据进行压缩

zip标准库

zlib标准库

crontab 简介

Deno 简介

语法

最简单的模式匹配

测试异步函数

编写测试代码

运行测试代码

`zip`标准库

`zlib`标准库