• 如何基于GitHub实现一个简单的random image API 服务
  • 发布于 2个月前
  • 251 热度
    0 评论

本文介绍如何基于 GitHub 为图片存储,通过 API 随机返回可用的图片地址。


前言

常用的桌面壁纸、终端背景图片,亦或是博客背景或文章封面,这些都离不开图片。于是,就想如何免费管理图片,同时又能轻松共享他人。在网上找了一些免费的随机图片 API,大部分处于不可用的状态,或者是需要注册登录,创建 API Token。作为一名老年程序员,自然就想能通过编程实现,实现图片自由。虽然也可以通过类似爬虫的思路实现,但还是希望都在自己的控制中,万一出现不好的图片就不好了。


免费 CDN 加速
我的博客图片一直在用 GitHub 存储,通过 jsdelivr CDN 加速。于是就思考,如果能获取到 GitHub 存储的文件列表,就可以实现一个图片服务。简单说下 jsdelivr CDN,它支持对 GitHub 中文件的加速访问。如位于我的仓库下的图片,通过对地址转为为 jsdelivr CDN 地址。
如下所示:
https://github.com/poloxue/public_images/default/0001.webp -> https://cdn.jsdelivr.net/gh/poloxue/public_images@latest/default/0001.webp
现在如果能顺利获取到仓库的图片文件列表,即可将 github 作为我们的图片图片存储,而无需花钱购买云存储实现。

如何获得 GitHub 文件列表呢?


查询 GitHub 图片列表
GitHub 支持接口获取仓库文件列表,如下所示,查询 user/repo 下某分支的情况。
https ://api.github.com/repos/{user}/{repo}/branches/{branch}。
JSON 返回体中,通过访问路径 .commit.commit.tree.url 拿到获取仓库文件列表的接口地址。其实主要是获取该分支最近的 commit hash。
演示案例,获取 github.com/poloxue/public_images
通过 httpie 执行请求,如下所示:
https ://api.github.com/repos/poloxue/public_images/branches/main
{
    // ...
    "commit": {
        "commit": {
            "tree": {
                "sha": "3859a482b15ed41bfb86ce073d6c500fef36910c",
                "url": "https://api.github.com/repos/poloxue/public_images/git/trees/3859a482b15ed41bfb86ce073d6c500fef36910c"
            }
        }
    }
}
通过 jq 解析请求结果,再次通过 httpie 请求,命令如下:
https $(https ://api.github.com/repos/poloxue/public_images/branches/main | jq -r '.commit.commit.tree.url+"?recursive=1"') | jq '.tree[].path'
如上的命令中通过 ?recursive=1 实现遍历子目录,通过 '.tree[].path' 返回所有文件和目录。
返回结果如下:
.gitignore
README.md
beauties
beauties/0001.jpeg
beauties/0002.jpeg
beauties/0003.jpeg
beauties/0004.webp
beauties/0005.jpg
beauties/0006.webp
default
default/0001.webp
default/0002.webp
default/0003.webp
scenes
scenes/0001.webp
scenes/0002.webp
scenes/0003.webp
scenes/0004.webp
scenes/0005.webp

特别说明:接口的返回其实有数量限制,但这个限制并不是很大,个人使用无需担心。


图片 API 服务
在了解如何使用GitHub 的接口后,我通过 aws 的 serverless 的能力,创建了一个简单的 Image Random API,将图片文件在仓库中的路径与 jsdelivr CDN 地址结合,随机返回一个图片地址。
接口定义:
/image/random/{category}
输入参数:
category:str, 图片类型,即 github 仓库的子目名称;
返回结果:
image:str,图片地址,指定 category 类型下的一个图片地址;

核心的代码如下所示:
import time
import random
import requests
from collections import defaultdict
# 堆代码 duidaima.com
class ImageService:
    def __init__(self):
        self._sha = None
        self._images = defaultdict(list)

        self._timeout = 60
        self._timestamp = 0

    def last_sha(self):
        last_timestamp = time.time()
        if last_timestamp - self._timestamp < self._timeout:
            return self._sha

        self._timestamp = last_timestamp
        data = requests.get(
            "https://api.github.com/repos/poloxue/public_images/branches/main"
        ).json()
        return data["commit"]["commit"]["tree"]["sha"]

    def get_images(self, category):
        last_sha = self.last_sha()
        if self._sha == last_sha:
            return self._images[category]

        self._images[category] = []
        self._sha = last_sha
        data = requests.get(
            f"https://api.github.com/repos/poloxue/public_images/git/trees/{last_sha}?recursive=1"
        ).json()

        for file in data["tree"]:
            fpath = file["path"]
            subdir = fpath.split("/")[0]
            if fpath.lower().endswith((".png", "jpg", "jpeg", "webp")):
                self._images[subdir].append(
                    f"https://cdn.jsdelivr.net/gh/poloxue/public_images@latest/{file['path']}"
                )
        return self._images[category]

    def random_image(self, category):
        images = self.get_images(category)
        if images:
            return random.choice(images)
如上方法,random_image 可提供给接口调用,从 GitHub 仓库返回一个随机图片。
请求示例,如下所示:
https ://api.poloxue.com/image/random/scenes
输出结果:
{
    "image": "https://cdn.jsdelivr.net/gh/poloxue/public_images@latest/scenes/0005.webp"
}

这只是服务的最小版本,还可以继续扩展,提供更多接口能力,如基于 Python 实现简单的裁剪缩放,皆是可行。另外,这个 service 中还实现了简单的基于时间的缓存方案,另外当请求到分支最后的 hash 变化时才会更新 self._images。唯一的遗憾就是,因为要提升共享能力,开发了一个简单的后端服务,没有免费云服务可用。还有就是,没有自动更新图片机制,有机会看看补齐吧。


总结
本文介绍了如何基于 GitHub 实现一个简单的 random image API 服务,主要是了管理我的图片资源,同时实现了编程自由控制图片资源的的目标。我计划将会利用这个的图片接口能力,自由更新我的桌面、iTerm 甚至是博客的背景图片,自己动手,丰衣足食。

用户评论