前回 Label Studio の紹介記事である OSSのアノテーションツール Label Studio を使って、快適にアノテーションを書いたが、最近自分以外にもチーム全体でアノテーションをしたいという要望があったので重い腰をあげてローカルではなく、Webアプリとして Label Studio をホストしました。

Label studio の運用方法は、主にDocker イメージが提供されているのでそれを使って動かすのが最も簡単です。

CloudRun を使ってサーバーレスで動かす方法1もありますが、今回はk8s 上にLabel studio をデプロイしました。

k8s のマニフェストファイルは、公式リポジトリ2を参考に作成しました。

apiVersion: v1
kind: Service
metadata:
  name: labelstudio
  namespace: development
spec:
  ports:
  - name: http
    port: 8080
    protocol: TCP
  selector:
    app: labelstudio
---
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  name: labelstudio-data-pvc
  namespace: development
spec:
  accessModes:
  - ReadWriteOnce
  resources:
    requests:
      storage: 50Gi
---
apiVersion: apps/v1
kind: Deployment
metadata:
  labels:
    app: labelstudio
  name: labelstudio
  namespace: development
spec:
  replicas: 1
  selector:
    matchLabels:
      app: labelstudio
  template:
    metadata:
      labels:
        app: labelstudio
    spec:
      containers:
      - image: heartexlabs/label-studio:v1.4.1
        imagePullPolicy: Always
        name: labelstudio
        ports:
        - containerPort: 8080
        stdin: true
        tty: true
        volumeMounts:
        - mountPath: /label-studio/data
          name: labelstudio-data-vol
      imagePullSecrets:
      - name: secret
      volumes:
      - name: labelstudio-data-vol
        persistentVolumeClaim:
          claimName: labelstudio-data-pvc

あとは、以下のコマンドを打てば、label studio のPod にポートフォワードされるので、

> kubectl -n development port-forward svc/labelstudio 8080:8080

http://localhost:8080/

にアクセスすれば、k8s 上でホストされるLabel studio にアクセスが可能になります。

本当は、Google App Engine でホストしたかったんですが、GAEのDocker はマウント機能が使えず、永続層にDBをSQLite で保存する Labelstudio では採用することができませんでした。残念

Streamlit は GAEでポンッとデプロイできるから、気軽にWebアプリとしてホストできるから良いですね。3

Footnotes

  1. 【AI Shift Advent Calendar 2021】Label StudioのGCP上でのデプロイ | 株式会社AI Shift

  2. Add kubernetes files to allow easy deployment by boogheta · Pull Request #1067 · heartexlabs/label-studio

  3. https://discuss.streamlit.io/t/gcp-app-engine-integration/11322/3