前回 Label Studio の紹介記事である OSSのアノテーションツール Label Studio を使って、快適にアノテーションを書いたが、最近自分以外にもチーム全体でアノテーションをしたいという要望があったので重い腰をあげてローカルではなく、Webアプリとして Label Studio をホストしました。
Label studio の運用方法は、主にDocker イメージが提供されているのでそれを使って動かすのが最も簡単です。
CloudRun を使ってサーバーレスで動かす方法1もありますが、今回はk8s 上にLabel studio をデプロイしました。
k8s のマニフェストファイルは、公式リポジトリ2を参考に作成しました。
apiVersion: v1
kind: Service
metadata:
name: labelstudio
namespace: development
spec:
ports:
- name: http
port: 8080
protocol: TCP
selector:
app: labelstudio
---
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
name: labelstudio-data-pvc
namespace: development
spec:
accessModes:
- ReadWriteOnce
resources:
requests:
storage: 50Gi
---
apiVersion: apps/v1
kind: Deployment
metadata:
labels:
app: labelstudio
name: labelstudio
namespace: development
spec:
replicas: 1
selector:
matchLabels:
app: labelstudio
template:
metadata:
labels:
app: labelstudio
spec:
containers:
- image: heartexlabs/label-studio:v1.4.1
imagePullPolicy: Always
name: labelstudio
ports:
- containerPort: 8080
stdin: true
tty: true
volumeMounts:
- mountPath: /label-studio/data
name: labelstudio-data-vol
imagePullSecrets:
- name: secret
volumes:
- name: labelstudio-data-vol
persistentVolumeClaim:
claimName: labelstudio-data-pvc
あとは、以下のコマンドを打てば、label studio のPod にポートフォワードされるので、
> kubectl -n development port-forward svc/labelstudio 8080:8080
にアクセスすれば、k8s 上でホストされるLabel studio にアクセスが可能になります。
本当は、Google App Engine でホストしたかったんですが、GAEのDocker はマウント機能が使えず、永続層にDBをSQLite で保存する Labelstudio では採用することができませんでした。残念
Streamlit は GAEでポンッとデプロイできるから、気軽にWebアプリとしてホストできるから良いですね。3