All Posts

2021

Amazonがeコマース検索を Lucene により、どうスケールさせているか at Berlin Buzzwords 2019

Standard SQLのCOALESCEで、時間経過によってカラム名が変化したデータを柔軟に抽出する

Google Cloud Pub/Sub に公開された結果はDataflow template を使えばめちゃくちゃ簡単に確認できる

Airflow でDAGを任意のタイミングで一度だけ実行する方法

クエリ分類(Query Classification) について社内の勉強会で話してきた

Hugo で記事の更新日をgitと連携して自動的に取得して表示させる

CloudComposer のDAGをCircleCIで更新する

CircleCI アプリ内の設定ファイルエディターを利用して、CI上の環境変数などローカルCLIでは確認できない挙動を素早く確認して修正する

GCPのCloud Composer のDAGを素早く・簡単にデバッグする

Pandoc を使って抽出できなかったWord内部の画像をGoogle Driveを使って抽出する

Pandoc で特定のディレクトリ直下にある複数のWordをMarkdown形式に一括変換する

gcloud commands で PubSub に jsonファイルをメッセージとして公開 (Pusblish) する

gRPC client evans で portforward 先のリモートサーバーにリクエストを行う

システムの応答速度は本質的な価値提供であることを示す A/B テストの実例

子供が1歳児を迎えるまでに役に立ったもの

mvn archetype:generate でJavaのプロジェクト雛形を作成する際のオプションの解説

eコマースの検索と推薦についてのサーベイ論文である 'Challenges and research opportunities in eCommerce search and recommendations' を社内勉強会で発表した

How to get the uploaded file path and processing its file in Streamlit

Streamlit でアップロードしたファイルのパスを取得して、特定の処理をする

2021年05月時点で自分が実践しているMLOpsの情報収集方法

Poetry からsetup.py を自動生成する

KyTeaをPythonで扱えるMykyteaを使うために必要なこと

[抄訳] 検索エンジンの達成度と検索チームの成熟度モデル

Pythonで、変数を挿入して柔軟にSQLクエリを構築する

機械学習エンジニアから検索エンジニアに転生

pipenv でローカルパッケージが正常にインストールされないときの対処法

2021年の目標

GKE 上にて Pythonで logger.info() を行うとCloud logging では stderr に保存され、すべてエラーになる問題への対処法

GKE でローリングアップデート後、ローカルからポートフォワードでリクエストを投げるとcurl: (52) Empty reply from server と返ってくるときの対処方法

Standard SQLで 列と列の組み合わせの数を集計したい

pip 実行時に sys.stderr.write(f"ERROR: {exc} ") とエラーが出てpipを実行できないときの対処方法

[抄訳] Towards ML Engineering: A Brief History Of TensorFlow Extended (TFX)

2020

2019

2018

2017

2013