datatech-jpのCasual Talks #1 が開催されるとのことで覗いてみた!
発表内容
- syou6162
- データ管理に役立つメタデータ
- reizist
- ohsawa0515
- udzura
資料待ち / syou6162
会社のテックブログに掲載されるとのことで公開待ち🙏
公開されていたので貼りました🙏
小さく始めるデータ基盤 / reizist
スタートアップ企業でデータ基盤を作成した話だった。 どんなデータを、どこに、どうやって集めるのかと言った定義から、実際に選択された製品までまとまっていてわかりやすかった。 コストのところではCloudRunとBigQueryで200円ということで、コンビニコーヒー2杯と考えたらめっちゃ安い! なかなか公開できない部分ではあるけど、スタートアップ以外ではどのぐらいのコスト感で運用しているのか気になった🙏
BigQueryのネイティブJSON型がサポートされたので触ってみた / ohsawa0515
BigQueryのネイティブJSON型を触ってみた話だった。 今までSQLやユーザ定義関数を使ってスキーマ定義していたものがJSON型で触りやすくなったのはいい話だと思った。 8スライドめにパフォーマンスについても言及されていて素晴らしいと思った。 テーブルサイズがString型よりも半分近くも削減されるのは、理由が気になる!
開発者生産性指標の可視化 / udzura
For Keysというソフトウェア開発チームのパフォーマンスを示す4つの指標を、自チームでどう実現したかという話だった。 エンジニアとしてのパフォーマンスを可視化できるなんて面白い! また、それをどうやって集めていったかの話にも言及されていて勉強になった。
もう一つの話題で面白かったのがDashboard as Code
だった。
ダッシュボードの変更履歴や構成が管理できない部分は、今後自分も問題になるんじゃないかと思っていて、ここにチャレンジしているのはすごいと思った。
StreamlitというPython製のWebフレームワークが紹介されていて、ノートブック系で試行錯誤した結果をPandasやNumPyそのままの形でダッシュボードまで持っていきやすい点がいいと思った。
時間があったら触ってみたい!
まとめでは、Four Keysの他にも有効な指標がないか模索している点や、ダッシュボードが活用されているかも追っていくことが明言されていて、今後も気になる!
まとめ
datatech-jpのCasual Talks #1に参加し、聞けた範囲でメモを残した!
- 小さい規模でのデータ基盤について
- 技術的に検証した話
- 指標を設定してそれをどう追っていったかとダッシュボードの変更管理
と話題が重ならず、そしてどれも興味深く話を聞くことが出来た!
datatech-jpのSlackでは書籍の輪読会なども実施されていて見ていて楽しい! 勉強会中はチャンネルでコミュニケーションが盛り上がっていたが、Twitterのハッシュタグでも盛り上がっている様子が伝わればいいなと思った! 2回目があれば楽しみにしています!!