KEMBAR78
Daftar
Login
カスタマーサクセスのためのデータ整備人の活動記録 | PDF
Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
syou6162
7,103 views
カスタマーサクセスのためのデータ整備人の活動記録
https://analytics-and-intelligence.connpass.com/event/174369/ での発表資料です。
Engineering
◦
Read more
11
Save
Share
Embed
Download
Downloaded 44 times
1
/ 35
2
/ 35
3
/ 35
4
/ 35
5
/ 35
6
/ 35
7
/ 35
8
/ 35
9
/ 35
10
/ 35
11
/ 35
12
/ 35
13
/ 35
14
/ 35
15
/ 35
16
/ 35
17
/ 35
18
/ 35
19
/ 35
20
/ 35
21
/ 35
22
/ 35
23
/ 35
24
/ 35
25
/ 35
26
/ 35
27
/ 35
28
/ 35
29
/ 35
30
/ 35
31
/ 35
32
/ 35
33
/ 35
34
/ 35
35
/ 35
More Related Content
PPT
Spring3.1概要 データアクセスとトランザクション処理
by
土岐 孝平
PDF
各種データベースの特徴とパフォーマンス比較
by
株式会社オプト 仙台ラボラトリ
PDF
Scalaエンジニアのためのモナド入門
by
Takashi Imahiro
PDF
[Cloud OnAir] Google Cloud へのデータ移行 2019年1月24日 放送
by
Google Cloud Platform - Japan
PDF
Supabase Edge Functions と Netlify Edge Functions を使ってみる – 機能とその比較 –
by
虎の穴 開発室
PDF
PostgreSQLの範囲型と排他制約
by
Akio Ishida
PDF
MySQL・PostgreSQLだけで作る高速あいまい全文検索システム
by
Kouhei Sutou
PPTX
Kubernetesでの性能解析 ~なんとなく遅いからの脱却~(Kubernetes Meetup Tokyo #33 発表資料)
by
NTT DATA Technology & Innovation
Spring3.1概要 データアクセスとトランザクション処理
by
土岐 孝平
各種データベースの特徴とパフォーマンス比較
by
株式会社オプト 仙台ラボラトリ
Scalaエンジニアのためのモナド入門
by
Takashi Imahiro
[Cloud OnAir] Google Cloud へのデータ移行 2019年1月24日 放送
by
Google Cloud Platform - Japan
Supabase Edge Functions と Netlify Edge Functions を使ってみる – 機能とその比較 –
by
虎の穴 開発室
PostgreSQLの範囲型と排他制約
by
Akio Ishida
MySQL・PostgreSQLだけで作る高速あいまい全文検索システム
by
Kouhei Sutou
Kubernetesでの性能解析 ~なんとなく遅いからの脱却~(Kubernetes Meetup Tokyo #33 発表資料)
by
NTT DATA Technology & Innovation
What's hot
PDF
PostgreSQLの運用・監視にまつわるエトセトラ
by
NTT DATA OSS Professional Services
PPTX
ASP.NET Core の パフォーマンスを支える I/O Pipeline と Channel
by
Joni
PPTX
Composer bin plugin / ツールの依存管理から解放される
by
Kentarou Takeda
PDF
NET 6で実装された新しいLINQ API
by
TomomitsuKusaba
PDF
PostgreSQLをKubernetes上で活用するためのOperator紹介!(Cloud Native Database Meetup #3 発表資料)
by
NTT DATA Technology & Innovation
PDF
Redash・SQL勉強会 ~目指せクエリ女子~
by
Genki Ishibashi
PDF
MySQLで論理削除と正しく付き合う方法
by
yoku0825
PPTX
PostgreSQLの統計情報について(第26回PostgreSQLアンカンファレンス@オンライン 発表資料)
by
NTT DATA Technology & Innovation
PDF
SpringBootTest入門
by
Yahoo!デベロッパーネットワーク
PPTX
テストコードの DRY と DAMP
by
Yusuke Kagata
PDF
OSS-DB Goldへの第一歩~実践!運用管理~
by
Shigeru Hanada
PDF
Keycloak拡張入門
by
Hiroyuki Wada
PDF
マルチテナント化で知っておきたいデータベースのこと
by
Amazon Web Services Japan
PDF
データ管理に重要なことは事業と組織の理解だった(Data Engineering Study #11 発表資料)
by
株式会社MonotaRO Tech Team
PDF
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
by
Yahoo!デベロッパーネットワーク
PDF
pg_trgmと全文検索
by
NTT DATA OSS Professional Services
PPTX
データ解析入門
by
Takeo Noda
PDF
Redmineプラグイン導入・開発入門
by
Minoru Maeda
PDF
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
by
Yahoo!デベロッパーネットワーク
PDF
CircleCIのinfrastructureを支えるTerraformのCI/CDパイプラインの改善
by
Ito Takayuki
PostgreSQLの運用・監視にまつわるエトセトラ
by
NTT DATA OSS Professional Services
ASP.NET Core の パフォーマンスを支える I/O Pipeline と Channel
by
Joni
Composer bin plugin / ツールの依存管理から解放される
by
Kentarou Takeda
NET 6で実装された新しいLINQ API
by
TomomitsuKusaba
PostgreSQLをKubernetes上で活用するためのOperator紹介!(Cloud Native Database Meetup #3 発表資料)
by
NTT DATA Technology & Innovation
Redash・SQL勉強会 ~目指せクエリ女子~
by
Genki Ishibashi
MySQLで論理削除と正しく付き合う方法
by
yoku0825
PostgreSQLの統計情報について(第26回PostgreSQLアンカンファレンス@オンライン 発表資料)
by
NTT DATA Technology & Innovation
SpringBootTest入門
by
Yahoo!デベロッパーネットワーク
テストコードの DRY と DAMP
by
Yusuke Kagata
OSS-DB Goldへの第一歩~実践!運用管理~
by
Shigeru Hanada
Keycloak拡張入門
by
Hiroyuki Wada
マルチテナント化で知っておきたいデータベースのこと
by
Amazon Web Services Japan
データ管理に重要なことは事業と組織の理解だった(Data Engineering Study #11 発表資料)
by
株式会社MonotaRO Tech Team
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
by
Yahoo!デベロッパーネットワーク
pg_trgmと全文検索
by
NTT DATA OSS Professional Services
データ解析入門
by
Takeo Noda
Redmineプラグイン導入・開発入門
by
Minoru Maeda
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
by
Yahoo!デベロッパーネットワーク
CircleCIのinfrastructureを支えるTerraformのCI/CDパイプラインの改善
by
Ito Takayuki
Similar to カスタマーサクセスのためのデータ整備人の活動記録
PDF
【3時間で学ぶ! スモールサクセス型『カスタマージャーニー分析』】 slideshare公開用
by
Akihiko Uchino
PDF
サービス改善はログデータ分析から
by
Kenta Suzuki
PDF
「実践的」カスタマージャーニー分析のすすめ
by
Akihiko Uchino
PDF
オープンセミナー岡山 これから始めるデータ活用
by
syou6162
PDF
130216gis商談における営業プロセスの解説
by
三紀夫 玉置
PDF
アクセス解析サミット2011「データドリブンなチームを目指せ」
by
Makoto Shimizu
PDF
SFA運用の秘訣と定着化のコツセミナー資料
by
NetyearGroup
PDF
20170411 ヒカラボ データを武器に変える
by
Naoto Tamiya
PPTX
サイエンス視点からのデータアーキテクト
by
Masaharu Horino
PDF
事例で学ぶトレジャーデータ 20140612
by
Takahiro Inoue
PDF
20120326 zansa勉強会発表資料 (公開用) 02 04-38
by
tetsuro ito
PDF
データ分析案件の上手な進め方~ディレクターの立場から~
by
Daiki Kato
PDF
旅行業における「データ活用」事例 -航空会社 カストマーサポートの品質向上
by
日本テラデータ株式会社
PDF
サイトサーチアナリティクスとは
by
Makoto Shimizu
PDF
202106 AWS Black Belt Online Seminar 小売現場のデータを素早くビジネス に活用するAWSデータ基盤
by
Amazon Web Services Japan
PDF
190212cs datadriven
by
Taiki Kobayashi
PDF
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
by
Dell TechCenter Japan
PDF
【Azureデータ分析シリーズ】非専門家向け/利用部門主導で始めるデータ分析_ナレッジコミュニケーション公開資料
by
Takaya Nakanishi
PDF
ShibuyaUX - UX and Analytics
by
Makoto Shimizu
PDF
Cm re growth-devio-mtup11-sapporo-004
by
Satoru Ishikawa
【3時間で学ぶ! スモールサクセス型『カスタマージャーニー分析』】 slideshare公開用
by
Akihiko Uchino
サービス改善はログデータ分析から
by
Kenta Suzuki
「実践的」カスタマージャーニー分析のすすめ
by
Akihiko Uchino
オープンセミナー岡山 これから始めるデータ活用
by
syou6162
130216gis商談における営業プロセスの解説
by
三紀夫 玉置
アクセス解析サミット2011「データドリブンなチームを目指せ」
by
Makoto Shimizu
SFA運用の秘訣と定着化のコツセミナー資料
by
NetyearGroup
20170411 ヒカラボ データを武器に変える
by
Naoto Tamiya
サイエンス視点からのデータアーキテクト
by
Masaharu Horino
事例で学ぶトレジャーデータ 20140612
by
Takahiro Inoue
20120326 zansa勉強会発表資料 (公開用) 02 04-38
by
tetsuro ito
データ分析案件の上手な進め方~ディレクターの立場から~
by
Daiki Kato
旅行業における「データ活用」事例 -航空会社 カストマーサポートの品質向上
by
日本テラデータ株式会社
サイトサーチアナリティクスとは
by
Makoto Shimizu
202106 AWS Black Belt Online Seminar 小売現場のデータを素早くビジネス に活用するAWSデータ基盤
by
Amazon Web Services Japan
190212cs datadriven
by
Taiki Kobayashi
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
by
Dell TechCenter Japan
【Azureデータ分析シリーズ】非専門家向け/利用部門主導で始めるデータ分析_ナレッジコミュニケーション公開資料
by
Takaya Nakanishi
ShibuyaUX - UX and Analytics
by
Makoto Shimizu
Cm re growth-devio-mtup11-sapporo-004
by
Satoru Ishikawa
More from syou6162
PDF
自分の目的に合った統計量と そのバラ付きを計算しよう ~NPSを例に~(統計学勉強会)
by
syou6162
PDF
正確な意思決定を阻む 問題・障害との向き合い方
by
syou6162
PDF
Mackerel Drink Up #9 ロール内異常検知の正式化
by
syou6162
PDF
Mackerelのロール内異常検知の設計と運用
by
syou6162
PDF
教師なし学習によるMackerelの異常検知機能について〜設計/運用/評価の観点から〜
by
syou6162
PDF
機械学習を活用したサービスにおける工夫紹介
by
syou6162
PDF
機械学習を使った趣味サービスにおける工夫紹介
by
syou6162
PDF
今日から始める機械学習〜はてなの事例〜
by
syou6162
PDF
機械学習を用いたMackerelの異常検知機能について
by
syou6162
PDF
Mackerel Anomaly Detection at PyCon mini Osaka
by
syou6162
PDF
はてなにおける機械学習の取り組み
by
syou6162
PDF
はてなにおける機械学習の取り組み
by
syou6162
PDF
異常検知ナイト LT登壇資料 はてな id:syou6162
by
syou6162
PDF
Duolingo.pptx
by
syou6162
PDF
今日からできる構造学習(主に構造化パーセプトロンについて)
by
syou6162
PDF
Kernel20110619
by
syou6162
PDF
Optimization In R
by
syou6162
PDF
Syou6162 Dbcls
by
syou6162
PDF
半教師あり学習
by
syou6162
PDF
R User Group 2009 Yoshida
by
syou6162
自分の目的に合った統計量と そのバラ付きを計算しよう ~NPSを例に~(統計学勉強会)
by
syou6162
正確な意思決定を阻む 問題・障害との向き合い方
by
syou6162
Mackerel Drink Up #9 ロール内異常検知の正式化
by
syou6162
Mackerelのロール内異常検知の設計と運用
by
syou6162
教師なし学習によるMackerelの異常検知機能について〜設計/運用/評価の観点から〜
by
syou6162
機械学習を活用したサービスにおける工夫紹介
by
syou6162
機械学習を使った趣味サービスにおける工夫紹介
by
syou6162
今日から始める機械学習〜はてなの事例〜
by
syou6162
機械学習を用いたMackerelの異常検知機能について
by
syou6162
Mackerel Anomaly Detection at PyCon mini Osaka
by
syou6162
はてなにおける機械学習の取り組み
by
syou6162
はてなにおける機械学習の取り組み
by
syou6162
異常検知ナイト LT登壇資料 はてな id:syou6162
by
syou6162
Duolingo.pptx
by
syou6162
今日からできる構造学習(主に構造化パーセプトロンについて)
by
syou6162
Kernel20110619
by
syou6162
Optimization In R
by
syou6162
Syou6162 Dbcls
by
syou6162
半教師あり学習
by
syou6162
R User Group 2009 Yoshida
by
syou6162
カスタマーサクセスのためのデータ整備人の活動記録
1.
カスタマーサクセスのための データ整備人の活動記録 id:syou6162 2020/05/14 第3回 データアーキテクト(データ整備人)を ”前向きに”考える会
登壇資料
2.
自己紹介 ● 吉田 康久 ○
Twitterやはてなidは@syou6162 / id:syou6162 ● 前職: NTTコミュニケーション科学基礎研究所 ○ 自然言語処理や機械学習の研究に従事 ● 株式会社はてな ○ アプリケーションエンジニアとして入社 ○ はてなブックマーク ○ サーバー管理/監視システムMackerel ■ 教師なし学習による異常検知機能開発 ● 2020年2月よりMackerelチームのCRE(Customer Reliability Engineer) ○ 主にデータ基盤整備 / データ分析 2
3.
お願い: フィードバック、お待ちしております!!! 3
4.
https://mackerel.io/ja/ Mackerel: SaaS型の サーバー監視/管理 サービス Agentがサーバーの メトリックを収集、 グラフで可視化 4
5.
アジェンダ ● カスタマーサクセス(CRE)とデータ基盤 /
データ整備人 ● カスタマーサクセスのためのデータ整備人の活動記録 ○ ステップ1: 主要KPI計算のためのデータパイプラインの整備 ○ ステップ2: データ基盤でできること / 出せる価値を感じてもらう ■ データ分析の一歩手前から伴走 ○ ステップ3: 自走できる環境に近づける ■ チームとして継続的にメタデータを整備できるように 5
6.
MackerelチームのCREについて ● CRE: Customer
Reliability Engineer ○ 日本語に直訳すると「顧客信頼性エンジニア」 ○ 2017年に発足 ● ミッション: 顧客に寄り添い、顧客が抱える真の課題にフォーカスし、その課題を技術 を軸として顧客と共に解決を図る ● キーは「カスタマーサクセス」と「エンジニアリング」 ○ ユーザーの課題をエンジニアリングで解決 ■ 例: テクニカルサポート ○ ユーザーの課題をエンジニアリングで発見 ■ 例: データ分析やデータ基盤 6
7.
カスタマーサクセスを視野に入れたプロダクトの価値 参考:カスタマーサクセスとは何か プロダクトの機能 そのもの プロダクトを正しく使いこ なすことで 得られる価値(成功) Mackerelを取り巻く顧 客の体験
8.
カスタマーサクセスを視野に入れたプロダクトの価値 参考:カスタマーサクセスとは何か プロダクトの機能 そのもの プロダクトを正しく使いこ なすことで 得られる価値(成功) Mackerelを取り巻く顧 客の体験 CREチームは、カスタマーの成功にフォーカスしつつ、 プロダクトの価値全体を最大化したい
9.
カスタマーサクセスを視野に入れたプロダクトの価値 CREチームは、カスタマーの成功にフォーカスしつつ、 プロダクトの価値全体を最大化したい プロダクト サクセス カスタマーの目線でプロ ダクトの機能そのものを 価値を得やすいものにし ていく
10.
カスタマーサクセスを視野に入れたプロダクトの価値 CREチームは、カスタマーの成功にフォーカスしつつ、 プロダクトの価値全体を最大化したい プロダクト サクセス ハイタッチ テクニカル サポート カスタマーの目線でプロ ダクトの機能そのものを 価値を得やすいものにし ていく プロダクトを正しく使いこなす、Mackerelを取り巻く 体験をより高める支援をする ハイタッチ:顧客との対面に近い、ハイコストだけど親密 で濃度の高いコミュニケーション テクニカルサポート:オンラインのスピーディーなコミュニ ケーション(エフォートレス)
11.
カスタマーサクセスを視野に入れたプロダクトの価値 CREチームは、カスタマーの成功にフォーカスしつつ、 プロダクトの価値全体を最大化したい プロダクト サクセス ハイタッチ テクニカル サポート データ分析基盤 CREチーム(広くMackerelチームが)がより効果の高いアクション・意思決定がで きるようデータ基盤/ データ分析で下支えする。 私の主担当
12.
最近は活用の幅が少し広がりつつある プロダクトの価値全体を最大化 プロダクト サクセス ハイタッチ テクニカル サポート データ分析基盤 セールス / マーケティング 開発チーム プロダクト オーナー
13.
注意: 私のトークでは話さないこと ● 大規模なチーム、すでにデータ基盤がある程度形になっている状況下でのデータ整 備人 ○
データ整備人の担当領域がすでに明確に決まっているケース ● チームメンバー全員で↓くらいの規模での話をします(Mackerel Day 2の集合写真) 13 データ整備人の定義によると このくらいの割合で働いています データエンジニア = 3 データ整備人 = 4 データアナリスト = 3
14.
アジェンダ ● カスタマーサクセス(CRE)とデータ基盤 /
データ整備人 ● カスタマーサクセスのためのデータ整備人の活動記録 ○ ステップ1: 主要KPI計算のためのデータパイプラインの整備 ○ ステップ2: データ基盤でできること / 出せる価値を感じてもらう ■ データ分析の一歩手前から伴走 ○ ステップ3: 自走できる環境に近づける ■ チームとして継続的にメタデータを整備できるように 14
15.
ステップ1: 主要KPI計算のためのデータパイプラインの整備 ● 当初:
BigQueryもデータウェアハウスもないゼロからのスタート ○ ゼロからって、それって本当? ○ そんなことはない! ● 経営陣向けの主要KPIダッシュボード(スプレッドシート)は存在 ○ これが最初のデータ基盤 15 ● 方針: このダッシュボードから整備しよう! ○ このダッシュボードは絶対見られる ○ 主要KPIを分解しないと、細かい施策の善し悪しや影響度が分からない データレイク RDBからtsvにしたのをシートにコピー データウェアハウス 生データを(何段階かで)集計 データマート グラフ表示用のシート
16.
着手以前の状況 16 スタート地点のRDB のテーブル ゴールの主要KPIダッ シュボード
17.
着手以前の状況 17 スタート地点のRDB のテーブル ゴールの主要KPIダッ シュボード スプレッドシートの依存関係が多段で 発生! 着手以前はそもそもこの依存関係が明 らかではなかった
18.
着手以前の状況 18 Aさん: XXXの分析したかった けど、KPIダッシュボードが壊れ るのは怖い... 詳細分析はまた今度にしよう スタート地点のRDB のテーブル ゴールの主要KPIダッ シュボード Aさん: XXXを追加分析したい から変更を加えよう!! Bさん:
ダッシュボード、壊れ て見れなくなってる?!
19.
● チームメンバーと一緒に既存のKPI算出までのフローを「全部」追った ○ スプレッドシートの依存関係を可視化 ●
今回やるスコープを決める ○ 全部一気にやるのは無理 ○ まずはKPI系から着手 改善: データワークフローの可視化 19 経理系(請求書関係) KPI系 => まずこちらから!
20.
改善: ワークフローの簡素化と(部分的な)自動化 ● スプレッドシートをスクリプトに置き換え ○
依存関係のグラフを見ながら、後段に影響が出ないように ○ 「このデータって今見ていますか?」というのを利用者にヒアリング ■ 利用者: プロデューサー、経営陣、経理部、事務チーム ■ 削れるところは可能な限り削ってシンプルに ● 自動化が理想的ではあるものの、特殊なプランも存在する ○ エンジニアなので自動化は大好き... ○ 完全な自動化に必要以上には拘らない 20
21.
アジェンダ ● カスタマーサクセス(CRE)とデータ基盤 /
データ整備人 ● カスタマーサクセスのためのデータ整備人の活動記録 ○ ステップ1: 主要KPI計算のためのデータパイプラインの整備 ○ ステップ2: データ基盤でできること / 出せる価値を感じてもらう ■ データ分析の一歩手前から伴走 ○ ステップ3: 自走できる環境に近づける ■ チームとして継続的にメタデータを整備できるように 21
22.
ステップ2: データ基盤で出せる価値を感じてもらう ● データ基盤を整備しても、分析によって価値を生まなければ無意味 ○
データ分析の文化醸成はまだまだこれから、という段階 ● データ基盤 / データ分析でどこで価値が出せそうか、分析を進めたい人がどこにい るか、ひたすらヒアリングやミーティング聴講 ○ 主要KPIのデータフロー整備の経験が生きた 22
23.
価値が出る & 分析可能なところはどこか ●
例えばこういうミーティングに参加 ○ 来期以降の施策を考えるリーダー合宿 ○ ペルソナ策定会 ○ カスタマージャーニーマップ作成会 ○ プロダクトエンゲージメントスコア作成会 ○ デザイン相談会 ● ミーティングの前にアジェンダが出ていれば、簡単な分析やダッシュボードを持ち込 む ○ データに興味を持ってもらう! 23 事例: ジャーニーマップ 会話例: この設定でつまずく人が多 いって本当ですか? 条件に合うユー ザーの利用統計見ませんか ?
24.
分析したい人が分析できるスキルを: ペアプロ &
100本ノック ● 「この分析をしたいのであれば、ここに生データがあって、こういう感じで分析ができ ますよ」という簡単な分析を私が示す ○ 私で全部はやらない ○ 深掘り分析をしたい人に伴走する ● SQLのペアプロ ○ 東京と京都をGoogle Meetで画面共有しながら ● 頻出題材については、SQL100本ノックに取り入れる ○ 参考: 営業さんまで、社員全員がSQLを使う 「越境型組織」 ができるまでの3+1 のポイント | リブセンス 24
25.
意思決定の場所に自分から行く 25 会話例: こちらのデータソースを使 うと、より適切に効果を測定できそ うですね 会話例: この施策については定量 データよりも定性データのほうが 適切かも? ペルソナに近いユーザーにインタ ビューしてみませんか
? 会話例: このKPIを計測する データは今はないです。 リリース前にログを仕込んでお きましょう メルカリさんの事例を参考にさせてもらいました 会話例: 最初はこの分析やった ほうがよさそうに思っていたけ ど、優先度低いことが分かりま したね。 今回はこの分析やらないことに しましょう
26.
アジェンダ ● カスタマーサクセス(CRE)とデータ基盤 /
データ整備人 ● カスタマーサクセスのためのデータ整備人の活動記録 ○ ステップ1: 主要KPI計算のためのデータパイプラインの整備 ○ ステップ2: データ基盤でできること / 出せる価値を感じてもらう ■ データ分析の一歩手前から伴走 ○ ステップ3: 自走できる環境に近づける ■ チームとして継続的にメタデータを整備できるように 26
27.
ステップ3: 自走できる環境に近づける ● 初期は分析者が少人数だったので個別回答で何とかなったが、明らかにスケールし ない... ○
解決案: データに対する知識をメタデータに持たせていこう ● BigQueryの{テーブル, カラム}のdescriptionに{テクニカル, ビジネス}メタデータを記 述、Data Catalogでメタデータに対する検索 27 カラムAとB、似てるけどどっちを使うといいですか ? XXXを調べたいけど、どのテーブルを見ればいいですか ? この料金って税込ですか、税抜ですか ? データ整備人(私) 分析したい人
28.
Data Catalogで検索 28 先日GAになりました🎉 マネージドサービスなので、データ整備人が 1人 でも運用可能!
29.
課題: どうやって継続的にメタデータを管理するか ● サービスは生き物であり、メタデータも日々変化 ○
変化に「継続的」に追従したい ○ 管理すべきテーブルやカラム数は普通に多い ● データ整備人の気合と根性だけでは無理 ○ 根性ないので、早々に諦めました... 29
30.
ゆずたそさんからのアドバイス 30 https://twitter.com/yuzutas0/status/12 14772931751841792
31.
メタデータ付与、実践! ● 既存カラムへのコメント付与 ○ 私が付与 ■
元アプリケーションエンジニアでもあるので、低コストで調査可能 ○ 全テーブル / 全カラムにまんべんなく付与するのはコスパが悪いので、発行さ れたSQLの統計量を元に利用回数の多いものから着手 ■ データドリブンに改善 ● 新規のカラムの追加 / 既存カラムの変更 ○ 実装直後で一番知見があるので、開発チームへ依頼 ○ Pull Requestのテンプレートに確認項目を追加 31 typeカラム: 0は仮登録、1は登録済み、2は退会 XXXカラム: 2020年より前はNULL、YYY施策で 集計値が入るようになった。集計条件は〜
32.
開発チームがメタデータを付与するインセンティブ ● 「ALTER TABLE時はメタデータも付与してね!」とお願いするのは簡単 ○
面倒な雑用を押し付けているだけ? ● 開発チームへのメリットを提示 ○ 開発チームに最近入ったメンバーにとっても、DBにメタデータがあることは開発 タスクへのオンボーディングを早める意味でも有用 ○ エンジニアへのデータ調査依頼の削減 ○ SREなど普段アプリケーションのコードを触らない人もいるので、そういった人た ちに向けても重要な情報を提供できる ● データ整備人だけでなく、「チーム」でメタデータを育てていく環境を作ることを意識 32
33.
RDBからBigQueryへのメタデータの組み込みフロー 33 開発チーム + 私で コメントDDLを付与 メタデータを 自由に検索 ●
コメントDDLはtblsを使うと便利 ○ スキーマ情報をjsonで取り扱える ● tblsで抽出した情報をjqで加工、bqコマンドでスキーマを流し込めば完成! ○ 詳細はこちら ○ コメントの付与率をMackerelで可視化することでモチベーション維持 付与率を可視化 BigQueryだけで何とか するのは大変しんどい !!
34.
まとめ 34 ● カスタマーサクセス(CRE)とデータ基盤 /
データ整備人 ● カスタマーサクセスのためのデータ整備人の活動記録 ○ ステップ1: 主要KPI計算のためのデータパイプラインの整備 ○ ステップ2: データ基盤でできること / 出せる価値を感じてもらう ■ データ分析の一歩手前から伴走 ○ ステップ3: 自走できる環境に近づける ■ チームとして継続的にメタデータを整備できるように 私が思うデータ整備人の役割: データの活用者(意思決定者など)を助けたり、データを取り巻く環境がどうある べきかを定義し、データの生成者(=エンジニアなど)と協力して、あるべき姿へ 近づけていくこと
35.
参考 ● データ基盤関係 ○ データマネジメント知識体系ガイド ○
データマネジメントが30分でわかる本 ○ データ基盤のメタデータを継続的に管理できる仕組みを作る - Hatena Developer Blog ○ データ基盤の3分類と進化的データモデリング ● カスタマーサクセス関係 ○ セールスエンジニア 改め Customer Reliability Engineer (CRE) になりました - Hatena Developer Blog ○ カスタマーサクセスとは何か――日本企業にこそ必要な「これからの顧客との 付き合い方」 35
Download