# データマネジメントが30分でわかる本 ## Metadata * Author: [ゆずたそ、はせりょ、株式会社風音屋](https://www.amazon.comundefined) * ASIN: B085W4YSZJ * Reference: https://www.amazon.com/dp/B085W4YSZJ * [Kindle link](kindle://book?action=open&asin=B085W4YSZJ) ## Highlights データマネジメントとは、データを資産と捉え、体系的に価値を引き出すための手法です。 資産なので置き場所を決めます 資産なので盗まれたり、なくなったりしないようにします 資産がどこからきて、どこへ行くのか把握します 資産の価値が減らないように気を配ります 資産を監督する人や、そのルールを決めます — location: [15](kindle://book?action=open&asin=B085W4YSZJ&location=15) ^ref-44890 --- DMBOKが対象とする「データ」とは、データベースに保存された構造化データだけでなく、社内文書や手書きメモなどを含めた「あらゆる情報資産」を指しています。 — location: [40](kindle://book?action=open&asin=B085W4YSZJ&location=40) ^ref-36038 --- データの種類と活用場面が増えると、データとビジネスの繋がりは見えにくくなります。データアーキテクチャは、両者の繋がりを書き出した俯瞰図です。 — location: [86](kindle://book?action=open&asin=B085W4YSZJ&location=86) ^ref-47888 --- あるデータがどんなビジネスのどんな業務に貢献しているのか、 あるビジネス・業務がどんなデータに依存しているのか — location: [89](kindle://book?action=open&asin=B085W4YSZJ&location=89) ^ref-50240 --- 危険なのは、データとビジネスの紐付けが可視化されていないことです。 — location: [93](kindle://book?action=open&asin=B085W4YSZJ&location=93) ^ref-27272 --- データが発生してからビジネスに活用されるまでの大局的な図(アーキテクチャ図)が作られていること データの種別(検索履歴、顧客登録情報、etc..)ごとに図が作られていること アーキテクチャ図がメタデータとして保存されていること アーキテクチャを改善する計画が立っていること — location: [99](kindle://book?action=open&asin=B085W4YSZJ&location=99) ^ref-4524 --- どこからデータを取って どこに保存して どのビジネスに使っているか — location: [107](kindle://book?action=open&asin=B085W4YSZJ&location=107) ^ref-10676 --- アーキテクチャの改善にかかるコストと、前述のビジネス価値を照らしあわせて、どこから「あるべきデータの流れ」を作っていくかを決めます。 — location: [118](kindle://book?action=open&asin=B085W4YSZJ&location=118) ^ref-45229 --- 素早い実験のためのSoE(System of Engagement:体験重視)なのか、 — location: [230](kindle://book?action=open&asin=B085W4YSZJ&location=230) ^ref-26131 --- 経理処理といったSoR(System of Record:記録重視)なのか、データ活用の目的に応じた技術選定が求められるのではないでしょうか。 — location: [230](kindle://book?action=open&asin=B085W4YSZJ&location=230) ^ref-3183 --- 必要なフォーマットとタイミングでデータを安全に提供する 共通のモデルとインターフェイスを開発することで、統合にかかるコストと複雑さを削減する 重要なイベントを検知できるようにアラートとアクションを定義する — location: [250](kindle://book?action=open&asin=B085W4YSZJ&location=250) ^ref-14870 --- DMBOKではデータモデルの粒度を三段階に分けています。 概念モデル 論理モデル 物理モデル — location: [323](kindle://book?action=open&asin=B085W4YSZJ&location=323) ^ref-7854 --- これが「モデルストーミング」です。書籍『Agile DataWarehouse Design』で紹介されている手法で、「モデル設計」と「ブレインストーミング」を合わせた造語です。 — location: [388](kindle://book?action=open&asin=B085W4YSZJ&location=388) ^ref-3633 --- ビジネスの変化が加速している昨今において、分析対象やデータモデルも変化の加速が求められています。市場環境に適応するために、ぜひデータモデリングにも、アジャイルな動きを取り入れてはいかがでしょうか。 — location: [420](kindle://book?action=open&asin=B085W4YSZJ&location=420) ^ref-40859 --- 非構造化データを積極的に管理することで、 法令及び規制の遵守 正当な業務記録の処分 対訴訟のための積極的な準備 機密情報に対するセキュリティ 電子メールなど、リスクのある領域の管理 — location: [493](kindle://book?action=open&asin=B085W4YSZJ&location=493) ^ref-49213 --- 利用者の期待と要求をどの程度満たしているか。データ品質が高い・低いという言葉は、その度合いを表しています。 — location: [618](kindle://book?action=open&asin=B085W4YSZJ&location=618) ^ref-34388 --- データが低品質だとどうなるでしょうか。様々なリスクが生じます。 誤集計 誤集計に伴う業務ミス(メールの誤配信や取引先への誤請求) 課題解決力の低下 — location: [623](kindle://book?action=open&asin=B085W4YSZJ&location=623) ^ref-9516 --- 業務上の意思決定不備がもたらす損失 事業機会・収益の損失 業務統合の遅延 不正行為の増加 信用力の低下による事業の損失 — location: [625](kindle://book?action=open&asin=B085W4YSZJ&location=625) ^ref-20614 --- まずは理想のデータを定義します。高品質なデータとは、利用者の目的に合致するデータです。つまり、まずはニーズを知る必要があります。 — location: [631](kindle://book?action=open&asin=B085W4YSZJ&location=631) ^ref-2641 --- データ品質の評価軸は以下に分類されます。 意図に合う内容・形式のデータか(正確性、妥当性、有効性) 欠損のないデータか(完全性) データ間の関係に矛盾がないか(一貫性、整合性、一意性) 最新のデータか(適時性) 適切な参照権限が付与されたデータか — location: [636](kindle://book?action=open&asin=B085W4YSZJ&location=636) ^ref-24208 --- 「データ管理ができている状態」とは「安心・安全・便利」に「データを利用できる状態」です。言い換えると「データ品質の期待水準を満たしている状態」のことです。筆者はサービスレベルこそがデータマネジメントの寄る辺だと考えています。 — location: [679](kindle://book?action=open&asin=B085W4YSZJ&location=679) ^ref-40663 --- データドリブンに過剰品質を抑制する — location: [682](kindle://book?action=open&asin=B085W4YSZJ&location=682) ^ref-11988 --- 「皆がデータを使いやすい状態を実現する」とは、要するに「デザイン」です。「皆にデータを使ってもらう」とは、要するに「マーケティング」です。デザインやマーケティングの業務と同じように、地道に仮説を立て、ターゲットを絞って、改善していきましょう。 — location: [816](kindle://book?action=open&asin=B085W4YSZJ&location=816) ^ref-17312 --- データの説明や調査した性質を、メタデータとして保存することで、 データ生成のコンテクストを把握する データ品質の測定を可能にする 冗長なデータとプロセスを特定する — location: [863](kindle://book?action=open&asin=B085W4YSZJ&location=863) ^ref-23231 --- データ分析と調査に要する時間を短縮する 利用者とエンジニアのコミュニケーションを改善する オンボーディングコストを低減する サービスレベルの無視やデータの誤まった使い方を防ぐ 法令遵守を支援する — location: [865](kindle://book?action=open&asin=B085W4YSZJ&location=865) ^ref-7780 --- ビジネス:内容と状態に重点を置きます。主な関心事項は、入力規則と測定結果です。具体的には、出所、有効値制約、構造、他のデータとの関係性、といった情報です。 テクニカル:技術的詳細やシステムに重点を置きます。主な関心事項は、テーブル名やカラム名、そしてアクセス権です。具体的には、スキーマ定義、といった情報です。 オペレーショナル:処理とアクセスの詳細に重点を置きます。主な関心事項は、最終更新時間とエラーログです。具体的には、アクセス頻度と実行時間、といった情報です。 — location: [875](kindle://book?action=open&asin=B085W4YSZJ&location=875) ^ref-1380 --- データエンジニアリングの人事評価 — location: [1060](kindle://book?action=open&asin=B085W4YSZJ&location=1060) ^ref-10185 ---