[go: up one dir, main page]
More Web Proxy on the site http://driver.im/
データマネジメント データマネジメント記事一覧へ

[Sponsored]

[データマネジメント2024]

データドリブン経営の成否はデータの信頼性に左右される

2024年6月3日(月)

生成AIや従来型AIの性能は、使用するデータの品質に依存する。多くの組織が生成AIへ投資しているが、自社データがこれを支える体制を十分に備えている例は少ない。ビジネスの意思決定を支援するためには、安全に利用可能なデータ基盤が必要であり、生成AIを活用するにはデータマネジメントの進化や変革が不可欠である。2024年3月8日に開催された「データマネジメント2024」(主催:日本データマネジメント・コンソーシアム〈JDMC〉、インプレス)に、クリックテック・ジャパン技術本部 シニア・ソリューション・アーキテクトの阿部智師氏が登壇し、生成AI時代に求められるデータマネジメントについて解説した。また、日鉄ソリューションズ デジタルソリューション&コンサルティング本部 プロフェッショナルの湯浅遇氏が実践事例を紹介した。
提供:クリックテック・ジャパン株式会社、日鉄ソリューションズ株式会社

期待が高いAIを、企業活動に成功裡に取り込むために

 生成AIはデータ量が多いほど精度が高くなるため、社内のさまざまなデータをできるだけかき集めようという動きが活発だ。そのような風潮に異を唱えるのがクリックテック・ジャパン 技術本部シニア・ソリューション・アーキテクトの阿部智師氏だ。大規模言語モデル(LLM)や伝統的な機械学習(AutoML)にも共通していえることだが、「データの質が低く不正確である、または鮮度が悪い場合、AIのアウトプットも不正確で偏りが生じます。多くの人が見落としがちですが、これは非常に重要な点です」と指摘した。

クリックテック・ジャパン 技術本部シニア・ソリューション・アーキテクトの阿部智師氏

 AI活用においては、データ基盤も重要だ。基盤には、データがサイロ化されていても効率的に取り込める、データを継続的に更新し鮮度を高く保てる、生成AIに適した高品質のデータを確保できるといった機能が求められる。クリックテックのデータ基盤はこれらの機能を備えており、基盤を導入した顧客からは、ビジネスのスピードとデータへの信頼性が大幅に向上したとの声が寄せられている。

 現在、AIの導入に対する企業の意欲は旺盛で、クリックテックはこうした企業向けに「Qlik Staige」を用意している。企業がAIを導入する際には、信頼できるデータとAIを適切に結びつける仕組みが必要であり、「Qlik Staigeはこうした仕組みを全面的に支援するための、体系化された製品/サービス群となっています」(阿部氏)としている。

データマネジメントこそAI成功の鍵

 ある調査によると、企業で生成されるデータ量は年間で42%の増加率を示し、リアルタイムデータの必要性も高まっている。さらに現在、世界のデータの80%から90%は、処理に時間がかかる非構造化データと言われており、データ精度や品質の低下が指摘されている。全体として、データに対する信頼が揺らいでいる状況である。

 データの様相が大きく変わる中で、阿部氏はデータマネジメントの重要なキーとして「完全性」「柔軟性」「信頼性」の3つを挙げた(図1)。完全性は、データの整合性が高く、高品質であることを意味する。柔軟性については、データが既存のワークフレームや必要なデータワークフレーム、さらには新しいアーキテクチャに容易に適合できる必要があることを指し、これがなければデータの価値は半減する。信頼性は、データのコンプライアンスやセキュリティの確保を意味し、信頼性のニーズは近年特に高い。

図1:クリックテックが考えるデータマネジメントの3つのキー(出典:クリックテック・ジャパン)
拡大画像表示

 阿部氏は、これら3つのキーを満たす製品として、同社のデータ統合製品である「Talend」を紹介し、「Talendを既存の弊社製品と併用すれば、データの収集、加工、品質の維持を一貫して行うデータパイプラインの提供が可能になります」と述べた。

 Talendには、データマネジメントを効果的に実施できる多様な機能が備わっており、阿部氏は、その代表的な5つのユースケースを紹介した(図2)。

図2:データマネジメントにTalendが活用される代表的な5つのユースケース(出典:クリックテック・ジャパン)
拡大画像表示

 まず「データ統合とデータレイク構築」だ。Talendは、Microsoft AzureやGoogle Cloudといった様々なデータソースからのデータ収集をサポートしており、多種多様なデータソースに接続可能なコネクタも有しているので、データレイクを容易に作成できる。

 次に「APIシステム連携」。情報を様々なアプリケーションシステムから容易に呼び出せる。RESTやSOAPなどの標準的なAPIを有しており、データマネジメントのジョブを様々なシステムと連携できる。

 3つ目は「マスターデータ管理」。細分化され分散したデータを統合して、高品質なデータベースを構築できれば問題なく実行できる。システムだけでは対応できない場合は、人が介入できる「スチュワードシップ」機能を利用すれば、人の目を加えてデータクレンジングや加工を行える。

 4つ目は「データプレパレーション」。これによってデータの異常や欠損を把握し、自動化して柔軟にデータを加工し、必要なデータセットを作成する機能で実践できる。

 5つ目の「データガバナンス/データカタログ」では、システムの定義に従ってデータを容易にカタログ化できる。

データドリブン経営を目指しTalendを導入

 続いて、日鉄ソリューションズ デジタルソリューション&コンサルティング本部 プロフェッショナルの湯浅遇氏が登壇し、2021年の日本製鉄の中期経営計画で制定された「データドリブン経営」を目指す戦略の一環としてTalendを導入した事例を紹介した。

日鉄ソリューションズ デジタルソリューション&コンサルティング本部 プロフェッショナルの湯浅遇氏

 この取り組みの背景には「社員全員がデータ資産に接続し、利活用できる環境を目指したい」という日本製鉄の問題意識があり、こうした問題意識に至った理由として、日本製鉄の成り立ちが大きく関係しているという。

 日本製鉄は、鉄鋼メーカー4社が合併して現在の形になっており、国内の製鉄所は6つの地域で運営されている。湯浅氏は「6つの地域の製鉄所の中に複数の製鉄工場があり、それぞれに独自の設備とシステムが存在しているのです。こうした多層構造がシステム改変の大きなハードルになりました」と述べた。

 製鉄所は年中無休で24時間稼働しており、現場レベルでのデータ蓄積と活用は進んでいた。しかしデータとシステムは個々の製鉄所内に閉じており、所内で独自の形で運用され、データ定義の管理も個別に行われていた。その結果、日本製鉄全体としてデータ連携を行うのは容易ではなく、データの定義や意味を理解するには、各システムや現場に確認しなければならなかった。

 担当者が変わるとノウハウの引き継ぎが困難で、本社の意思決定のために現場データを利用する場合も多くの手間をかけてサマリーする必要があり、時間と工数のロスにつながっていた。「これらの課題を解消し意思決定を迅速化することが必須でした」(湯浅氏)

日本製鉄をつなぐ統合データプラットフォーム「NS-Lib」

 日本製鉄では、データドリブン経営に向けたシステムとデータの刷新に関して、いろいろな検討が重ねられたが、最終的には日本製鉄を総合的につなぐ統合データプラットフォームの構築が必要不可欠という結論に至った。阿部氏は、「このプラットフォームの目標は、権限を持つ人々がデータサーバーを介して自由にアクセスできる環境を整備し、データの意味を理解して正確に活用できる環境を作ることです」と説明した。

 「NS-Lib」と命名されたこのデータプラットフォームは、日鉄ソリューションズの「DATAOPTERYX(データオプテリクス)」をベースに構築されたものだ(図3)。DATAOPTERYXは、データファブリック、データカタログ、データプレパレーション、データインベントリーとして「Talend」を、データレイクとして「Snowflake」を採用した統合データマネジメントプラットフォーム。刷新に向けた工程は始まったばかりだが、データの定義登録や管理が、システム担当者だけでなく現場側でも行えるようになるなどの成果を上げており、現在、具体的な目標としてデータ収集時間の80%削減を掲げている。

図3:統合データマネジメントプラットフォーム「DATAOPTERYX(データオプテリクス)」の概念図(出典:日鉄ソリューションズ)
拡大画像表示

 改善の前後でデータの流れは大きく変わった。以前はデータが必要になると、各所からExcelデータを集めるという作業が発生していたが、プラットフォーム構築後は、重要なデータはすべてDATAOPTERYXに集約され、データレイクに統合して集約させ、データカタログで容易に確認できるようになった。これにより、全社のデータガバナンスが強化され、データの散在も防げるようになった(図4)。

図4:DATAOPTERYXを活用した際のデータの流れ(出典:日鉄ソリューションズ)
拡大画像表示

 データに関する知見や活用が個人に依存していたため、データの仕様が不明瞭で品質が一定しないという課題には、データマネジメント業務をフロー化し、仕組みを構築することで対応した。仕組みを構築したことで、データの定義や登録を現場で行えるようになり、スムーズにカタログ化できるようになった。データの属性や収集条件、品質状態などをカタログから確認することで、システム間でのデータ変換作業が容易になった。

 阿部氏は、データマネジメントプラットフォームやツールを業務に適切に組み込み、データ品質の向上を図ることができたと述べ、「これらの実績を基に、今後もデータドリブン経営を支援していきたい」との考えを示した。


●お問い合わせ先

クリックテック・ジャパン株式会社
URL:https://www.talend.com/jp/

日鉄ソリューションズ株式会社
URL:https://www.nssol.nipponsteel.com/


※ NS(ロゴ)、NS Solutions、DATAOPTERYXは、日鉄ソリューションズ株式会社の登録商標です。
※ その他本文記載の会社名及び製品名は、それぞれ各社の商標または登録商標です。

バックナンバー
データマネジメント2024一覧へ
関連記事

トピックス

[Sponsored]

データドリブン経営の成否はデータの信頼性に左右される生成AIや従来型AIの性能は、使用するデータの品質に依存する。多くの組織が生成AIへ投資しているが、自社データがこれを支える体制を十分に備えている例は少ない。ビジネスの意思決定を支援するためには、安全に利用可能なデータ基盤が必要であり、生成AIを活用するにはデータマネジメントの進化や変革が不可欠である。2024年3月8日に開催された「データマネジメント2024」(主催:日本データマネジメント・コンソーシアム〈JDMC〉、インプレス)に、クリックテック・ジャパン技術本部 シニア・ソリューション・アーキテクトの阿部智師氏が登壇し、生成AI時代に求められるデータマネジメントについて解説した。また、日鉄ソリューションズ デジタルソリューション&コンサルティング本部 プロフェッショナルの湯浅遇氏が実践事例を紹介した。
提供:クリックテック・ジャパン株式会社、日鉄ソリューションズ株式会社

PAGE TOP