企業において、ビッグデータ活用の需要はますます高まっています。他の企業に遅れを取らないためにも、データ基盤の整備におけるアーキテクチャについての知識と、その活用が必要です。
本記事では、データ基盤におけるアーキテクチャの意味と種類、それぞれの活用方法について解説していきます。
データ基盤におけるアーキテクチャとは?
アーキテクチャは、建設業界では、建築物の構造、設計方法や工法を含めた全体の様式を指す言葉として使われています。一方、IT業界では、IBMが最初の汎用コンピュータSystem/360の設計思想や設計方式を表現するのに「アーキテクチャ」という語を用いたのが始まりで、その後、幅広く、かつ標準的な言葉として使用されるようになりました。
現在では、ハードウェアだけではなく、OSやミドルウェア、アプリケーション、サービスなど、情報システムの種類も構造も高度に複雑化してきており、それぞれの分野でアーキテクチャが既定化されています。
企業がシステムの採用を検討する際は、ハード、ソフトという特定の要素だけを決めるという抽象的な視点ではなく、要素間の関係を明確に定義し、設計方針を決めていく必要があります。それに伴い、アーキテクチャ選択の重要性が注目されています。
データ基盤の主なアーキテクチャ種類
高度なデータ分析等を行うシステムを構築する際、データ基盤のアーキテクチャには様々な種類があります。主に考慮すべき分野でのアーキテクチャについて以下で解説していきます。
ソフトウェアアーキテクチャ
ソフトウェアアーキテクチャとは、ソフトウェアを構築するための一つひとつの機能を製品全体としてバランスよく整合性を持って構築していく設計思想のことです。
例えば「MVC」と「MVVM」がありますが、それぞれModel・View・Controller・ViewModelの頭文字を取ったものです。概要としては、ユーザーからのリクエストをControllerが受け取って、Modelへ処理実行を指示、最後にViewに反映してユーザーに返す、といった仕組みを構築するためのアーキテクチャです。
MVVMの場合、ViewとModelは連動し、ユーザーにとっては処理速度が向上しているように見えますが、同時にシステムへの負荷もかかるため、必要に応じた検討が必要です。
システムアーキテクチャ
システムアーキテクチャは、システム全体の要件を整理し、効率よく実現させていくため、必要な機能などを設計していく枠組みを指します。多くの要素を組み合わせてシステム構築をしていく上で、開発やテストだけでなく、運用、保守までを含めて総合的に設計を行います。
要件定義を念入りに行うことが重要で、論理的かつ物理的な要件をとりまとめ、全体構造を決定していきます。また、複数のシステムが並行稼働することも多く、全体最適を常に意識する必要があります。
エンタープライズアーキテクチャ
エンタープライズアーキテクチャは、企業におけるIT運用の全体的なデザインと方針を表す言葉です。とくに大企業や政府機関で多く採用された構築思想で、組織や部署をまたがるシステム間のデータ連携、業務手順の見直し、統一されたプラットフォームの選定などによって、経営戦略に沿った全体最適を目標としています。
AIやクラウドサービスが普及してきた近年では、システム移行の際にどう設計していくかがあらためて問われています。
マイクロアーキテクチャ
マイクロアーキテクチャは、CPUなどのハードウェアの回路設計、構造などを表しています。CPUにはそのマイクロアーキテクチャの名称が使われているものもあり、例えばIntelの「Core」「Sunny Cove」などがそれに当たります。設計によってCPUの性能は異なるため、例えばIntelのCPUブランド名である「Core i7」とあわせ、マイクロアーキテクチャ名である「Haswell」などが示されることもあります。
ビッグデータ活用のためのアーキテクチャ
現代のIT活用において必須ともいえるビッグデータの分析と活用ですが、これらの目的のために注目されているアーキテクチャがいくつか存在しています。以下ではそれぞれのアーキテクチャについて解説していきます。
データアーキテクチャ
データアーキテクチャとは、企業によるビッグデータ活用の方法を標準化するために用いられるプロセスであり、構築方法です。データ収集と分析に対する要求を明確化し、その要求にあったデータ構造を設計します。
また、蓄積されたデータをどのように統合し活用していくか、経営戦略に合った形態で検討することが求められます。このように、データ資産を統制し、データ活用への投資を行っていく仕組みそのものを表しています。
ラムダアーキテクチャ
企業内の大容量データを分析して活用していくためには、スピーディーな処理速度が必須です。ラムダアーキテクチャとは、膨大なビッグデータを処理するためのアプローチで、全体を3つのレイヤー構造に分け、機能を分担して高速処理を実現する構造を指しています。
「バッチレイヤー」「サービスレイヤー」では、定期的な集計やバッチ処理を実行し、クライアントに提供します。「スピードレイヤー」ではWeb上などでリアルタイムに発生するデータを変更、保存し続けるといった処理をします。
サーバレスアーキテクチャ
クラウド化が進む今日では、サーバレスアーキテクチャが注目され、多くの企業で採用されています。これまでのシステム構築では、インフラ整備は必須で、システム開発費用の他に、サーバやストレージ、ネットワーク機器に関する予算も上乗せする必要がありました。
運用時の障害対応や保守においても同様でしたが、サーバレスを採用することで、コスト削減につながり、無駄な時間を費やす必要がなくなります。このため、データ基盤のシステム導入に対するハードルは低くなってきているといえます。
DWHとHadoop
ビッグデータ分析に欠かせないアーキテクチャとして、「DWH」と「Hadoop」の2種類があります。従来のDWH(データウェアハウス)のアーキテクチャでは、変換され整理されたデータを蓄積していきます。
これに対し、データレイクのオープンソースであるHadoopでは、収集した生データを、非構造化のままリアルタイムで蓄積し、分析する段階で都度データを参照して定義していきます。それぞれにメリットがあり、組み合わせて利用することも可能となっています。
クラウドサービスを利用する
インフラ運用の煩雑さやコストの削減を実現し、セキュリティを担保しながら拡張性も求める場合は、クラウドサービスの利用を検討することが多くなるでしょう。災害時の対応などを含めたBCPの観点からも推奨されます。
データベースといえばOracle Databaseが最もメジャーですが、オラクル社もクラウドサービスによるデータ基盤を提供しています。大企業だけでなく中小企業にも採用が可能な価格帯で、セキュリティの担保はもちろん、拡張性と可用性の高いサービスです。
システムエグゼでは、導入プランの提案からデータ分析、運用サポートまでOracle Cloudをワンストップで提供しています。
アプライアンスを利用する
最近では、ハードウェアメーカーが、サーバ製品のOSに加え、ミドルウェアまで導入して出荷するアプライアンス製品も出てきており、これを活用したシステム導入を行う事例もあります。ハードウェアは専用のものを使う必要があり、自由度は低くなりますが、ハードとソフトの両方においてメーカーでの保守対応が可能になるほか、切り分けなどが容易で運用しやすいというメリットがあります。
まとめ
本記事では、情報システムにおけるアーキテクチャとは構成や設計を意味するものであり、いろいろな場面で活用されていることを解説してきました。現在はビッグデータの分析と活用がどの企業からも注目され、管理や運営を行う上でクラウドプラットフォームを取り入れる企業が増えてきています。
Oracle Cloudの導入により、客観的なデータ分析が可能になり、ビジネスにおける多くの課題が解決できます。事例を確認し、自社での導入を検討してみてはいかがでしょうか。
- カテゴリ:
- データ活用
- キーワード:
- データ基盤