2020年2月にOracleから発表された「Oracle Cloud Data Science Platform」。
「Oracle Cloud Data Science Platform」は機械学習モデルの構築やデータ分析を中心としたクラウドサービスのことであり、下記の7つのサービスから成り立っています。
- Oracle Cloud Infrastructure Data Science
- Oracle Autonomous Database
- Oracle Cloud Infrastructure Data Catalog
- Oracle Big Data Service
- Oracle Cloud SQL
- Oracle Cloud Infrastructure Data Flow
- Oracle Cloud Infrastructure Virtual Machines for Data Science
本記事では「Oracle Cloud Data Science Platform」の各サービスについてご紹介していきます。
Oracle Cloud Infrastructure Data Science
「Oracle Cloud Infrastructure Data Science」は「Oracle Cloud Data Science Platform」の中心となるサービスです。
このサービスでは「Oracle Cloud」上で、PythonやTensorFlow、Keras、Jupyterなどのオープンソース・ツールやライブラリを使って新しい機械学習モデルを構築、トレーニング、管理する事が出来ます。
Oracle Autonomous Database
「Oracle Autonomous Database」はワークロードの種類に対応する「Autonomous Data Warehouse」と「Autonomous Transaction Processing」の2種類の既存サービスから構成されています。
従来DBAが実行していたデータベースのチューニングやセキュリティ、バックアップ、アップデータ等の管理タスクは「Oracle Autonomous Database」によって自動化することが可能になります。
完全自律型データベースである「Oracle Autonomous Database」に新たに「Python」と「Auto ML」がサポートされました。
今後は「Oracle Cloud Infrastructure Data Science」と統合される予定となっており、オープンソースとスケーラブルなデータベース内アルゴリズムの両方を使用してモデルを開発できるようになります。
また、データ処理の際のデータ移動を最小限にする事でセキュリティを維持しながらモデル化までの時間を短縮することが可能となりました。
Oracle Cloud Infrastructure Data Catalog
「Oracle Cloud Infrastructure Data Catalog」はその名の通り、データカタログのことです。
OracleCloud上に貯めたデータ資産の管理や検索を行う事が出来るメタデータ管理サービスとなっています。
「Oracle Cloud Infrastructure Data Catalog」はすべての「Oracle Cloud Infrastructure」サービスに追加料金なしで含まれています。
Oracle Big Data Service
「Oracle Big Data Service」は「Oracle Cloud Data Science Platform」の基盤となるサービスです。
ビッグデータの収集・分析等データ活用のためのHadoopデータレイク環境を提供しています。
エンドツーエンドのセキュリティ、高いパフォーマンス、さらに管理とアップグレードの容易さを備えています。
Oracle Cloud SQL
「Oracle Cloud SQL」のサービスによってApache Hadoopの分散処理システムであるHDFSやHadoop上で稼動するDBMSのHive、そのほかKafka、NoSQL、Object StorageにおいてもデータをSQLクエリで処理することが可能となります。
Oracle Cloud Infrastructure Data Flow
「Oracle Cloud Infrastructure Data Flow」はインフラストラクチャの導入や管理をせずにApache Sparkアプリケーションを実行できるようになるフルマネージド・ビッグデータ・サービスのことです。
「Oracle Cloud Infrastructure Data Flow」により、ビッグデータおよびAIアプリケーションをより迅速に提供できるようになります。
また、「Oracle Cloud Infrastructure Data Flow」ではすべてのジョブを追跡することが可能で、高コストなタスクの特定や問題のトラブルシューティングをより合理的に行うことができます。
Oracle Cloud Infrastructure Virtual Machines for Data Science
「Oracle Cloud Infrastructure Virtual Machines for Data Science」はディープラーニング用にモデルを事前構成したデータサイエンスの為の仮想マシンサービスです。
自然言語処理や画像認識、不正検出など様々なユースケースに対応することが可能となっています。
最後に
データがより重要視され、より膨大になっていく昨今、それらを処理・分析していく機械学習やデータサイエンスの価値はより一層高まっていく事と思います。
そんな中でこの機械学習に特化した「Oracle Cloud Data Science Platform」は様々な分野で活用されていくことでしょう。
今後は「Oracle Cloud Data Science Platform」を実際に利用していくことも視野に入れていきたいと思っています。
- カテゴリ:
- エンジニアリング