maato’s blog

興味のあることや、これはと思ったことをゆるく情報発信していきます。本ブログで述べられている意見は、私自身の意見であり、所属する団体、企業の見解を反映したものではありません。

Gartner 2019年のデータ/アナリティクス技術の10大トレンドをまとめた

先日、Gartnerが「Gartner Identifies Top 10 Data and Analytics Technology Trends for 2019」を発表しました。日本語での記事も出ています。ITに関係する人ならば、当然キャッチアップしとくべき内容なのですが、日本語訳をみてもいまいちよくわかりません。どうぜみんなググるんでしょ、てことで、備忘録としてまとめておきます。(というかこれをまとめて、今度話す必要性が出てきたのでまとめておく)

 

元記事

www.gartner.com日本語記事

www.atmarkit.co.jp注)訳した瞬間に「意思」が入るので、ちゃんと原文は読んでみようね。
注)下記も間違っているところあったらぜひご指摘ください。

Trend No. 1: Augmented Analytics:拡張アナリティックス

いきなりよくわかりませんが、NTTデータのまとめがわかりやすいです。

www.nttdata.comデータ分析のための、「データ前処理」「データ探索や発見」「統計解析/機械学習」のサイクルを”なるべく人手を介さずに”実施することだそうです。全て自動化まではいかないにせよ、なるべく人間を助けるという意味で”拡張”だとのこと。

具現化するツール例として、Trifacta(Data Preparation)、Tableau (Data Discovery)、DataRobot(Data Science and Machine Learning)を挙げています。といわれるとわかりやすいかも。

ラクルだと、Data Visualization CloudのData Prep、Explain、ビルドイン機械学習機能あたりかなあ。

「めんどくさいことをよろしくやってくれる」「データサイエンティストがいなくても高度なデータ予測、分析をやりたい」という今まさにニーズのあるところだと思います。

Trend No. 2: Augmented Data Management:拡張データ管理

AIやMLを使って、データ品質管理、メタデータ管理、マスターデータ管理、データ統合、データベース管理システム(DBMS)を自動構成、自動チューニングすることです。Oracle のAutonomous Databaseがまさにここですね。また特にAIやMLにデータを食わせるために、メタデータの自動作成も重要な要素といっています。

2022年までに自動化は進み、現在の45%の工数が削減されるそうです。

Trend No. 3: Continuous Intelligence:継続的インテリジェンス

うーーーん、これよくわかりません。。が、下記Forbesの定義を見ると、Data Lakeにたまっっている様々なデータを、業務部門のメンバーが、必要に応じてデータを組み合わせ、AIを駆使して分析ができることをいっているようです。特に業務部門の人が、様々なデータを自由に組み合わせできるところと、AIなどを使って簡単に分析できるところ、がポイントのようです。誰か間違ってたら教えて。。

www.forbes.com

Trend No. 4: Explainable AI:説明可能なAI

ブラックボックス化されたAIではなく、なぜそのモデルが最適なのか、AIモデルの説明を可能にし、さらに「文章で説明できるようになる」ことがポイント。日本でもAIの説明責任を求める法律ができそうなので、ここらへんは今後必要になってくるでしょう。

www.nikkei.com

Trend No. 5: Graph:グラフデータベース

おー我らがグラフデータベース!!絶対にこのニーズはこれからくると思うし、特に下記にもある、ブロックチェーンのような非中央集権、分散社会においてはこれからもっとニーズは高まると思っています!

詳細は下記Slideshare

www.slideshare.netさらに、3月にはまさにそんなみなさんにとっておきのイベントもあるのでぜひ!OracleのグラフデータベースであるPGXと、Neo4jが同時にワークショップするという、グラフデータベース技術者にはたまらないセミナーです。

oracle-code-tokyo-dev.connpass.com

Trend No. 6: Data Fabric:データファブリック

データが、ストレージ、Hadoop、NoSQL、RDBMSのどこにあろうと、一貫したデータアクセスができるような基盤のことのようです。Oracle Big Data SQLのようなSQLでどこにデータあろうが全部クエリできちゃうよ、てことのようです。

Trend No. 7: NLP/ Conversational Analytics:自然言語処理/会話アナリティクス

検索、文章、音声でデータ分析ができるようになるということです。Bot、Chat、音声デバイスなどUIが多様化する中で、なるべくアナリティックスのハードルを下げるってことなんでしょう。

ここらへんもオラクルだとBI askや、モバイルアプリのDay by Dayなんて機能があります。

Trend No. 8: Commercial AI and ML:商用AIおよびML

OSSを使っているんだけど、それをエンプラで使えるようにしたAI/ML基盤のことをいっていると思います。OSSのバージョンアップ、サポートを商用レベルで提供し、それら環境を事前定義するだけでなく、プロジェクト管理機能など、エンプラ機能を提供することで、有償化されたサービスのことだと思います。Oracleだと、Data Science Cloudですかね。

Trend No. 9: Blockchain:ブロックチェーン

やっといいたかったところまできた。。ブロックチェーンが「AI/MLに重要な要素」として取り上げられるようになりました。仮想通貨基盤、やトークン交換基盤、ではなくて、データソース、データマネジメント基盤の意味として扱われ始めたことを意味します。「ブロックチェーンはデータソースであり、データベースではない」といっているところからも、その意図が伺えます。さらにいうと、ブロックチェーンで改ざんされていないデータという意味で、AIに正しいデータを食わせる、ということも意味しています。

ここらへんは先日公開された下記記事をぜひ見てみてください。

crypto.watch.impress.co.jp

あと、ちょうど今日、IBMのブログに「BlockchainとBig Dataはなぜ関係するのか」といったまさにここに該当するブログが公開されてたので、こちらもご参考に。たとえコンペでも参考になる情報は積極的に共有するぞ。

www.ibm.com

Trend No. 10: Persistent Memory Servers:永続メモリサーバ

不揮発性メモリ。「データの保持に電力を必要としないため、電源が入ればすぐに処理の続きを走らせることができ、処理が必要なときだけ電源をオンにすればよい」とか「容量あたりの単価がDRAMよりも安いため、メモリ上に大容量のデータを展開可能」といった特徴があります。IntelOracleとの連携も、2年前はOracleDBと、昨年はExadataやTimesTenとの連携が発表されました。

まとめ

自動化によってよろしくやってくれる世界、どう誰でも簡単に使えるようにするかの世界、データのアクセスビリティと正当性をどう実現するかの世界、がポイントのように思えます。特によろしくやってくれるというのは、日本人好みなところですね。

そういう意味では、なんとなく理解できるし、納得のいくレポートでした。

そして何より、この分析の観点からブロックチェーンが語られるようになってきたことは本当に新鮮です。新たな時代を感じます。