BigQueryやAmazon Athena並の処理速度に プログラミング不要のデータサイエンティスト向け分析ツール「Hyper nehan」

株式会社nehanは、同社が提供するビッグデータ対応データ分析ツール「Hyper nehan(ハイパーネハン)」が、ビッグデータ分析サービスのGoogle Big QueryAmazon Athenaと変わらない速度でデータ処理ができると発表した。

データ分析ツール「nehan(ネハン)」はデータ分析業務にかかる手間を省略するクラウドSaaSサービスだ。「Hyper nehan(ハイパーネハン)」は2021年6月にリリースされた、プログラミング不要で10億行以上のデータを分析できるビッグデータ対応プランだ。

>>2021.06.17リリース【Hyper nehanのリリースと周辺機能の仕様変更】 | 株式会社nehan

Hyper nehanはPythonやR、SQLを使った集計操作をする必要がなく、GUIで決めたノードをつなぎ合わせるだけで統計解析や機械学習ができ、データ加工に充てていた作業時間を減らせる。処理業務だけでなく、グラフの作成や作ったグラフをダッシュボードで展開する機能を備え、データの視覚化も簡単にできるのが特長だ。
nehanを覗いてみるでは、ブラウザ上で実際の操作イメージが見られる。


画像はnehan公式サイトより

Hyper nehanはApache SparkとGPUサーバ(※上位プランで提供)を利用しており、ビッグデータ処理に対応する。


Hyper nehanの操作画面

同社のリリースによると、20億行×14列・約100GBのビッグデータを用意し「行フィルタ」「集計」「結合」の各処理時間を比較したところ、ビッグデータ分析サービスのGoogle Big Query、Amazon Athenaに引けを取らない速度で処理ができたという。

ただ、Big QueryとAthenaの操作にはSQLを叩く必要があるので、データの専門家が少ないもしくはいないチームでは、SQL操作が不要なHyper nehanが選択肢になりうるだろう。

ほか、Hyper nehanのビッグデータ処理向けの機能は以下の通り。

  • データエクスポート(CSV、Google BigQuery、Google スプレッドシート、Amazon S3、MySQLなど)
  • 列方向のデータ操作
  • 各型列の操作(数値列、文字列、日付列の操作)
  • 行方向のデータ操作、データ変形、結合・分割※一部非対応
  • 便利前処理(欠損値処理、数値の正規化、特徴量選択など)※一部非対応

>>大規模データ向け高速処理対応機能一覧 | nehanで始める快適な分析生活

また、Hyper nehanはPythonとSparkを切り替える自動スイッチ機能を搭載している。ビッグデータはSpark、スモールデータはPythonで処理、というように、データ量に応じて最適な処理ができるとのことだ。

>>プレスリリース