株式会社nehanは、同社が提供するビッグデータ対応データ分析ツール「Hyper nehan(ハイパーネハン)」が、ビッグデータ分析サービスのGoogle Big Query、Amazon Athenaと変わらない速度でデータ処理ができると発表した。
データ分析ツール「nehan(ネハン)」はデータ分析業務にかかる手間を省略するクラウドSaaSサービスだ。「Hyper nehan(ハイパーネハン)」は2021年6月にリリースされた、プログラミング不要で10億行以上のデータを分析できるビッグデータ対応プランだ。
>>2021.06.17リリース【Hyper nehanのリリースと周辺機能の仕様変更】 | 株式会社nehan
Hyper nehanはPythonやR、SQLを使った集計操作をする必要がなく、GUIで決めたノードをつなぎ合わせるだけで統計解析や機械学習ができ、データ加工に充てていた作業時間を減らせる。処理業務だけでなく、グラフの作成や作ったグラフをダッシュボードで展開する機能を備え、データの視覚化も簡単にできるのが特長だ。
nehanを覗いてみるでは、ブラウザ上で実際の操作イメージが見られる。
画像はnehan公式サイトより
Hyper nehanはApache SparkとGPUサーバ(※上位プランで提供)を利用しており、ビッグデータ処理に対応する。
Hyper nehanの操作画面
同社のリリースによると、20億行×14列・約100GBのビッグデータを用意し「行フィルタ」「集計」「結合」の各処理時間を比較したところ、ビッグデータ分析サービスのGoogle Big Query、Amazon Athenaに引けを取らない速度で処理ができたという。
ただ、Big QueryとAthenaの操作にはSQLを叩く必要があるので、データの専門家が少ないもしくはいないチームでは、SQL操作が不要なHyper nehanが選択肢になりうるだろう。
ほか、Hyper nehanのビッグデータ処理向けの機能は以下の通り。
- データエクスポート(CSV、Google BigQuery、Google スプレッドシート、Amazon S3、MySQLなど)
- 列方向のデータ操作
- 各型列の操作(数値列、文字列、日付列の操作)
- 行方向のデータ操作、データ変形、結合・分割※一部非対応
- 便利前処理(欠損値処理、数値の正規化、特徴量選択など)※一部非対応
>>大規模データ向け高速処理対応機能一覧 | nehanで始める快適な分析生活
また、Hyper nehanはPythonとSparkを切り替える自動スイッチ機能を搭載している。ビッグデータはSpark、スモールデータはPythonで処理、というように、データ量に応じて最適な処理ができるとのことだ。
>>プレスリリース