Fork me on GitHub

分散トレーニング


SINGAは、大規模なデータ分析の為の巨大なディープラーニングモデルの分散トレーニングを目的としてデザインされています。

分散トレーニングを可能とさせる SINGA のアーキテクチャーに関する詳細は、下のリンクを参照してください。

モデルのトレーニングを並列化するために、様々な並列方法(データ並列、モデル並列、ハイブリッド並列など)をサポートします。

現在 SINGA は Mesos と統合されているので、分散トレーニングを Mesos フレームワークとして実行できます。 Mesos クラスタは、SINGA コンテナから設定できます。 Mesos と SINGA をバンドルした Docker イメージを用意しました。

クラスタの準備と開始に関する詳細は、下のリンクを参照してください。

分散ストレージシステム上で SINGA を走らせ、スケーラビリティを保証します。 現在 SINGA は HDFSをサポートしています。