GlusterFSとは

Gluster 分散ファイル・システムとは


GlusterFSはオープンソースの分散ファイルシステムで,ペタバイトのスケーリングや数千ものクライアントを処理することができます。SolidPOWER7000ではブロックレベル管理については、SCE(Storage Control Engine)の機能をそのまま利用し、GlusterFSでファイルレベル管理を行います。GlusterFSではInfiniBand RDMAによる単一大規模並列ネットワークファイルシステムの構築が可能です。

gfs3.png

GlusterFSは複数のストレージノードのファイルシステムを論理的に統合しボリュームを作成します。ファイルシステムは各々のブリックに対応して設定されていてブリックを1個のボリュー ムにするには次の3通りの方式があります。

  1. Lustre(分散ファイルシステム)の様なストライプ方式
  2. ファイルを分解せずに分散配置する分配方式
  3. ブリック間でミラーリングするリプリカ方式

また上記の複合型方式、 例えば、リプリカ+ストライプ方式にすればスケーラビリティとの両立も可能です。
ファイルシステムコントロールの部分にFUSE(Filesystem in Userspace)を利用しているため、カーネル依存性が低く、構築も簡単です。

ブリック (Brick)

ブリックはノード上に用意されたGlusterFS⽤のディレクトリでファイルシステムと1 対1 になるように設定されます。ブリックは1つのノード上に複数個定義可能で他のボリュームが利用しているブリックはボリュームを定義 する際に利用することはできません。1つのブリックは1つのボリュームにのみ所属しノード間で非同期のレプリケーションを実行します。

ボリューム (Volume)

ボリュームは複数のブリックを束ねて構成します。一般に大容量データ保存領域として管理されます。Native プロトコルやNFSv3などのマウントポイントおよびCIFSの共有フォルダーとして認識されます。

GlusterFSの特長

1.拡張性

1ボリュームあたり16ExsaByte クラスタリングによりリニアなスケーラビリティを実現、2^128個 のファイル数をサポート

2.機能単位のモジュール化

各機能をモジュールに隠ぺいして操作性を向上、ローカルファイルと同様の操作性を実現

3.単一障害ポイント(SPOF)の排除

メタデータサーバの排除により単一障害ポイントを排除

4.レプリケーションによる高可用性

同期レプリケーションの設定が可能、分散配置により冗長性を向上

5. InfiniBand対応

クライアント・ストレージ間でInfiniBand RDMAに対応、低レーテンシーを実現




GlusterFSのソフトウエア構成

  1. 最低2セット以上のストレージノード(ストレージヘッドとJBODの組み合わせ)によるクラスタ接続が必要
  2. 複数サーバーで単一の仮想ボリュームを構築しクライアントにマウント
  3. ストレージノードからGlusterFS用の領域を「brick(ブリック)」で抽出し論理ボリュームに統合
  4. 管理者はすべてのサーバ、空きディスク容量、ネットワーク構成情報から最適なbrickの組み合わせを決定


3.png

ファイルシステムの増設と冗長性

GlusterFS は非常に簡単な手順(以下の2手順)にて容量を増設します。

  1. SP7000(SP7K) を1台増設して、その増設領域にブリックを作成します。
  2. 既存の SP7K にディスクを増設して、その増設領域にブリックを作成します。
  3. 2.作成したブリックをファイルシステムへ追加します。
  4. 注) 追加した領域は、新規作成したディレクトリに配置するファイルから使用されます。
  5. 注) 既存のディレクトリ、ファイルを再配置する際には、リバランスコマンドで簡単に再配置することができます。


1.png

アクセス方法

Nativeクライアント

ボリュームをマウントする際に指定されたストレージノードから、該当ボリュームを構成するノード全体の情報を取得。マウント後は、クライアント自身がファイルを所有するノードを判断して、該当ノードに直接にアクセス

NFSクライアント

GlusterFSデーモンが提供するNFSサーバ機能を利用して、NFSマウントを行います。(NFSv3のみに対応)

主な用途

分散ファイルシステムの普及する理由には非構造化データが急増している背景があります。GlusterFSはこうしたビッグデータ向けの実装技術として開発されたもので、スケールアウトと仮想化に対応した分散ファイルシステムです。以下はGlusterFSの主要な適用分野です。

1. デジタルコンテンツ(ビデオ、オーディオ、写真)のホスティング
2. ファイル共有サーバ
3. バックアップサーバ
4. HPC データ保管

LINUXは米国及びその他の国におけるLinus Torvaldsの登録商標です。RED HATとShadowman logoは米国およびそのほかの国において登録されたRed Hat, Inc.の商標です。 その他、記載されている会社及び製品の名称は、各社の商標または登録商標です。