Amazon S3 + Glacier + DragonDisk による低価格&高信頼性バックアップ環境の構築 (3 - アップロードする方法の考察)

Amazon Glacier の料金については前回色々と考察しました。

この考察で分かったのは、

アップロードするファイル数が多ければ多いほどお金がかかる

ということです。

今回はアップロードするファイル数について考えてみます。

 

■ 転送料金の件

私の PC に入っているデータ ( ファイル数 = 266846ヶ )を何も考えずにバックアップをすると

ファイル数 == 266846 / 1000 * $0.05 = $13.3423

ということで $13 かかります。

安いですね。この料金はアップロード初回だけにかかるので無視しても良いくらいの料金ですが、ファイル数が 1000 以下であれば無料なので、少なければ少ないほど良いですね。

 

■ 転送速度の件

例えば PC に保存されている画像データ ( 4MB とか) をそのままの状態でアップロードすると、1GB のファイルに比べてアップロード速度が遅くなります。
ファイルをアップロードするたびに Amazon と何度もやりとりをするより、一度に大きなファイルを送る方が効率的です。

ファイルをアップしたときの速度比較は以下のリンクで。

  1. 小さいファイル
  2. 大きいファイル

 

例えば東京リージョンに、

  • 4MB の画像ファイルをばらばら転送した → 867KB
  • 1GB のファイルを転送した → 6678KB

というふうに大きなファイルの方が 7.7倍速度が出ています。

 

小さいファイルを大量に送るよりも、大きなファイルにまとめて転送した方が時間がかからなくて手間も電気代も考えたらトータルで安くなりそうです。

 

■ Glacier のダウンロードの件

次に Amazon Glacier にアップロードしたデータをダウンロードする場合、まず Glacier からデータを取り出す作業が必要になります(この方法はいずれ書きます)。

この作業に対応しているソフトは現時点(2013/02/23) では存在していないので、ブラウザを使って AWS コンソール画面で行うことになります。

なんとこの取り出し作業は「フォルダごとではなくファイルごとに行う」必要があります。

 

AWS コンソールでファイルを右クリックしたメニューから "Initiate Restore" を選択すると「Glacier からの取り出し」が行えます。

clip_image001

でもフォルダを選択しても "Initiate Restore" が選択することが出来ません。

clip_image002

※ "Initiate Restore" を選択して4時間程度で取り出しが終ると、取り出したファイルを自動的にS3 の該当フォルダに配置してくれます。これで S3 クライアントを使ってダウンロードが可能になります。
Glacier はフォルダごとにアーカイブをするのではなく、ファイル単位でのアーカイブ&取り出しになります。だから取り出しもファイル単位で取り出し依頼をしなければならないようです。

 

というわけでファイル数は少なければ少ないほど良いですね。

 

PC がぶっ壊れていざ Glacier から取り出すぞ!となっても 26万ファイルを手動で取り出すのは非現実的です。(そうなったらそうなったで Glacier に取り出しリクエストだけを送るソフトを作ることにするが)

 

■ 結論

Glacier にデータをアップロードする前に、PC 上のファイルをまとめた方が良いです。

思いついた方法は、

  1. ISO 形式などでファイルをまとめる
  2. TrueCrypt などの仮想ドライブソフトでバックアップボリュームを作成する
  3. Zip でアーカイブする

でしょうか。

 

ISO ファイル作成はこのようなソフトを使うと指定したフォルダをまとめて ISO にしてくれるので楽です。もちろん ISO ファイルサイズは、入っているファイルサイズとほぼ同じ。無駄な領域がなく良さそうです。そのまま DVD や CD-R に焼けるのも魅力的です。

 

一番安直なのは TrueCrypt で "2013年写真" のようなボリュームを作成して、そこにすべて放り込んでしまうことですね。ただし 1MB のファイルしか入っていなくても、1GB のボリュームを作ったら 1GB をアップロードすることになるので容量が増えがちです。

 

Zip は無圧縮にすれば時間もかからず良さそうです。

 

私は ISO 作成で行くことにしました。

ISO イメージならどの OS でもサポートされるので今後も読めなくなることはないだろう、という考えからです。
TrueCrypt も考えたのですが、TrueCrypt が今後 OS バージョンアップに合わせてバージョンアップされていくのか?という心配もあり、今回は避けました。

 

以上、その人の使い方に合わせて選んで下さい。

0 件のコメント :

コメントを投稿

PR