IT・技術研修ならCTC教育サービス

サイト内検索 企業情報 サイトマップ

研修コース検索

コラム

sugipoohのデータセンター・クラウドインフラ

CTC 教育サービス

 [IT研修]注目キーワード   OpenStack  OpenFlow/SDN  情報セキュリティ  Python  システムトラブルシュート 

第7回 ソフトウエア技術者のデータセンター運用 (杉田正 @sugipooh) 2014年2月

 データセンターでの技術はインフラと呼ばれる分野ですが、「サーバーを置く場所」と考えるとサーバーを監視、運用するソフトウエアの知識は重要です。データセンターを管理するインフラ運用担当者は強電といわれる電源系も含めて運用管理ソフトウエアに及ぶ広範囲なハードウエア知識が求められます。

1.基礎中の基礎 ping、tracert、nslookup

 サーバーを大量扱うデータセンターにて「障害」とは、ユーザーからサーバーが見えないことになります。通常DNSを使いサーバーにアクセスするため、IP到達確認のpingだけでは、サーバー電源が落ちているのか? ネットワークが遮断されているのか? DNSサーバーが名前解決してくれていないのか? わかりません。まずはTerminalを開いてping、tracert、nslookupで原因を調べ始めることになります。サーバーや電源インフラ系かネットワーク系なのか切り分けが短時間復旧においては重要であり、大抵は電源、サーバー、ネットワーク担当が集まりチームで対応することになります。

2.監視ツール Perl、Munin、Nagios、Zabbix

 開始対象サーバー台数が多くなると、障害対応時間短縮のため「監視ツール」を導入します。監視ツールは有償無償で多くのソフトウエアがあります。Perlを使い自動化システムを自作、「見える化」をMuninで行えました。サーバーダウンにはWebサイトへの大量アクセスにより「過負荷」で止まることも有り、このような「過負荷監視」できる総合監視ツールがNagiosやZabbixです。特にZabbixは「テンプレート機能が豊富」であり人気があります。海外にはサーバー監視を依頼できるサービスもあり、海外からサーバー性能を計測しサーバー異常検知を行うこともあります。

3.サーバープロビジョニング Hyper-V、chef、vagrant

 サーバーを大量に扱う場合、OSイントールだけで無く、IPアドレス、DNS設定、メール、データベースなど、利用もしくはユーザーに提供する場合多くの作業が必要です。LAMP(Linux、Apache、My-SQL、PHP)環境でおいてもそれぞれにバージョンが多く存在し、セキュリティ対策、ライブラリの設定なども必要です。
 Apache上で多数のWebサーバーを共用して安価にサーバーを使う場合や、ハイパーバイザ(KVM、Xen、Hyper-Vなど)を使い仮想環境も様々な工夫で高速動作化して多数のOSを1台のサーバーで使えるようになってきました。
 CMS(コンテンツマネージメントシステム)の代表であるWordPressなどをサーバー提供時にインストールしてあるサーバや、RubyおよびRuby on Rails、ライブラリをインストールしてPaaSとして提供する場合もあります。
 これら仮想環境からCMSなどまで構築を自動化するのがchef、vagrantです。

4.ストレージ RAID、rsync、DRBD、Windows Server 2012 R2、Open Stack Swift

 サーバーは故障しても再構築出来ますが、ユーザーが工数を掛けて作るデータなどをサーバー障害で失うと大きな損失になります。ハードディスクHDDやソリッドステートディスクSSDを扱う知識、およびこれらを集合して使うRAID技術も必須です。RAIDにおいては2台同時に故障が発生するとデータを失うRAID5は使われなくなりRAID6、データを失いにくいRAID1などを使います。RAIDを使ってもデータを失うことがあるためrsync、DRDBなどによるバックアップは必須です。
 仮想化やバックアップでは大きな容量を持つストレージが必要になります。多数のサーバーからアクセスされるため高性能なIO能力を持つサーバーを使います。データを蓄積してゆくとアクセススピードが落ちたり、満杯になって困ることがあります。これらの要求に応えるのが「オブジェクトストレージ」になります。サーバーとRAIDの中間に入りデータを制御する高性能コンピュータを搭載したシステムと考えられます。最近ではWindows Server 2012 R2が機能強化されiSCSIプロトコルやSMBプロトコルでもオブジェクトストレージとして使い易くなっています。
 オーケストラとも呼ばれる仮想サーバー総合システムOpen Stackに含まれるストレージ機能Swiftも使いやすいオブジェクトストレージです。

5.DCIM(データセンターインフラマネージメントシステム)

 発電機やUPS(無停電電源)などはメンテナンスが必要であり、定期点検は必須です。これらの点検手順書は「日本語で書かれた業務手順書」であり、データセンターで使うソフトウエアと同等だと筆者は考えます。空調などは大きな電気代コストを発生するため、この分野の監視は必須です。DCIMと呼ばれる「見える化」が標準化され、世界的に普及が始まっています。

 


 

 [IT研修]注目キーワード   OpenStack  OpenFlow/SDN  情報セキュリティ  Python  システムトラブルシュート