1. ホーム>
  2. コラム>
  3. SREとは|業務内容と求められるスキル

SREとは|業務内容と求められるスキル

SREとは|業務内容と求められるスキルのイメージ画像

alertこの記事は半年以上経過した記事です
近年注目が高まっているSRE(Site Reliability Engineering)。システム運用の概念ですが、皆さんご存知ですか? 自社でも取り組みが始まったものの、実はよく理解できていないという方も多いのではないでしょうか。そこで、今回はSREの基本的な考え方から業務内容、求められるスキルなどについて解説していきます。

SRE(Site Reliability Engineering)とは

SRE(エスアールイー・Site Reliability Engineering)とは、米Google社が提唱するシステム運用の概念です。この概念で最も重要視されるキーワードは次の2つです。

  • 信頼性
  • 自動化

 

SREとは信頼性を重視し、可能な限り人の手のかからないようなシステム運用を目指そう、という概念です。また、SREはこの様な取り組みの「役割」を指し、これを担うのがSREエンジニアです。では、SREエンジニアは具体的にどの様な業務を行っているのでしょうか?

SREエンジニアの業務内容

SREエンジニアは以下の様な業務を行います。

  • クラウドの構築、運用
  • ミドルウェアの可用性向上、パフォーマンス向上
  • ログ収集、ログ分析基盤の構築、運用
  • 監視システム導入、セキュリティ強化
  • 自動化
  • サーバ環境の整備
  • パフォーマンスや信頼性を向上する為のツールを提案、実装
  • 高負荷状態の解消

 

ご覧のように、SREエンジニアの業務範囲は非常に広く、開発と運用の両面を見る必要があります。従来ばらばらだった開発チームと運用チームの対立を解消し、最適化していくのがSREエンジニアの役目ともいえます。

運用に携わった事があるエンジニアの方なら、サービス開始当初には想定していなかった課題が運用時に出てきたといった経験があると思います。例えば、トランザクションが過多になったり、ディスクの容量が圧迫されたりといったことです。

その様な事態を想定し、SREエンジニアはボトルネックを事前に抽出し、どういった対策をとるのかを見積もり、対策をしていきます。また、これまでに行われていたログの手動バックアップや障害監視業務を可能な限りソフトに任せていき、人的コストを削減する事もSREの役割です。

SREエンジニアに必要なスキル

業務内容の部分で触れた通り、SREエンジニアには幅広いスキルが必要となりますが、特に以下のスキルは外せません。

・インフラ技術(クラウドサービス含む)
・アプリケーション技術
・セキュリティ技術

勉強に役立つ書籍

SREについて勉強したいという方はGoogle社が公開している「Site Reliability Engineering」を一読することをおすすめします。

https://landing.google.com/sre/books/

「保守運用」の一言で片付けられていた作業も、この一冊で感銘を受ける事により、もっと前向きな作業になるでしょう。

SREエンジニアを募集している企業

SREを採用している企業としては、GoogleやFacebook、Netflix、メルカリなどが有名ですが、以下の様な企業でもSREエンジニアを募集しています。SREエンジニアの活躍の場は今後も広がっていくように思います。

  • サイバーゼット
  • オプト
  • ビズリーチ
  • DMM.com
  • BASE
  • Retty
  • 弁護士ドットコム

まとめ

今回は、SREの基本的な考え方から業務内容、そして必要なスキルなどについて解説しました。注目度が高いSREエンジニアですが、求められるスキルは多岐に渡ります。従って、SREエンジニアを目指したいというエンジニアの方は、自分の専門分野はもちろんのこと、周辺領域の知識を貪欲に習得していくマインドが大切になるでしょう。