日経SYSTEMS編集長の森側 真一

 6月22日、フリーマーケットサービスのメルカリでセキュリティの事故が発生した。ユーザーの個人情報が誤ってサーバーにキャッシュされ、他のユーザーに表示されてしまう、といったものだ。

 この事故に対し驚いたのは、メルカリの対応が速かったこと。14時41分にカスタマーセンターに連絡が入り、15時38分に問題を解消した。その後、技術的な内容を含む情報を、21時前には同社エンジニアブログに公開している。詳報のための取材依頼の前に、これ以上ない詳しい情報がオープンになった。

 情報公開も含め迅速だったのは、メルカリのSREチームが対応に当たったからだ。SREは、Site Reliability Engineeringの略。サービスの高い信頼性や操作性をソフトウエアエンジニアリングで実現することを意味する。元は、米Googleの運用チームを率いていたエンジニアが提唱した考え方だ。

 メルカリのSREチームは6人で構成し、いずれもソフトウエアエンジニアリングのスキルが高いメンバー。そのスキルを活用し、障害対応、性能向上、可用性向上、ログ分析の基盤開発など、サービスの品質を確保するための各種役割を担っている。

 SREのような考え方が広まっている背景には、仮想化やコンテナーなどインフラがソフトウエアで構成されるようになったこと、構成管理ツールやbot(自動プログラム)など運用面でソフトウエアを活用して効率化しやすくなったことなどがある。

 今、サービス/システムの良しあしには、企画や要件定義の良しあしだけでなく、ソフトウエアエンジニアリングの能力が大きく影響するようになっている。

ここからは会員の登録が必要です。