本を読む会 SRE サイトリライアビリティエンジニアリング #3

読み会予習ログです。

第II部

Google - Site Reliability Engineering

  • SREが仕事を進めるうえでの原則が語られている
    • SREのオペレーション全般
    • SREの振る舞い
    • SREの関心ごと

#3 リスクの受容

Google - Site Reliability Engineering

読み解きたいこと

  • SREのリスクマネジメントのあり方
  • SREのサービス/システム視点、関心

読書メモ

まえがき

  • 信頼性は大切であるが100%を目指してはいない。過度の信頼性はコストである
    • 新しい機能開発やユーザへのプロダクト提供速度が落ちることになる
  • 「リスクマネジメントとデバイスとのバランスを鑑みたうえでユーザの満足度を維持する=信頼性」と定義できそう?

3.1 リスクの管理

  • 信頼性を担保するためにかけるコスト
    • 冗長なマシン・コンピュートリソースにコストをさく
      • 冗長化することで、メンテナンスのやりやすさ、パリティコードブロックを保存するための領域を持てる
    • エンジニア組織が、障害リスクを減らすためのシステムや機能を構築するためにエンジニアリソースを当てる
  • つまり信頼性の担保=リスクを管理することと言える
    • リスクマネジメントをしっかりとおこなう組織とシステム整備が重要
  • リスクへの考え方
    • 連続的なものであり、信頼性を高めるためのエンジニアリングと障害許容レベルの定義を決める
    • それは(おそらく)サービスにより異なる。ビジネスが許容できるラインをしっかりと理解していることが求められる
  • 可用性のラインを理解することでリスクマネジメントを行う

3.2 サービスリスクの計測

  • システム(サービス)ごとにどういったメトリクスを計測すればよいかを見いだすことは信頼性の担保に非常に有益
    • パフォーマンスの改善、劣化の追跡が可能になる
  • 計画外の停止時間
    • リスクの許容度をもっとも単純明快に表す方法。計画外の停止時間は、サービスの可用性が実際のところどの程度求められるのかによる
  • Googleでは時間を基にした可用性は定義していない(世界中で展開するサービスのため、時間を基にしたメトリクスにあまり意味がない)
    • 総リクエスト数に対する成功したリクエスト数を可用性を測るメトリクスとしている
  • 四半期単位で可用性のターゲットを設定。そこから週・日単位にブレークダウン
    • 定量目標の設定は四半期ごとに見直すくらいがちょうどよいのだろうなあ半期だと長すぎる

3.3 サービスのリスク許容度

  • Googleではサービスのリスク許容度は明確に定義していない
  • するなら、SREがビジネス観点(事業側の定量目標やクライアントとの契約内容、パフォーマンス)を把握し、エンジニアリングで解決可能な目標に変換する必要がある
  • SREとプロダクトマネージャーの協働が必要
  • とはいえ簡単なことではない
    • プロダクトや事業サイドの責任構造はあっても、インフラストラクチャサービスの構造がないあるいは一致しないことがしょっちゅう
      • サービス側と人事との難しさと共通しているように感じる
      • (CRE目線なら)クライアント先の事例を集め、サービスやシステム構造によって何をプライマリメトリクスとするかの提案ができるとよいのだろうか

3.3.1 コンシューマサービスにおけるリスク許容度の明確化

  • SREとプロダクトマネージャ(ビジネスやユーザーに対する可用性/可用性をどうみなすかについて議論できるポジション)の目線合わせが重要
    • プロダクトマネージャにはある程度システムやSREの思想がわかっているとなおよい
  • 双方で明確化するリスク許容度
    • 必要な可用性レベル
  • 障害の種類とサービスへの影響
  • 「リスク曲線上にサービスを位置づける上で、サービスコストはどのように利用できるか」 > 日本語の意味がわからなかった
    • How can we use the service cost to help locate a service on the risk continuum?
      • リスクは連続して起こりうるものだと定義した上で、サービスコストをどこまで払うことが可能であるか、と訳せそう
  • 可用性を満たすために考慮すべきメトリクスがなにであるかの合意形成
3.3.1.1 可用性のターゲットレベル

可用性をどう設定するかは、そのサービスがユーザに提供する機能と市場におけるサービスの位置付けに依存。またはサービス機能の開発ステージ(途上なのか過程なのか充足なのか)にも依る。

  • ユーザーが期待するサービスレベル
  • サービスの収入構造
    • ビジネスモデル
  • 競合との差
  • toB or toC
3.3.1.2 障害の種類

「上り一日下り一時」「好事 門を出でず、悪事 千里を走る」を想起させ、SREの役割には頭が上がらない。

  • 障害の種類により、障害レベル、ユーザに対する信頼度、ビジネス影響など複数の影響範囲を知った上での判断が必要
3.3.1.3 コスト

コスト意識を数字で可視化。なんとなくふわっとではなく。

  • 可用性を1桁改善したら収益がどれだけ増すのか?とか
  • その収益増加は、信頼性を担保するためにかけるコストに見合う価値があるか

収益で測れないケースでは、ISPのバックグラウンドエラー率を考えることも有効。はてなでもそういったケースは多そう。

3.3.1.4 サービスの他のメトリクス

リスクマネジメントをやる上で、可用性以外のメトリクスも考えておけるとよいですよというお話。

  • 例、Google Adsにおいては、Web検索機能の速度
    • 数字だけじゃなくて、人の体感速度にまで気を使っているのがさすがー
  • サービスにより(Ads とAdsense) 優先づけができる
    • Adsenseはパブリッシャ側のレイテンシにもよるため、Adsに比べるとほんの少し緩めで設定できますよん、など

3.3.2 インフラストラクチャサービスのリスク許容度の明確化

コンシューマサービスとの基本的な違いはインフラストラクチャのコンポーネントの複雑さ。複数のクライアントを持ち、各クライアントの要求が多様。

3.3.1.1 可用性のターゲットレベル

システムの可用性定義は、複雑かつ大規模な分散システムの特性や働きを理解するところから。どのメトリクスを重視するかもことなりそう。より高い信頼性が求められることが多い。
インフラストラクチャのシステムの要求を理解するには、リクエストキュー の状態を調べてみるのがよい。 https://wa3.i-3-i.info/word14716.html

3.3.2.2 障害の種類

システムたちそれぞれの仕組みと特性の違いについて。

  • 低レイテンシのユーザにとっての成功は、オフライン分析に関心があるユーザにとっては失敗。
3.3.2.3 コスト > 要確認

前半の記載内容がよくわからなかった。
システムに何をさせるか(どんなデータを持たせて、そのシステムにどんな仕事をさせるか)により、何をコストとみなすかは変わるよという話?
システムを分散化し、持たせるデータとシステムの特性により、システムごとの可用性と信頼性を設定していくことが大事よ、と書かれてある気がする。

3.3.2.4 例)フロントエンドのインフラストラクチャ

いくらインフラストラクチャレベルで信頼性可用性が担保されたとしても、サーバサイドの例えばリバートブロキしやロードバランシングが含まれるようなシステムの信頼性が提供されていないと意味がありません、という話。
リスク許容度は、単眼的一役割的に判断するのではなく、複眼的に議論判断する必要があり、それによりリスクマネジメントを敷いてそれぞれの可用性を設定する必要がある。

3.4 エラーバジェットの活用

プロダクトチームとSREの典型的な認識の分断例。

  • ソフトウェア障害の許容度
    • Dev vs Opsのおさらい
  • テスト
    • 開発速度とシステム信頼性のバランシング
  • プッシュの頻度
    • デプロイ作業。たくさんデプロイしたいプロダクトチーム/デプロイ頻度が高まるほど障害懸念を予想できるSREチーム
  • カナリアテストの期間と規模
    • 新機能のリリース時における昨日全体のQAのようなもの?

プロダクト・SREチーム双方にとって最適なバランスで価値のあるサービス・システムを提供するために、双方による交渉ではなく、客観的かつ明確なデータで判断できることが望ましい。そうすることで障害に対するリスクマネジメントをプロダクト/SREチームで合意できるようにしようね

3.4.1 エラーバジェットの形成

Googleのプロダクトチーム・ SREチーム間のエラーバジェットのやり方。

  • プロダクトマネージャによるSLO(サービスレベル目標/Service Level Objectives)を規定。四半期間に期待するサービス稼働時間を設定
  • 実稼働時間は、モニタリングシステムで計測
    • Mackerelの出番か
  • この2つの数値差が、3ヵ月間の「損失可能な信頼性」と「予算」残分となる
  • 稼働時間がSLOを超えた場合は(うれしい)つまりエラーバジェット残分がある場合は、新たなリリースをデプロイできると解釈可能
3.4.2 メリット

適切なエラーバジェットを設定することにより、SLOに対する双方のコミットが高まる。
エラーバジェットの消費が高い場合は、SLOが正しい内容であるかを照らす基準にもなる。その場合はSLOを緩めるなど、サービスの現状に適した選択肢を判断するための材料としても使う。

www.slideshare.net

わかったこと

ふんわりです。

  • サービスの信頼性担保=リスクマネジメントと言えそう?
  • サービスの特性とビジネスモデルにより、優先すべきリスクととってもよいコストを定義しておけるとよい
  • SREはコンシューマ、インフラストラクチャ、両サイドのリスクを理解しておく必要があり、障害時にはリスクの度合いによりどこにコストを割くかを的確に判断する必要がある
  • エラーバジェット=SREとプロダクトチーム間で共同所有する指針
    • エラーバジェットがあることにより、リスクとコストを双方の尺度で判断し、同じ目的に到達することができる

感想

SREチームは技術領域の幅広さだけでなく、サービスについても広く多角的に認識している必要があることを知った。じゃないと、何をメトリクスにするか、エラーバジェットの作成、障害時に即時適切な判断ができない。手術を担当する外科医、症状から病を推測する医師、航空機におけるパイロットに似ている。
「サービスの信頼性を担保することはリスクマネジメントを徹底することである」逆説の考え方が興味深い。いま何をすべきかを決める時に、何をしないか何を捨てるかを考えるのだ。
Googleはその判断基準をデータや数値重視を徹底することで知られるが、そのことを実感できた章だった。

  • 参加者 missasanさん, yuukiさん, tomomii

「道をつくる」その後の思索

昨年末の WSA研#1 縁側トーク「道をつくる」発表から半年が過ぎた。

あの時の私はWSA研に集う皆さんに向けてお話をしながら、心の中で自分はこうありたいのだと自己表明していたように思う。そして参加者皆さんがどうありたいのか聞けるとうれしいとも考えて、ニールス・ボーアの言葉を借りて、このあとの発言は断定ではなく質問です、と伝えた。

発表体験を経て自分の思考フローが少し変化したように感じている。
どう変わったかというと、縁側トーク以降 しんどいなぁなんだか疲れたなぁと感じる時にふと自分の発表内容を思い出すようになった。一人振り返り会の回数が増えて、自分のありようで迷うことが減った。自問自答がスタートし、脳内で一定のフローが流れ、しばらくすると靄が晴れて視界が広がる。こんなイメージ > tired > questioning > observing/deep thinking > for what > action image.
碩学の思想と自身の考えを言葉にして発表するという体験が、ほんの少し自分に変化をもたらしたみたいだ。この実感が興味深い。

脳がトーク内容やいまの実感を都合よく編集しないうちに、未来の自分のために、話した内容のうち「個」を考える際に辿った言葉と思索を書き留めておきたい。

道をつくる:はじめに

以下、トークで使う「道」「研究」「個」はこう定義します。

    • あり方 (being), 道理
  • 研究
    • 研ぎ澄まし究めること。新しい事実や解釈を発見すること
    • なんらかの技術において専門領域をもつ個人
    • 専門領域や研究分野で、新たな価値を生み出すことにチャレンジを厭わない

紀元前後の思想家や哲学者の書籍を読むと「道」の解釈は東洋と西洋でニュアンスが異なることがわかります(下表参照)。東京大学東洋文化研究所 安冨教授の発表でその違いを聴くことができます。 > 安冨 歩「「道」とは何か? :『論語』と『老子』の世界観」ー東洋文化研究所公開講座 2017 「アジアの知」 - YouTube

東洋(老荘思想 西洋
being to be or not to be
一本道の哲学 選択の哲学
全体を捉える、誰しもが行きつけばよい、一本道ひとそれぞれの道、道を間違えても迷ってもよい、間違えて戻ってこないのがアホ、自然派生的で感覚的 全体を分解して個別に理解、よい選択をすれば天国/悪い選択をすれば><、現代社会はこっち(受験、就職、経済、法..)、合理的で論理的
参考資料「論語」「老子など 参考資料「自省録」「君主論」など

縁側トークで使う「道」は、老荘思想で語られる道 (=being) を前提にしています。理由は、自分が傾倒してきた科学者の思想や考え方が、論語老子に書かれている内容と似ていることに気づいたからです。科学者の著書を思想にフォーカスして読むうちに、ノーベル物理学者 湯川秀樹博士は幼少期から漢文や老荘思想に親しんでいたことを知りました。たしかに湯川博士の著書や専門誌では「道」の思想が滲むフレーズを多く見つけることができます。湯川博士は物理学者になる以前から、老荘思想に親しい考えをしてきた方なのでしょう。

・ただ流行を追っているだけというのはつまらない生き方です
・今日の真理が、明日否定されるかもしれない。それだからこそ、私どもは、明日進むべき道を探し出す
・1日を生きることは、一歩進むことでありたい

ノーベル物理学者  湯川秀樹

調べを進めるうちに物理学者 アインシュタインニールス・ボーア、哲学者ヴィトゲンシュタインも東洋的な思想に関心を寄せていたことがわかってきました。このことは偶然ではなく、研ぎ澄ましてものの理を見つめ、新たな価値や解釈を見つけ出す人たちに共通する思想かもしれないと考えています。

道をつくる

私たちがなんらかの専門領域を突めようとするとき、碩学の思想や自分の経験が役に立つかもしれません。上述した「道」「研究」「個」の定義を心に留めて、私たち個のありかたを3つの問いでお話します。

  1. 自分だけの道をつくる、語る
  2. 自分の考えをもつ
  3. 孤独をおそれない

1. 自分だけの道をつくる、語る

自分の時間や考え、生き方において、他者の意見を参考や気づきの材料にしても、引っ張られる必要はないとお伝えしたいです。立場や言葉が強いひとのまねをする必要もありません。科学者をイメージしても、素敵だなかっこいいなと感じるひとも、独自の歩みを進めているように見えます。
自分を見つめようとする点で、キャリアコンサルタント資格取得の学習過程のエッセンスが活きそうです。ひとのキャリアを考えるフローは一本道の考え方が軸であり、老荘思想と重ねて考えられました。自身の強みを考える過程で、自分のストーリーを語ることを重視しています。

  • 過去に見つける
  • 現在を見つめる
  • 未来を見とおす

過去から連続する時間の積み重ねが今の自分を作っているとしたら、じゃあ今まで自分はどんな時に喜びや感動を感じていたでしょう?自分を突き動かしてきた思いや考えは、過去のどの経験や感情と繋がっているでしょう。自分の源泉はもしかしたら過去に見つけられるかもしれません。過去と今を見つめて、これからの自分をつくっていく。そんな考え方を心理学とカウンセリングのアプローチで学びました。

少し話が逸れますが、自分の時間を生きることは脇目もふらず前に進むだけではありません。寄り道をして、時には失敗をして、その道中で、感動・喜び・楽しさを見つけて小さな成功を味わう。そういったことが人生を豊かなものにするのだと思います。
疲れたときは立ち止まって休めばいい。自分のペースでよいのだと思います。先を急ぐ旅ではないはず。立ち止まる時には、そこに意味があるから足元を見て靴ひもを確認したい。ほどけたままの靴ひもでは長い旅は歩けないし、走れば転ぶし、走らなくてもひもを踏んで転ぶかもしれない。もしも転んだら、また立ち上がればよいのでしょう。

自分の経験を無にしない、他者のまねではなく自分の経験から学ぶという姿勢。自分が信じる道を自分の歩調で歩いていきたいものです。

2. 自分の考えをもつ

1. をするためには、自分の考えをもつことが大切です。何かに気づいた時、他者から何らか刺激を受けた時、その事象に対して自分はどう考えたか。事あるごとに自分の中で考える癖づけをしておけると、その事象が自分にとってどんな意味があるか意味付けしやすいように思います。ショウペン・ハウエルが「思索がない読書に意味はない」と書いているのは興味深いところです。著書「読書について」で、多読は迷いのもとで悪本は読んじゃダメと言い切っています。
自分の考えをもつことを意識付けできそうな方法をいくつかあげます。もっといろいろありそうなので、自分のやり方を見つけてみるのも楽しいですね。

  • 問いを立てる
    • 問いを立てる勇気を持つ
  • 論理を上手に使う
    • 全体像から筋道立てて(なんでそう考えるのか?を考えることで)見えてくるものがありそう
  • 言葉を鍛える
    • 自分の考えを整理し、他者に伝えるため
  • 頭の外に出してみる、議論をする
    • 脳は自分の考えであっても言葉や文字にして外に出してみないとうまく理解できないらしい。また、議論をすることで別の視点が得られ、理解が深まる

自分の考えや問いは、他者に伝えようとしたり文章にすることで、やっと形をはっきりさせることができるのかもしれません。

自らの考えを持ったうえで、様々な意見に出会う。いろんな物の見方に出会う。新しい言葉や新しい意味の広がりに出会う。そうしてはじめて、自身のより深い思考に出会えることがありそうです。思ってもみなかった場所に足を踏み入れることができるかもしれない。自分と異なる領域や別分野の考えを取り込むことも意識したいです。

3. 孤独をおそれない

言葉の通りです。
これまでに知った科学者や哲学者で、孤独じゃないひとはいませんでした。アインシュタインはあまりにも未来を見通していたために他者に理解されず孤独であった、と湯川著書に記されています。湯川博士ヴィトゲンシュタインも自身の孤独について語る文章があります。WSA研の皆さんだって、研究者ではない私だって同じだと思います。
研究をする、まだ名前がない技術分野を突めようとする時に、先が見えずわけもわからず一人で苦しいと感じることがあるかもしれません。そんな時は孤独を友だちにしたい。
何かを突めるとき、孤独から逃げない姿というものに美しさを感じます。私はそういったひとの孤独に気づきたいし応援したい。

  • 自分のビジョン、志の舵を握るのは自分
  • 先を見通し、自分の技術や言葉を語ることは孤独。すぐには理解されないことも
  • 他者の同意や期待通りに生きたら、他者の人生になってしまう
  • なにをするか、どう考えるかの決定権は自分

道をつくる:むすび

発表に至った自分のこれまでを記します。

高校1年生の時に読んだノーベル物理学者 湯川秀樹旅人―湯川秀樹自伝 (角川文庫)の一文に魅せられ、科学に纏わる書籍を好むようになりました。

未知の世界を探求する人々は、地図を持たない旅行者である

専門書は理解できないため物理学者の書いた随筆を読み、量子力学のりの字も分からずアインシュタインを知り、科学者の端的で美しい文章をノートに書き留めていました。読んでいると森の中を歩いているような静かな気持ちになれるので。
科学者が棲む世界は、開高健氏の言葉「成熟するためには、遠回りをしなければならない」そのもので、迷うことに対する恐怖が和らぎ、ものの理を突き詰めることの意味を知れたように思います。科学者のものの見方は刺激的でユニークで、物理学者 ファインマン博士の著書はとりわけ笑いながら読んだ覚えがあります。

ものごとの本質を捉えようとする視点や知らない解釈や新しい定義を知るうちに老子論語を読むようになり、いつしか私も自分の道を歩んで生きたいと思うようになりました。道に迷いながらも美しいなにかを見つけられる生き方に憧れがあります。
こんな自分が、技術領域の研究会でお話させてもらう機会をいただくことができた。体験をきっかけに自分が少し変わった実感がある。人生捨てたもんじゃないな〜と思えます。

過程

5月が終わる。年初に書いたエントリを読み返していた。
2018年 - Words fly away, the written letter remains.

抱負を書いたがまだ一歩を踏み出せていない。踏み出す方向も決めかねている。大丈夫?大丈夫じゃない気がする。「途中」で検索してみた。

途中
物事を始めてから終わるまでの間。まだ終わらないうち。中途。

途中で検索をして、中途が出てくるのはおもしろい。次は「過程」で検索。

過程
物事が変化し進行して、ある結果に達するまでの道筋。プロセス。進化の過程

変化し進行して、結果に達するまでの道筋。進化の過程。ほお。

楽観的だけど、大丈夫だろうと思えた。自信はない。でも直感にはこれまでの自分の経験や価値観が詰まっているだろうから、今はマイペースに歩みを進めることにしよう。自分の直感はまあまあの確率で当たるのだし。

情報の波にのまれると不安になるから新しい分野の本をゆっくりと読み進める。それにより新しい価値を知れることに喜びを感じる。ずっと先の自分像はあるけれど、一気に結果を出そうとは思わない。今日も明日も、毎日は結果ではなく過程であり、トレーニングをしていくように積み重ねて近づいていくのだ。

ここまで書いて、学生のころに図書館で見かけてノートに 写した一節を思い出した。事あるごとにこの言葉に救われてきた。
だれのものかご存知の方がいらっしゃれば教えてください。

ある夢が現実化する過程

押し寄せる感情の波をやさしく受け入れ
ひとつひとつの出来事に心を動かしても
奪われることはなく
つらぬく強い意志などとかいうものは
あまり考えないようにして
できる限りのやさしい視線で
遠くの方に静かな見通しを持ち続けること

本を読む会 - SRE サイトリライアビリティエンジニアリング #1

「本を読む会」と題して同僚とSRE本を読み進めています。このエントリは第1章を読んだメモです。ざっくりです。

  • 参加メンバ
    • missasanさん, syou6162さん, tomomii
  • 第1章担当
    • tomomii

SRE本を読む会の目的

  • SREの思想や考えを知る
  • GoogleのSREはどんな基準でものごとの判断や意思決定をおこない、開発実務をおこなっているのか理解する

冒頭でやったこと

本を読む会に求めることをそれぞれ共有しました。

  • SREが使うツール Mackerelをサービス開発・運営している。SREを支援したり仕事がやりやすくすることを提案するポジションという観点で自分に何ができるかを考えたい
  • インフラ技術や知見を勉強中。SREの考えを知ることで、サービスオーナーシップについて理解を深めたい
  • SREというポジションの魅力、技術領域の幅の広さを知った。組織やチーム開発の視点で学びが多そうだ
  • SREの思想や考えを知り、組織のあり方について考えたい

tomomii : 読み解きたいこと

  • SREの役割
  • SREの戦略
    • Hope is not strategy. "願望は戦略にあらず" →どゆこと?

読書メモ

1.1

  • 大規模かつ複雑なウェブシステムの歴史
    • システム管理者(シスアド)の役割
    • 開発と運用(DevとOps)の分断によるコストやデメリットに着目
      • Dev : サイトの成長に寄与
        • 新機能を開発し、ユーザーさんがそれを使っている様子を見てみたい
        • 自分でコードを書いて動くものを作る人
      • Ops : ユーザーさんが成長したサービスを安定的に適切な速度で障害発生なく運用し障害発生時の対処をする
        • すでに存在するものを組み合わせて(システムの癖やバグを理解しながら)安定的にシステムを運用する
  • 障害はどんなときに発生するの
    • システムになんらかの変更が生じたとき。人為的変更⇄システム変更、両方ある
      • 新機能や新設定をローンチ
      • 機能を追加したことで発生
      • 新しい種類のユーザトラフィックなど
  • Dev「好きなものを好きな時に邪魔なしにローンチしたいんジャー」 vs Ops「いったん順調に動いたシステムに変更を入れたくないんジャーー」
    • ↑ 対立的で病的なバトル

1.2

  • SREとは、ソフトウェアエンジニアに運用チームの設計を依頼した時に生じる(力を発揮する)エンジニア組織である
    • SRE is what happens when you ask a software engineer to design an operations team.
  • SREの業務領域
    • 50~60% : ソフトウェアエンジニア
    • 残り: + Unixシステム +システムネットワーク
  • SREチームを立ち上げてから
    • 運用チームが行なっていたことを自動化
    • SREは自動化やソフトウェアを開発を厭わない人を充てる
    • そしてSREチームとして、ソフトウエアエンジニアリングに注力することを求めた
  • どんな人がSREの適性にフィット?
    • 手作業のタスクに飽きる、自動化したい ≒ 運用に頼らない、システムで解決できるようにする
    • 自動化できるスキルセットを持っている ≒ 運用に頼らない、システムで解決できるようにする
    • ソフトウェア開発に適したアカデミックな知識経験 ≒プロダクト開発の効率化、生産性向上に貢献できる
  • SREチームをつくって見込める効果
    • 開発/運用の分断による機能不全を回避
    • 加えてプロダクトチームの停滞も改善。SREとプロダクト開発エンジニアを異動させることで相互トレーニングを実施。Reliability 向上の循環を促す組織構造をつくる
    • 結果として 分散システムの構築方法を学ぶ機会を醸成 > エンジニア全体が幅広い技術領域を扱える理想のすがたに
  • SREの採用難易度
DevOps ? or SRE?
・DevOpsの定義はいまだに固まっていない
 ・システムの設計と開発のフェーズに役割を持たせる
 ・人手ではなく自動化を進める
 ・運用タスクにエンジニアリングのpracticeとツールを適用
つまり DevOps ≒ SRE??
 DevOpsはSREの中核的な方針のいくつかを幅広い組織、管理の構造、個人に対して一般化
 SREをDevOpsに独特の拡張を加えたプラクティス

1.3

  • SREの信条
    • サービスの可用性、レイテンシ、パフォーマンス、効率性、変更管理、モニタリング、緊急対応、キャパシティプランニングに責任をもつ
      • Ops の概念に近い

1.4

始まりの終わり

「願望は戦略にあらず」の意味が見えてきた気がする
  • SREはDevとOps 双方の「こうなればいいな」を実現するためのエンジニアではなさそうだ
  • SREのお仕事
    • サービス特性ごとの "Site Reliability"が何かを見極め、システム基盤に最適な設計を決めてソフトウェアエンジニアリングでウェブシステム基盤を開発する
      • だから'worked much closer with subset of devs' で 'more coding' が必要なんだな〜
        • fullset ⇄ subset

わかったこと

  • SREの役割
    • ウェブサイトの信頼性(スピード、落ちない、新機能開発しやすい等)を実現し維持する
    • 結果としてエンジニアの生産性向上と開発効率化に貢献
      • ウェブサービスの成長とプロダクト開発エンジニアの生産性を担うエンジニア。ウェブシステム基盤全体のクオリティ責任者。かっこいい
  • SREの戦略
    • ウェブサイトの信頼性を維持する
    • 信頼性をどう担保するかはサービスによって異なりそうだ
    • システム基盤に必要な要素の優位性と優先度を決めてつくる
  • SREが生まれたきっかけ
    • Googleが思い切った判断をした
    • ウェブシステムの基盤開発に何を重視するかを新たに定義したのがすごい
      • DevでもOpsでもなく、SREのミッションはウェブサイトの Reliability. Reliabilityに必要なことはなんでもやる
      • Ops はなるべく自動化し、システムの課題はソフトウエアエンジニアリングで解決する
      • Dev と Ops の対立構造を脱却、ソフトウエアエンジニアリングを重視

感想

  • SRE = まるで航空機のパイロットのようだ (tomomii妄想)
    • 信頼性を第一義に考える強い使命感、入念な準備、緊密な連携、刻々と変化する状況への対応など、奥深い世界
    • 過去の知見と計器を頼りに変わりゆく外部環境をつどモニタリングしながら、最適な航路を進むべく判断を繰り返し、安全かつ最適な航路で目的地へ向かう
  • 凄腕な庭師にも見えてくる (tomomii妄想)
    • 京都の別荘群 碧雲荘や何有荘を預かる超スゴ腕庭師
    • 外部環境、土、植物、デザイン、設計、季節の移ろいなど数多な条件を知り尽くし、訪れる人たちを楽しませることと庭の整備運用を両立させて息の長い美しい庭をつくることができる
  • 参考資料にあげたLinkedInのSREが語るReliabilityのヒエラルキー構造は興味深い
Hierarchy of Reliability

SRE Hierarchy of Needs

1. Metrics and Monitoring
2. Reproducible Builds
3. Stable/Predictable Releases
4. More Communication
5. Dev Ownership (including testing)
6. Build a Team

  • 一人で黙々と読むのとは違い、複数メンバーかつ別のバックグラウンドを持つ方の視点をいただけて勉強になりました

ほか

  • Mackerelの役割
    • MackerelはSREヒエラルキーにおいて上位とされている Metrics and Monitoring, Capacity Planning そして Testing&Release Procedure (システムに異常がないか正常であるかそしてこのまま飛び続けて問題ないのか、修正するならどこか)のデータを蓄積し監視する
    • SREがシステムをみて判断する際に「なにをもって異常とみなすか、正常とみなすのか」をMonitoring してくれる

このあと読みたい本と動画

戦略を決めるための道筋や方法論をおさらいしておきたい。

SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム

SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム

第2章 Google - Site Reliability Engineering へつづく

監修:y_uukiさん

未来のために振り返りをする

寝る前に1日の振り返りをすることを日課にしている。こんな具合。

  • 起床から寝るまでの自分の時間と周辺出来事と感情を追体験
  • 他者の言葉、とくに自分の言動を思い巡らせる
  • なんであんな言動をしてしまったのだろう?よかったのかな?よくなかったな。うれしかったな〜等々、自己嫌悪したりうれしいことなら喜び倍増
    • 毎日の自分を内省することで、修正と学びの循環ができるようになる(といいな)

振り返りをするようになったきっかけは祖母の言葉だ。
随分前に自分の選択について母と意見が衝突したことがあった。母の理解がなかなか得られず、母方の祖母に話をしてアドバイスをもらおうとした。
祖母は一通り話を聞いて「どちらの言い分も間違っていない」とエクスキューズしてから「それであなたはなぜそう思ったのか?それは自分にとってどんな意味があることか」「ひとから学べ」と言った。「ひとは生活とひとからしか学び得ない」という表現だったかもしれない。
続けて「嫌だと思うことは自分を振り返る機会に、うれしいと思うことは自分の手本にしなさい」「毎日の出来事を無駄にしてはいけない」「自分の人生なんだから最後は自分で決めるしかないが、理解が得られるまで話をしてほしい」というようなことを言った。母とのコンフリクトについて具体的な助言はなかった。でも祖母の言葉を受けて、母は母なりに自分を心配しているのだろうとか、自分の言い方が悪かったなぁとか、別角度で内省するきっかけを与えられたように記憶している。

思えば祖母の話は経験学習 (1) の考えに近しい。経験学習のベースとなる考えを唱える哲学者 John Deweyの言葉にこうある。

  • 人は能動的に環境にはたらきかけ経験を積み、経験に対するリフレクション(内省)を通して知を作る
    • We don't learn from experinence. We learn from reflecting on our experience. "How we think."

毎日の出来事を内省し、経験から知を作れということだ。Korthagen,Fred A.J.(コルトハーヘン, ユトレヒト大学の心理学者, 教師教育学)によって提唱されている、よい内省を生むための振り返り方法を後述したい。

  • 振り返り4軸
    • 行動(事実)
    • 認知(事実は客観的にどう捉えられるか)
    • 感情(それに対する自分は)
    • 願望(未来はどうしたい?)

ひとの感情はそのあとの行動やアウトプットに大いに影響する。ならば振り返りに感情を含め、上手に認知的不協和を利用しようということだろう。

振り返りの最中、思い込みや表面的な理解で意見をしていることがなんて多いのだ、と自己嫌悪やら恥ずかしいやら情けない感情が常に押し寄せてくる。
そんな恥ずかしい自分だが、再発防止を心がけることはできる。未来の自分は今日より少しはマシ。私は未来の「こうありたい」のために振り返りをしているのだ。
こうありたいに近づくために何をすればいいのかは簡単に見通せない。しかし、修正しよう、これは自分から排除しよう、ならわかる。英国のノーベル文学者 ウィンストン・チャーチルの言葉を思い出す。

過去のことは過去のことだといって片付けてしまえば、それによって、我々は未来をも放棄してしまうことになる

祖母は考えることや感じることを人より多くやっているように見える。自分もいつしかそんな風になれるよう、今夜も1日を振り返る。

参照:

ケーキを食べてパティシエから教わったこだわりと発想

深夜の空腹バトルでわたしの気持ちを紛らわせてくれるものといえば美食画像である。
空腹に対抗して美食画像やおいしいレビューを見ているうちにまあまあしあわせな気分になってきて、自力で無理やり明日への希望につなげる。起きたらチーズトーストを焼いておいしいカフェオレを淹れる。決めた。
こういった妄想アプローチは等価交換の考えに沿っているように思える。目と心の保養をするだけで平和的解決ができる点で気に入っている。このエントリをポストする頃には睡魔がやってくるだろう。
いつものようにクローズドに記録してある自分美食ログを眺めていたら、昨夏に訪れたアサンブラージュ カキモトでのひとときを表の場に書いておきたいと思った。以下に記します。

お店は静かな住宅街にある。目立つ看板はないためうっかり見過ごしてしまいそうだ。店内はシックな色調でカウンター席のみ。濃茶と黒、白で統一されている。入ってすぐにオーナーさんがこのお店で表現したい世界観を感じ取ることができる。

期間限定ですとおすすめしたもらった桃のタルトはタルトペーシュという名で、桃の下に無花果が散る凝ったものだった。セットで頼んだアイスブルーティはふんわりと花の香りがして外の暑さを忘れさせてくれた。
桃のタルトを一口いただくとそれはとても上品な甘さでふあー!
タルト生地はどちらかというとパイの食感に近く、アーモンドの香ばしい風味がした。桃と無花果の重厚な甘みと生地のさくさく感が絶妙で、ブルーティを飲むと花の甘い香りに満たされた。たくさんの感覚を満喫しながらしばらくぼうっと過ごした。
時間をかけて食べ進めていると、どうですか?おいしいでしょ?とパティシエの柿本さんが話しかけてくれた。一人客だから気遣ってもらったのかもしれない。すごくおいしいですと答えたら、そうでしょ〜と言って「このタルトの生地はバターじゃなくてオリーブオイルを使っているんですよ」と教えてもらった。
だからいろんな香りがするんですね、と伝えたらこんなことをお話してくださった。

  • バターを使うとせっかくの桃と無花果の香りが台無しになってしまうこと
  • バターは重くなりすぎて夏のタルトにはオリーブオイルの方が向いていること
  • オリーブオイルを使ってタルトとして成立させるのはそれなりに難しいこと
  • 桃と無花果は農家さんと契約をして取り寄せていること
  • 桃の季節はもうすぐ終わるからそろそろこのメニューは終了すること
  • 自分が美味しい、よいと思う食材しか使わない。道具もしかり
  • 甘さの質と分量と香りは重要なエッセンスであること。どれも過ぎちゃダメであること

「次にきてもらえたら、アサンブラージュ(a)を食べてみてください。あっちは上質なチョコを使っていろんな味がするように作っています」
そうおっしゃったので、その場でおかわりすることにした。 f:id:tomomii:20170813123216j:image

一番近いスイーツを当てはめるとしたらチョコレートムースかなあ。でも今までたべたどのチョコレートムースよりも繊細だった。柿本さんのとおり、いろんな種類のチョコのビターな香りが階層になっており、一口いただくごとにいろんな味と香りがした。下段はすこし酸味のあるムース。それがビターな風味と重なって後味はさわやか。口の中でぜんぶの味が溶けた。こんなに複雑でおいしいレシピをどうやって考え出すのかと質問してみたら、新しいメニューの発想について聞かせてもらうことができた。

  • 食材をよく知っていることがだいじ。フルーツや野菜だけじゃなく、オリーブオイルもバターでも粉だって玉石混交。よいものを知っていること。そして活かし方と相性。組み合わせを知っていることもだいじ。その研究はしている
  • それをわかったうえで何を作るか。自分はプロとしてお客さんにおいしいものを食べてもらわないといけない
  • おいしい食材でも組み合わせによって活きなくなることはよくある。自分もいまだに失敗作を食べてはがっかりする。食材にも申し訳ない
  • よい質の材料をどう活かすか。それができたら組み合わせと分量。最後に見映え。お客さんにまた来たいと思ってもらえる全体感。それに尽きる
  • ケーキは生活必需品じゃない、生活必需品じゃないものを売るお店にどうやって足を運んでもらうか
  • 京都はおいしいものやお店が多い。激しい競争。上質が求められる。うちに何を求められているか?は考えないといけない
  • あれこれ言っているけど結局は自分のおいしさへの感覚とお店の全体感の追求。古びてランクを落とさないように
  • 秋は楽しみな季節。食材がおいしい。新メニューのアイデアはまだない、いつもひらめき。メニューは最初からそんなに考えない。その時のよいものを使ってひらめきにまかせる
  • ひらめいて手を動かしてトライアンドエラー。ひらめくには日々なにかやっていないといけない。季節ごとの新作は毎回その連続。同じものは出さない
よいお話が聞けた。ものをつくって価値をつけて値付をして、お客さんに常に喜んでもらうステップはこうなのだ。

ふたつめのケーキを食べ終えてごちそうさまの挨拶をしたら「そんなに楽しそうに食べてもらえると作り甲斐がありますわ〜」笑ってそんなことを言われた。ケーキのおいしさはもちろん、柿本さんのもの作りに込められた思いがしあわせだった。お客さんや自分や自分のお店のためにケーキ作りへの気持ちが込められていた。こだわりを追求すればするほど前向きな欲が出てくるのだろう。アインシュタインが同じ意味合いの言葉を残している。

おいしいケーキを作るために食材はこれにしよう、こういう層のお客さんに味わってほしいからお店はこんな雰囲気にしよう。道具や食器はこれで、ケーキに合うおいしい紅茶を淹れて、お客さんの表情が見渡せるカウンターにしよう。グラスは美しい状態を保つために熱湯に通して乾燥。そして余裕があれば季節の花を飾って..。お店で使われているカトラリーはCutipolだった。

 好きだなーいいなーと思うものを知り、そこにいて楽しいなしあわせだなーと思える時間や場所に身を置いていたい。そのためには作り手の美学や価値についてちゃんとわかる自分でいないといけない。知ることがまだたくさんある。

以下はつい先日いただいたピスタチオのケーキ。ピスタチオの香りを楽しみながら食べるうちに中からフランボワーズが再び登場する。上品な甘さで繊細な味。
https://www.instagram.com/p/BfVD5vbFmEv/
ピスタチオとフランボワーズのケーキ

ああーしあわせ。そろそろ睡魔にきてほしい。4:50am. まだ夜。

ものとの出会いや自分の時間について

ものとの出会い

情報誌や雑誌はほとんど見ない。出かけた先で目にした偶然の出会いに強く影響を受けている気がする。例えば、好きなカフェやケーキ屋さんで使用しているお皿やカトラリーや器具。珈琲店でマスターが付けているエプロンや、カウンターに置かれている雑誌のどこかの頁とか。
お店で見かけたものやひとが素敵だなと思った時に参考にすることはしょっちゅうで、気が向けばメモをする。

身の回りのもの

使う愉しみがあるもの - Words fly away, the written letter remains.
機能性重視で飽きがこないものを選ぶ。頻繁に使ったり目にするものだから気に入った好きなものを使いたくて、これだ!と思えるものが見つかるまで基本的に買わない。気に入れば壊れるまで何年でも使い続ける。洋服も同じ。ものの経年変化が自分と重ね合っている気がして、その感覚が好き。
部屋に置く装飾の類はほぼ手に取りません。見るだけ。以前エジソンバルブの暖色が気に入っていくつか買ったけれど結局使わなくなってしまった。彩りとして、自分は季節のお花と育てている多肉植物で満足しますが、客観的に見るとかわいげがなく殺風景かもしれない。
リードディフューザーと掛け時計とソファカバーとクッションはお気に入り。昨年秋に掛け時計の短針が動かなくなり、思い切ってARNE JACOBSENのStation を購入した。デンマークの鉄道駅で採用された時計で視認性が高くスタイリッシュなの。スイスの国鉄で使用されているMONDAINEと迷って、こちらは我が家にすこしゴツい気がして Stationに決めた。いずれも実物を見て素敵だ〜と思ったもの。
ソファカバーはセールで購入できたカーテンと同色のベージュ。クッションカバーはただの白。
家具屋や雑貨売り場(コンランショップとか)のウィンドウショッピングは好き。これを部屋に置いたらどうかな?の妄想はよくする。

身に付けるもの

着るものについての思索 - Words fly away, the written letter remains.

服づくりのコンセプトやスタッフのかたの対応を重視している気がする。たんに新作をおすすめされるのではなくて、服が作られた思想や素材について教えてもらえるお店やスタッフを信頼している。長く着たいからデザインよりも素材や細部重視。そしてサイズ感。
なかなか冒険できずいつも似た服を着ているが、自分にフィットするものを選ぶことは好きなのでたいてい試着をして決める。試着時のやりとりは、自分とお店や洋服との相性を知れる機会になる。そういえばよくお店のスタッフに間違えられて、その度に、すみませんわたしお客なんですえへへ〜としている。

アクセサリーは毎日おなじ一粒のピアスと祖母に譲ってもらったオーセンティックな指輪を小指につけてお守りにしている。化粧品にはびっくりするほど関心がなくて、装飾に興味が薄いのと関係しているのかしら?美しい人をみてうらやましいなぁと思うけれど、真似したいなとはならず、顔を洗って肌荒れしませんように!程度のことしかしていない。つい自分が楽できる居心地重視を優先してしまう。

自分の時間

わたしの多くを形づくっているのは、時間の過ごし方なのかなぁと思える。
仕事をして帰宅してご飯と後片付けをしてお風呂で平日は終了。休日は本を物色したり理由なく街をぶらぶらと歩いて飲食していることが多い。好きなお店をのぞいてスイーツを食べたりおしゃべりをしながらの散歩は最高。京都の街はこじんまりでおいしいお店がたくさんあり、ちょっと歩けば文化や歴史が感じられて幸せだ。

観察好きなので、ふらっと出かけたとしても飽きることはありません。
カフェで使われているお皿やカトラリーにこだわりが感じられると、ここのオーナーさんは味覚だけじゃなく五感ぜんぶでお店に居る時間を楽しんでほしいと思っているのだなと想像する。穏やかな空気を纏っていて、自分の好きなものや本質を重視するような言動が感じられるひとには目がいってしまう。優しいひとは安心感があって幸せな気持ちを連れてきてくれる。場所やひとの細部や深部から滲み出る魅力みたいなものに惹かれる傾向にある。居心地がよいと通いたくなる。

家で過ごす時間はもちろん好き。週末どちらか1日は家でゆっくりしていたい。寒い季節にはFortnum&MaisonのChai茶葉でチャイを作って飲む。少し手間をかければお店並みにおいしい。
昨年の一時期はゲームをやっていたけれど、いまは漫画や本を読んでいる時間が楽しい。読書をして気に留まる一節があればノートに転記をする。字や手紙を書く時間は気持ちが落ちつくので大切。
就寝前にやる1日の振り返りを日課にしている。うれしい出来事を追体験して噛み締めたり(あーん)内省したり、その日にあったことを思い巡らせる。いろんな感情と向き合うことになるのでいい時も悪い時もあるけれど習慣になった。
特別なことをしなくても、のんびりと妄想ができたり他愛ない時間がリフレッシュになっている。寛げる好きな場所で自分の時間を過ごしていたい。
うれしいなぁと思うコメントをいただくことがたまにある。自分のどこがとびっくりするが、自然体で好きな時間とものと人たちの近くでマイペースにやっていきたい。

むすび

離れた場所で新しい生活をスタートされた友人から届いたお便り(うれしい)がきっかけでこのエントリを書きました。
「どのようにものと出会い、手にとっているのか?」「なりたいイメージだ」とのメッセージは、自分が素敵なひとに対して思っていたことで、なんだかとてもうれしくなって何度も読み返しました。人間てうれしいときは小躍りするものですね。

素敵なひとを見つけた時に感じるのは「自分の好きなことや似合うものをよく知っているのだな」「自分の時間をもっているのだろうな」ということです。流行や周りの喧騒に流されることなく自分をゆったりと生きているように見える。わたしもそうありたい。健やかに穏やかに感性豊かに生きてゆきたいものです。