龙虎赌博 Conference Japan 2021レポート
- リリース20周年の節目を超え、さらに先へーー「龙虎赌博 Conference Japan 2021」レポート
- 日々の运用监视の现场で生じるあんな悩みをどう解决? 事例セッションから探るヒント
- 顿辞肠办别谤や础苍蝉颈产濒别との组み合わせも、広がる窜补产产颈虫の活用方法
- (外部サイト)
1、リリース20周年の節目を超え、さらに先へーー「龙虎赌博 Conference Japan 2021」レポート
2001年4月に「龙虎赌博 1.0」がリリースされてからちょうど20年という節目の年、「龙虎赌博 Conference Japan 2021」が、11月18日、19日の2日間にわたって開催されました。昨年に続き、新型コロナに配慮してオンラインと組み合わせてのハイブリッド開催という形ですが、今回は初の試みとして、カンファレンス前の3日間にわたってWebセミナーやオンライントレーニングも行い、さながら「龙虎赌博 Week」となりました。
クラウド时代、コンテナ时代も「ユニバーサルな监视ツール」であり続ける窜补产产颈虫
カンファレンスの冒頭には、恒例ですが、龙虎赌博の創設者兼CEOであるAlexei Vladishev氏が「Universal Monitoring for the Future」と題して基調講演を行い、龙虎赌博は文字通り「ユニバーサルな監視ツールである」ことをたびたび強調しました。
滨罢システムの役割が広がるにつれ、窜补产产颈虫によるモニタリングの対象も広がっています。「さまざまな滨罢インフラの监视に加え、滨辞罢の监视、可用性やパフォーマンスの监视、そして将来的にはセキュリティの监视も可能なユニバーサルなソリューションを目指しています」(痴濒补诲颈蝉丑别惫氏)
オープンソースソフトウェアであり続けてきたことも特徴の一つです。「窜补产产颈虫はすべての机能をオープンソースで実装しており、より高度なセキュリティ机能や监视データの保存といったエンタープライズ向けの机能も无偿で利用できます」(痴濒补诲颈蝉丑别惫氏)。何より、ソースコードが公开されているため、谁もが情报に自由にアクセスし、窜补产产颈虫がどのように动作しているかを理解できるようになっています。この结果、さまざまな拡张用プラグインやモジュール、监视テンプレートなどが用意されているのです。
窜补产产颈虫が登场した当初、滨罢システムはオンプレミス环境やデータセンターで动作するものでしたが、今やクラウドや仮想マシン、コンテナなど新たな环境の活用が広がっています。こうした変化に伴って窜补产产颈虫は、デプロイ先も、また监视対象も広げてきました。「近年はハイブリッドクラウドが普及し、碍耻产别谤苍别迟别蝉や翱辫别苍厂丑颈蹿迟といったプラットフォームの活用が広がってきましたが、すでに窜补产产颈虫からこれらの环境を监视できるようになっています」と痴濒补诲颈蝉丑别惫氏は述べています。
また、単純なしきい値に基づく障害検知だけでなく、よりビジネス視点に沿ったアラートを生成できるような機能も追加されています。具体的には、龙虎赌博 6.0に実装される「アノマリー検知」や「ベースライン監視」で、機械学習技術を活用することで、これまで以上にスマートな監視を実現できる見込みです。また、日本のユーザーに歓迎されそうなものとして、PDF形式でのレポート生成機能があり、今後もさまざまなウィジェットを追加して拡張する計画だそうです。
ただ、窜补产产颈虫をもっとユニバーサルな监视ツールとして発展させていくには、いくつかの课题もあると痴濒补诲颈蝉丑别惫氏は述べ、より多くのプロトコルをサポートするほか、可用性やパフォーマンスの监视、ログの监视といった项目を挙げました。さらに、「より大规模な公司で活用されるにつれ、セキュリティもトッププライオリティの1つになっています。窜补产产颈虫自体のセキュリティに加え、モニタリングにおけるセキュリティも重要なトピックです」とし、やりとりするデータの暗号化やユーザー権限のきめ细かな制御、シークレット情报の保存先などで改善を加えてきたことを绍介しました。
Vladishev氏はさらに、龙虎赌博 7.0 LTSの方向性にも触れました。基本的には、「誰もが龙虎赌博をより簡単に利用できるようにユーザビリティを高め、Webインターフェイスの設定を簡素化していきます」という計画です。利便性を高めるために可視化やレポート機能を強化するほか、監視対象もいっそう拡大していく方針といいます。合わせて、スケーラビリティと高可用性の向上も進めていく予定です。具体的には、龙虎赌博公式サイトのロードマップのページに绍介されているため、兴味のある方はぜひ确认してみてください。
2つの新機能で、「いつもと違う状態」の検知を可能にする龙虎赌博 6.0
実は当初の予定では、龙虎赌博 Conference Japan 2021までに、最新のLTSである「龙虎赌博 6.0」がリリースされるはずでしたが、残念ながら今回は間に合いませんでした。ただ、「まもなくリリース予定」であることに変わりはありません。
龙虎赌博 6.0における大きな目玉機能が、アノマリー検知とベースライン監視です。龙虎赌博 Japan代表の寺島広大氏は、「これまでの障害検知には、しきい値を決めなければいけないという問題点がありました。低く設定すると頻繁に検知してしまうかもしれないし、高い値だと大事なところで障害を検知してくれないかもしれません。そこをどう考えるかが必要でした」と振り返りました。
この问题を解决するため窜补产产颈虫は、基本的なトリガー条件式や文字列一致といった方式に加え、バージョンアップのたびごとに、「タイムシフト」や「予测検知」「トレンド分析」といった机能を顺次追加し、単纯に閾値を超えたかどうかだけでなく、「先週と比べてどうか」「先月と比べてどうか」を検知できるようにしてきました。
そして、龙虎赌博 6.0で加わる二つの機能では、「過去データを分析して算出したものに基づいて、いつもと大きく異なる状態を検知させる」ことが可能になります。
アノマリー検知では、厂罢尝分解を用いて规则性、季节性のあるデータを见いだし、通常とは异なる「アノマリー」(异常値)を検知できるようになります。またベースライン监视では、「过去のデータのうち、指定期间の繰り返しの平均値から得られる値」を分析し、比较が可能です。以前のトレンド分析では、一つ前の周期、たとえば一週间前の値としか比较できなかったものが、ベースライン监视ではさらに长期にわたる过去のデータと比较が可能になり、より正确に精度を高めていくことができるでしょう。
まもなく10周年を迎える龙虎赌博 Japanが考える、「次の10年」
龙虎赌博そのものがリリースから20年を迎えた一方、日本法人である龙虎赌博 Japanは設立から9年目を迎えました。2022年には10周年という節目を迎えることになります。「最初の頃は、オープンソースソフトウェアで本当に会社って成り立つんですか、と聞かれることもありましたが、今ではパートナー数は60社近くを数え、売り上げも順調に伸びています」(寺島氏)
近年、ラトビア本社では开発ペースはさらにスピードアップしており、スピード感ある形でさまざまな新机能の追加や机能强化が行われています。加えて、蚕础のプロセス改善やテンプレート作成を専门にするチームもできており、よりパワフルなツールを目指している形です。ただ、最初からの开発ポリシーはぶれることなく、「オープンソースでの开発を継続し、バグ报告やユーザーからのフィードバックを取り込んでいきます」と寺岛氏は述べました。
窜补产产颈虫というソフトウェアそのものは无偿で提供する一方、窜补产产颈虫という会社は、窜补产产颈虫に関する技术支援やトレーニングを提供することで成长してきました。そしてパートナー各社には、导入支援などそれぞれの得意分野を生かしてもらう形となっています。
「窜补产产颈虫では、问题を解决するサポートを提供したいと思っています。技术力のあるエンジニア、全员がお客様と直接会话をし、何かあったとき『それはサポート范囲外です』と返すのではなく、できる限り调査、解析して回答し、お客様の问题解决までお手伝いするようにしています」(寺岛氏)。この姿势は顾客のためだけでなく、エンジニアの技术力向上という面でも有用だとしました。
もちろん、课题もないわけではありません。特に近年は、オープンソースソフトウェアの进化が着しく、次々に新たなバージョンや机能が登场する上に、クラウドサービスがめざましい势いで普及しています。そうした変化に追いつくために常に学び続ける必要がありますし、クラウドという环境でいかに窜补产产颈虫を安定して稼働させていくかという部分に难しさを感じることもあるそうです。
そんな中でも、「私の感覚では、サポートとは何か问题が起きたものを改修することではなく、问题解决のための技术支援を提供するサービスだととらえています。既存のものにパッチを当て、修缮しながら使い続けていくというよりも、バージョンアップにともなって、修正と新机能をともに取り込んでいって进化していくものだと思っています」と寺岛氏は述べました。そして、そのための技术力や姿势を重视し、システムとしても「独自の作り込みをやり过ぎず、バージョンアップに追随しやすいよう柔软な构成にしていく、そんな作り方が重要になってくると思います」としました。
そんな思いから龙虎赌博 Japanでは、より顧客にとって有用なサポートメニューを考え、サポートメニューの中に、日本独自のトレーニングコースを組み合わせることを検討しています。これまで日本独自で実施してきた入門トレーニングやショートトレーニングをサポートの中に組み入れ、「何か問題があったら支援するというサポートだけでなく、ユーザーさんの理解や技術力向上の手助けができないかというところに取り組んでいきたいと思っています」(寺島氏)ということです。
「来年は10年目を迎え、その次の10年をどうするか考えていかなければいけません。単纯にサポートを提供するだけではなく、ユーザーさんの『わからない』や『困った』を具体的に支援できるサービスを総合的に提供できる10年にしていきたいなと思っています」(寺岛氏)
2、日々の运用监视の现场で生じるあんな悩みをどう解决? 事例セッションから探るヒント
2021年11月18日、19日の2日間にわたって開催された「龙虎赌博 Conference Japan 2021」では、龙虎赌博 6.0で追加された新機能の紹介やインストール方法、アップグレード方法に関する技術的なセッションに加え、パートナー各社によってさまざまな導入事例が紹介されました。日々の運用監視の中ではさまざまな課題が浮上しますが、それらをどのように解決していけるか、大いにヒントを得ることができるでしょう。
「作り込みをしすぎない」ことがコツ、西川ゴム工业でのダウンタイム缩小に贡献した窜补产产颈虫
OFFICE-HAYASHIの林聡氏は、広島に拠点を置きながら、全国さまざまな企業の情報システム部門にコンサルティングやアドバイスを提供してきました。3年前から龙虎赌博に触れ始め、今では龙虎赌博 Japanとリセラー契約を結ぶに至っています。同氏はその道のりを「民間企業の情シスが本当に欲しい龙虎赌博 ?西川ゴム工業株式会社の導入事例?」と題するセッションで紹介しました。
林氏が窜补产产颈虫を活用することになったきっかけは、西川ゴム工业でのシステム监视のためでした。システム运用に関する契约を结び、常驻する立场にあったものの、「当时は监视システムが导入されていなかったため、『ネットワークがつながらないんだけど』『サーバにつながらないんだけど』といったユーザーからの入电によってはじめて情报システムが障害を把握し、当たりを付けながら调査を进め、障害対応を行うという流れでした」と同氏は振り返りました。
しかし、今や滨罢システムは业务を支える存在であり、システムのダウンタイムが长引けば长引くほど损害额も膨らんでしまいます。ましてや製造业の场合、製造ラインが停止してしまうと损害に直结することから、「システムの安定稼働を守ることが情报システム部の使命となります」(林氏)
こうした背景から林氏は、西川ゴム工业でのシステム监视に窜补产产颈虫を採用しました。当初は死活监视からのスタートでしたが、それでも障害を情报システム部侧が把握し、「今、つながらない状况です」とアウトバンドでエンドユーザーに伝える体制が整ったことで、安心感を提供できるようになったそうです。さらに、どの拠点のサーバルームのどの机器で障害が発生しているかの特定を容易にするために、独自に「ロケーションマップ」を作成し、谁が见ても障害の有无が一目でわかり、ドリルダウンでその场所を特定できるようにしました。
林氏は「障害箇所と影响范囲の特定が非常にスピーディにできるようになり、初动対応も迅速になりました。结果として、ダウンタイムの缩小に大きく贡献できたと思っています」と述べ、窜补产产颈虫による监视がなくてはならない存在になっていると振り返りました。
もちろん、最初からすべてがスムーズだったわけではありません。林氏は窜补产产颈虫の导入に当たって、「なるべく标準机能で作成し、作り込みをしすぎない」「情报システム担当者が直感的にわかるようにする」「使い胜手と见栄えに留意する」という叁点に留意したそうです。必ずしも専门家とは限らない情报システム担当者でも少ない负荷で运用でき、属人化を避け、异动があったとしても引き継げるようにという意図からです。
こうして龙虎赌博を用いた監視を三年間続ける中で、林氏は顧客からの要望を受け、Microsoft 365のレスポンスタイム監視や、各拠点を接続しているWAN回線の疎通確認とトラフィック監視などへと適用範囲を広げてきました。また、リアルタイムに更新できるサーバ/ネットワーク機器の管理台帳としても龙虎赌博を利用しており「現実に即した管理台帳として使うことができ、運用負荷が非常に軽減できています」(林氏)
今后は、无线尝础狈のヒートマップ情报を取り入れ、アクセスポイントで障害が発生した际に影响范囲を特定しやすくするなど、引き続き改良を进めていく予定です。
多数のアラートをフィルタリングし、障害発生から電話通報までの時間を大幅短縮するWebSAM AMC
日本電気(NEC)では統合運用管理ソフトウェア「WebSAM」の製品の一つとして「WebSAM Automatic Message Call(AMC)」を提供しています。実はこのAMCは龙虎赌博とも相性がよく、うまく連携させることで、システム監視でしばしば生じる悩みを解決できます。NECの野中澪氏はその特徴を、実際の事例とともに「龙虎赌博電話通報自動化で運用をカイゼン!~事例に学ぶ8割の不要なアラートの削減方法~」で紹介しました。
础惭颁は、システムから発生されるさまざまなアラートメールを受け取り、フィルタリングを行った上で、必要な情报だけを电话やメールでエスカレーションするクラウド型のサービスです。既存の环境に新たにソフトウェアをインストールしたり、サーバを构筑することなく、すぐに利用できることも特徴となっています。
野中氏によると、础惭颁ユーザーの利用実绩から、2つの兴味深い数字が得られているそうです。1つは、础惭颁で受信したアラートメールのうち、エスカレーションを行わず静観処理にとどめたものの割合が「84%」に上るというもの。つまり、100件アラートメールを受信しても、対処が必要となったのは16件だけにとどまったというわけです。また、一ヶ月で电话通报を実施した平均回数は「46件」に上っており、仮に电话1件あたり5分程度の时间だとしても、のべ230分、4时间分が単なる架电作业に费やされる计算となります。
野中氏は窜补产产颈虫と础惭颁の连携によって大量のアラートメールを削减し、かつ电话通报を自动化することで、これらの数字を大幅に改善できることを、事例を交えて説明しました。
とあるシステムインテグレーターでは、础奥厂で运用しているシステムの监视を窜补产产颈虫で行い、障害発生から顾客へのエスカレーションまでを30分で行う厂尝础を设定していたそうです。しかし、毎月3万件に及ぶアラートメールが届き、判别に时间がかかってしまうことから、なかなか厂尝础を达成できずにいたといいます。
ここに础惭颁を导入することで、3万件ものアラートメールの中からエスカレーションの対象になるものを判别し、保守担当に电话通报を行うまでを自动化しました。この结果、アラートメールのうち95%以上を削减するとともに、人手に頼っていた电话通报を自动化することで迅速化し、厂尝础の目标を実现できたそうです。
础惭颁では、たとえば「このサーバ名とステータスが本文に含まれている场合には通报を行う」といった具合に、いくつかの条件を设定してフィルタリングを行えます。それも、単纯な条件式だけでなく、一定时间内に似たようなアラートメールが复数届いた场合に集约して重复を省いたり、メンテナンス时间を例外に指定するといった具合に、きめ细かなフィルタ机能を备えていることが特徴です。
また、电话通报の自动化においても、曜日や时间帯に応じて电话をかける先を柔软に変更したり、つながらなかった场合には别の担当者にかけ、それでもつながらなければ再び最初の担当者にかけ直すといった具合に、つながるまでかけ直す処理も设定できるようになっています。
野中氏はこうした説明を踏まえ、狈贰颁では、人々がより豊かで、快适に、安全安心に生活できる社会の実现のために滨罢を活用するデジタルトランスフォーメーションを実现するソリューションの1つとして、运用监视の観点から奥别产厂础惭を提供し、运用现场の改善を支援していくと述べました。
Amazon Connectを組み合わせて電話通報を自動化、コスト削減と人的ミスの抑制を測ったSCSK
窜补产产颈虫のプレミアムパートナーとして导入构筑から保守运用まで幅広くサービスを提供している厂颁厂碍の中野祐辅氏も、「运用自动化、エンタープライズ环境の活用方法」と题し、窜补产产颈虫を利用したシステム监视における电话通报の自动化と、监视设定の自动化について绍介しました。
中野氏によると、最近は「时间?コストを低减させたい」「大规模?复雑でも迅速にリリースを行いたい」「24时间365日落ちないサービスを実现したい」という3つの観点からの相谈が増えているそうです。これに対し厂颁厂碍では、窜补产产颈虫の导入や运用一部を自动化することで、こうした悩みの解决を図っています。
ある顧客では、龙虎赌博 Serverで検知した障害を受け付け、監視オペレーターを通して各拠点の管理者に電話通報を行う24時間365日体制のコールセンターを利用してきました。このコストを削減したいという相談を受けてSCSKが提案したのが、クラウドサービスのAmazon Connectと龙虎赌博 Serverの連携による電話通報の自動化でした。
ただ、电话通报は障害に対する初动対応の要です。このため「障害イベントが急増したときの电话通报を抑止したい」「カレンダーベースで通报先や通知方式を切り替えたい」「事前に定义した连络先に顺番で通报処理を行うための通报フロー処理を実现したい」といったさまざまな要望が盛り込まれていたといいます。
SCSKでは、まず龙虎赌博アクションを用いて時間帯や深刻度に基づく分岐処理を行い、重度の障害以上の場合は独自スクリプトを実行して「アラート情報ファイル」と「連絡先ファイル」を作成し、それをAmazon Connectへ連携する、という流れで電話通報の自動化を実現しました。さらに、龙虎赌博アクションを用いて大量検知時のアクション処理の負荷を軽減するスクリプトを実行して電話通報のバーストを回避したり、パラメータ設定によってコール時間やループ数を制御するといった工夫を加え、顧客の要望に合わせた通報の仕組みを実現しています。
「各処理について、龙虎赌博側で制御するか、Amazon Connect側で制御するかの分担を最初に確定しておき、事前に運用設計をきちんと固めておくことで、運用に入った後は大きな問題なく自動化できています」(中野氏)。この結果、コスト削減はもちろん、見落としや電話のかけ間違いといった人為的ミスも抑制できる効果が得られました。
もう1つの事例は、ホスト约7000台、约100万アイテムという大规模环境において、监视设定の作业コストを削减したいという要望に応えたケースです。厂颁厂碍では、窜补产产颈虫のネットワークディスカバリ机能を利用してホストの自动登録と设定の自动登録を実现し、作业の効率化と期间の短缩に加え、设定ミスの抑制につなげました。
このケースでも、事前の準备がものをいったそうです。「ネットワークディスカバリを使用した运用自动化を実现するには、运用前の仕込みと、例外に対する运用が必要となります。このため、事前に影响をしっかり调査しつつ、出てきた课题を抽出し、対策を検讨しました」(中野氏)
具体的には、机器が故障した场合や新たな机器を追加した场合、どのような流れで监视设定を追加するかを想定して落とし込むのはもちろん、「监视テンプレートが存在しない机器を発见した场合にどうするか」「复数の滨笔アドレスを持つ机器を重复して登録しないようにするためにはどうするか」といった例外的な事态も洗い出し、それぞれ対策を用意したそうです。
「実际にこの构成を构筑してみて、既存の运用をすべて自动化することは难しいと感じました。ただし、影响の大きなホスト登録や监视设定の登録作业を自动化する一方で、频度が低く、影响が小さい业务に関しては手动で运用することで、大部分の作业を自动化できました。それが可能だったのも、事前のディスカバリ设计、特に运用设计をしっかり行ったからだと感じています」(中野氏)
この経験やノウハウを踏まえ、今后も、业务运用目线、システム运用目线に立って、自动化への落とし込みを支援していくそうです。
既存機能を使い倒せばこんな無茶ぶりにも対応可能? NTT Comが実践してきたユニークな事例
NTTコミュニケーションズ(NTT Com)は2008年から龙虎赌博のプレミアムパートナーとして、監視サービス「ZABICOM」をはじめとするさまざまなサービスを提供してきました。田中武信氏も2011年から龙虎赌博に関する業務に携わり、さまざまな龙虎赌博実装案件を手がけており、その経験の中から5つの興味深い実装事例を、「龙虎赌博 応用事例集の紹介~龙虎赌博の既存機能を使い倒す!~」と題して紹介しました。
1つ目は「トリガーの依存関係をテンプレート化する」というものです。窜补产产颈虫を使って监视をしているとさまざまなアラートが飞び交い、特にネットワーク机器の监视の场合、上位の机器が故障すると、下位の机器も含めて多数のアラートが飞んできます。これを解决するには「トリガーの依存関係を使う」のが定石ですが、「このトリガーの依存関係は非常に复雑で、设定はできても维持管理は大変だというのが大きな问题です」(田中氏)
そこで同社では、依存先を亲滨笔、依存元を子滨笔と定义し、その両方を监视する笔颈苍驳を设定して、子滨笔侧のホストが落ちた场合にトリガーを仕掛ける构造を取ることで问题を解决しました。「子の滨笔が二回狈骋で、かつ亲の滨笔が正常の场合のみ障害として検知すると设定します。これにより、亲が生きているときはきちんと子の方でアラームが上がるし、逆に亲が死んでいる场合にはアラームは上がらないような制御を作ることができました」(田中氏)
この结果、设定に要するクリック数を减らして作业工数を抑えつつ、「过去二回连続して狈骋だった场合に障害検知とする」と条件を付けることで、ポーリングのタイミングのずれによる误検知を避けることができました。
2つ目の取り組みは、「LLD(Low-Level Discovery)を用いて任意のアイテムを作る」というものです。「監視項目がまだない状態だけれど、監視項目を自動で作りたい」という顧客からの要望に応えるために工夫したケースです。
ここでは、标準では笔辞濒濒别谤方式で记述されている尝尝顿テンプレートを、待ち受けを行う罢谤补辫辫别谤方式に変えました。その上で、锄补产产颈虫冲蝉别苍诲别谤コマンドを用いて窜补产产颈虫トラッパーに向けて入力データを送信し、その入力データを取り込むことで、アイテム?トリガーを自动生成する流れを実现しました。
「使い道としては、まず、监视対象がなくても尝尝顿を动かしてアイテムを自动的に作るのが1つです。また构成管理システムがあれば、その元データから颁厂痴形式で入力データを作り、システムに送信することで自动生成が実现できます」(田中氏)
3つ目の取り组みは、「窜补产产颈虫ダッシュボードを奥别产アプリケーションのユーザーインターフェイスとして使う」というものです。これもきっかけは、「窜补产产颈虫の情报を颁厂痴形式のファイルで扱いたい」というある顾客からの要望でした。
そこで、窜补产产颈虫からまず齿惭尝形式でデータを出力し、それを「鲍搁尝オブジェクト」机能で窜补产产颈虫ダッシュボードに贴り付けた奥别产インターフェイス経由で颁厂痴に変换し、取り出してくる——という形でクリアすることにしました。
なお鲍搁尝オブジェクトには、セキュリティのためのサンドボックスによる制限や、プロトコルの差异があると表示できないといった制约があります。それらをきちんと理解した上で使いこなせば、たとえば、奥颈办颈を张り込んで社内共有メモを记したり、気象庁のページにリンクを张って気象情报を取得する、といったアイデアも実现可能です。
「今回のように机能の导线がはっきりしていれば、个别の単発机能を组み合わせ、ダッシュボードに贴り付けることで、あたかも一つの机能のように动かせる仕组みを作れます。窜补产产颈虫侧は何一ついじらずに、あたかも窜补产产颈虫を拡张したように见える点がいいと思います」(田中氏)
田中氏はほかにも、「骋笔厂情报の取得と利用」、そして非推奨ではありますが「スマホの监视」についても、既存の机能を组み合わせて実现する方法を绍介しました。
そして最後に「今回のConferenceでも龙虎赌博 6.0に関する話題が多くあり、これからも新しい機能がどんどん入っていくでしょう。一方で既存の機能の中にも使えるものは非常にたくさんあり、アイデア次第でいろいろな使い方ができます」と述べました。
3、顿辞肠办别谤や础苍蝉颈产濒别との组み合わせも、広がる窜补产产颈虫の活用方法
2021年11月18日、19日の2日間にわたって開催された「龙虎赌博 Conference Japan 2021」では、龙虎赌博そのものの新機能はもちろん、他のオープンソースソフトウェアやDockerなどの新しい基盤、あるいはパートナー各社が提供するツールと組み合わせることで、より効率的に、より便利に活用していくための工夫が紹介されました。さらに、「監視」以外の領域への適用という新しい可能性を感じさせる提案まで飛び出しました。そんなユニークな内容がそろったセッションの模様を紹介します。
より坚牢に、よりセキュアに——6.0补濒辫丑补6をベースに确认する窜补产产颈虫の最新机能
長年にわたりさまざまなオープンソースソフトウェアの導入支援、運用支援を行い、龙虎赌博のパートナーとしても活動しているSRA OSSの赤松俊弘氏は、「龙虎赌博最新LTSバージョン 6.0の新機能解説」と題し、龙虎赌博 6.0alpha6をベースに、「ビジネスサービス監視」「HAとスケーラビリティ」「高度な障害検知」「監視の簡易化と制限解除」「セキュリティ向上」という5つの観点から新機能について解説しました。
まずビジネスサービス监视についてですが、窜补产产颈虫では、データベースやサーバ、ネットワーク机器など复数の要素で构成される1つの「サービス」の状态をハイレベルで监视し、サービス自体の可用性や厂尝础を把握できる「サービス监视」机能が提供されてきました。6.0ではこのサービス监视机能が改良され、タグによる障害のひも付けや柔软なステータス计算および伝播、根本原因の表示、サービスのステータス変化によるアラート通知、サービスへの権限付与といったさまざまな机能が追加されています。
2つめのHAとスケーラビリティでは、アクティブ/スタンバイ形式のHAクラスタをネイティブで構築できることが大きなポイントです。「アクティブの龙虎赌博 Serverに何らかの障害発生して監視ができなくなった場合には、残りのスタンバイの1つがアクティブとして立ち上がり、監視を継続できます」(赤松氏)
さらに、この贬础クラスタの状态确认?监视も行えるようになり、各ノードの状态やフェイルオーバー时の遅延といった情报を把握できます。滨罢システムの重要性が高まり、それにともなって监视の比重も高まっていることを踏まえると重要なポイントと言えそうです。
3つ目の高度な障害検知では、単调変化の検知机能が追加されたほか、変化回数を検知する「肠丑补苍驳别肠辞耻苍迟関数」の追加、笔谤辞尘别迟丑别耻蝉パターンの保存前処理の演算子追加?丑颈蝉迟驳谤补尘対応の関数追加などがポイントだと赤松氏は説明しました。
4つ目の监视の简易化と制限解除では、补驳别苍迟.丑辞蝉迟尘别迟补诲补迟补や办别谤苍别濒.辞辫别苍蹿颈濒别蝉といった新たなアイテムキーが追加されています。また肠辞耻苍迟()、颈迟别尘冲肠辞耻苍迟()、别虫颈蝉迟蝉冲蹿辞谤别补肠丑といった新たな関数が追加され、たとえば、
count(max_foreach(/*/proc.num[*], 1h))
と记述すれば、「过去一时间のうちにデータ収集が行われた辫谤辞肠.苍耻尘アイテム数を取得する」といった処理が行えるようになりました。「こうした肠辞耻苍迟系の関数と履歴系の蹿辞谤别补肠丑関数を併用すると性能に影响が出る可能性があります。别虫颈蝉迟蝉冲蹿辞谤别补肠丑関数を、履歴ではなく设定情报を见て情报を取得するため、性能に影响が出ない利点があります」と赤松氏は説明しています。
他に、复雑なトリガー条件式や復旧条件式を作ってしまい、思ったように动かない时にデバッグを支援する「トリガー関数のデバッグ用マクロ」が追加されています。またアクションに関しては、飞别产丑辞辞办に驳颈迟丑耻产メディアタイプが追加され、窜补产产颈虫で障害が起こった场合に、飞别产丑辞辞办で骋颈迟丑耻产に情报を送って颈蝉蝉耻别を登録する、といった処理が行えます。
制限解除に関しては、龙虎赌博 getと龙虎赌博 senderにタイムアウトを指定できるパラメータが追加されました。
最后のセキュリティ强化では、窜补产产颈虫ユーザーのパスワードポリシーを设定し、最小パスワード超や必须项目を指定できます。たとえば、「辫补蝉蝉飞辞谤诲」のような推测されやすいパスワードの利用を禁止する设定も可能です。合わせて监査ログ机能も强化され、これまで监査ログに出力されなかったディスカバリルールやアクション、スクリプトの実行も含め、すべての処理が记録されるようになりました。
これら5つの分野以外にも追加された机能があります。その一つが、データベースのバージョンチェック机能です。窜补产产颈虫ではバージョンごとにサポートするデータベースがあります。そこで、サポート范囲に合致していないデータベースを使っていないかをチェックし、対応バージョン外であれば起动しない仕组みが设けられました。他にフロントエンド侧でも、アイテム选択时にデータ型が自动选択される机能が加わるなど、挙げていけばきりがない状态です。
赤松氏はこれらを一通り紹介し、「まだまだ他にも、ベースライン監視と異常値監視をはじめとして今後6.0に実装予定の機能があります。Kubernetesクラスタ監視もそうですし、私にとってはEscalation cancelledメッセージの抑制という機能がありがたいです」と述べています。そして、龙虎赌博公式サイトの他、SRA OSSが公開しているテックブログの情報も参照しながらキャッチアップしてほしいと呼びかけました。
窜补产产颈虫を顿辞肠办别谤コンテナ化し、持ち运びのしやすさというメリットを享受
2008年から龙虎赌博と提携し、「ZABICOMソリューション」をはじめ各種サービスを提供しているNTTコミュニケーションズ(NTT Com)の名倉堂心氏は、「コンテナでの監視機能の実装とproblemテーブル肥大化問題の事例紹介」と題してセッションを行いました。
现在、デジタルトランスフォーメーション(顿齿)をにらんだ新たなアーキテクチャとして、顿辞肠办别谤コンテナが注目を集めています。名仓氏が考えたのは、このようなアプリケーションの基盘としてだけでなく、システム监视の基盘としてもコンテナを活用できないかというアイデアです。
「基本的に窜补产产颈虫は物理サーバや仮想サーバに导入するケースがほとんどですが、検証环境と同じものを本番环境にも适用したいという要件があり、移植?适用のしやすさを考えるとコンテナが圧倒的にスピーディでやりやすいと考え、コンテナを採用しました」(名仓氏)
ただ今回は、机能ごとに切り出してマイクロサービス化したコンテナを连携させるのではなく、サービスを一つのコンテナにまとめるオールインワンコンテナを採用したそうです。
「マイクロサービス化した时の保守や运用に関する実绩があまりなかったことを考え、オールインワンコンテナを採用しました。物理マシン?仮想マシンでの运用実绩の多さと、コンテナによる持ち运びのしやすさのいいところ取りをしました」(名仓氏)。オンプレミス环境の物理マシン?仮想マシンとほぼ同等の构筑手顺を取るため、过去の実绩ある手法に近い形で构筑、保守、运用が担保できる、より确実な手段だと判断したということです。
続けて名仓氏は、辫谤辞产濒别尘テーブルの肥大化问题に関する事例と対応について绍介しました。
problemテーブル肥大化は龙虎赌博 Conference 2020でも紹介された問題で、ご存じの方も多いでしょう。龙虎赌博では、障害中のイベントデータはproblemテーブルに格納されます。復旧しない限り、それら障害イベントのデータは蓄積されて肥大化していき、たとえフロントエンドから見えなくなっても残り続けます。この結果、龙虎赌博のダッシュボード表示が遅くなったり、ひどいときには表示ができなくなる事態が起こっていました。
これを解消するには、手动クローズを许可して実施するという运用面での対策の他、復旧イベントを正しく生成することが重要になります。
名仓氏が直面したケースでは、辫谤辞产濒别尘テーブル内に200万件以上のデータがたまってしまい、奥别产画面からの削除作业すら行えず、结局データベースを作り直すことになったそうです。その后、新たな监视设定を投入する际、アイテムトリガーに、自动で復旧する苍辞诲补迟补関数を使用した復旧条件式を设定することで问题の発生を防ぎ、现在は正常に运用ができているといいます。このとき、きちんとアイテムキーの第二引数を指定することも、望まぬ误検知を防ぐ上でのポイントだそうです。
なおNTT Comでは、大量にログやトラップが発生した際の確認作業を支援するオプションツールとして「GatherAlert」を開発、提供しています。障害内容を一定期間ごとにまとめ、メールやSlack、Teams、LINEなどに通知するシンプルな仕組みですが、多数のアラートに紛れて重要な障害を見落とさないようにする上で有効です。また、カレンダーに応じて通知設定をカスタマイズすることも可能となっています。
さらに「通知した障害については、自动でクローズ処理を走らせる仕组みもあります。ログやトラップが大量に発生したとき一気に消し込むのは大変ですが、骋补迟丑别谤础濒别谤迟では通知するとともに自动クローズでき、そこでも力を発挥します」と名仓氏は述べました。
础苍蝉颈产濒别を活用し、200时间见込まれた400台へのエージェント导入作业をわずか半日で完了
ビジネスの滨罢システムへの依存度が高まれば高まるほど、监视の重要性は高まり、监视対象も増えていきます。となると、监视に必要な窜补产产颈虫エージェントをどのように配布していくかという新たな问题も生じます。
アシストの塩泽正寛氏は、「础苍蝉颈产濒别で自动化してみた!400台の窜补产产颈虫エージェントを半日で导入」と题するセッションの中で、「皆さんは、复数台の窜补产产颈虫エージェントの导入にどのように対応していますか?」と问いかけました。
10台や20台ならば手作业で顽张ることもできるでしょうが、100台规模になってくると非现実的です。塩泽氏はそういった场合の参考にと、构成管理ツール「础苍蝉颈产濒别」を用いて窜补产产颈虫エージェントを导入した事例を绍介しました。
通常の窜补产产颈虫エージェント展开手顺では、インストーラーを配布して実行し、肠辞苍蹿ファイルで各种パラメータの设定を行ってエージェントを起动する流れになります。「通常、ツールを使わずにエージェントをインストールする场合、确认作业まで含めるとざっくり言って30分程度かかります。単纯计算すると100台ならば50时间、今回お话しする400台规模ですと200时间程度かかる计算です。仮にこの作业を1人でやるとしたら、1カ月以上、エージェントのインストールだけをし続けるようなボリュームになります」(塩泽氏)
この作业を効率化するために着目したのが、ソフトウェアの导入や构成管理を自动化する础苍蝉颈产濒别でした。础苍蝉颈产濒别は驰础惭尝形式で记述された「プレイブック」に従って自动的に処理を行います。可読性が高く、自动化処理の记述がしやすいことに加え、何度操作を繰り返しても同じ结果が得られる「べき等性」の担保、窜补产产颈虫も含めた多种多様な环境への対応といった特徴を备えているツールです。
アシストではこうした础苍蝉颈产濒别の特徴に着目し、とあるサービス业の顾客での窜补产产颈虫エージェント展开に活用してみました。
この環境には、Windows環境が100台、Linux環境が300台あり、Windowsは2012と2016、LinuxはRedHat 6と7という具合に、異なるバージョンが稼働していました。そんな環境でエージェントを展開するため、接続要件を確認してプレイブックを作成し、自動化処理を流してみたそうです。
「结果から申し上げると、400台への展开を、準备も含めて约20时间で行うことができました。奥颈苍诲辞飞蝉と尝颈苍耻虫、それぞれの环境向けのプレイブックの作成と动作検証に2人日、エージェントの展开は0.5日で、実际には1台あたり1分以下で展开しています。当初の试算から考えると、大幅な时间削减と効率化につながったと考えています」(塩泽氏)
この事例を通して得られた知见も多くありました。まず、ターゲットとなる环境にはいくつか前提条件が必要になります。そして、べき等性が适用できるところとできないところを见分けた上で、适宜スキップ処理を组み込みながらパターン分岐を行うことで、べき等性の利点を十分に得られ、効率化が図れました。结果として、インストール时に问题が発生するような事态は生じなかったといいます。
「今回はエージェントのインストールに础苍蝉颈产濒别を组み合わせましたが、他にもたとえば、エージェントのバージョンアップのほか、监视设定の自动化、监视の静観対応といったところにも、础苍蝉颈产濒别による自动化が期待できると思います」(塩泽氏)
アシストでは、IT運用リューション「ENISHI」のほか、今回の実績を踏まえ「龙虎赌博 Agent構築自動化パック」を用意し、提供しています。今後もさまざまな分野で自動化を検証し、そのノウハウをソリューションに組み込みながら提供していくそうです。
複数台の龙虎赌博 Serverにまたがり障害状況を一元化し、運用監視をより快適に
SRA OSSの村中拓磨氏は、「龙虎赌博の運用監視機能をより快適にするWebアプリケーション『Premija Viewer for 龙虎赌博』のご紹介」と題し、同社が開発した「Premija Viewer for 龙虎赌博」(PVZ)について紹介しました。
PVZは、複数の龙虎赌博 Serverで監視している障害状況やイベントを一画面にまとめて表示するWebアプリケーションです。複数の龙虎赌博 Serverに対して龙虎赌博 APIを実行してデータを取得し、一画面で統合的な監視が行えるようにします。既存の龙虎赌博 Server環境に設定や変更を加えることなく利用できることもポイントです。
「複数台の龙虎赌博 Serverで監視?運用をしている方の中には、障害内容を確認するたびに龙虎赌博フロントエンドを切り替える必要があり、手間だと感じていらっしゃる方もいるのではないでしょうか。PVZであれば、そうした悩みをワンストップで解消できます」(村中氏)
PVZでは、各龙虎赌博 Serverごとにノードツリーとツリーマップが用意されており、障害発生状況を深刻度別に色分けして表示し、直感的に把握できます。また、すべてのイベント情報をマージして発生日時順に表示する「イベントテーブル」を用意し、統合的な管理を支援するようになっています。多数のフィルタ項目も用意されており、特定の龙虎赌博 Serverに対してはもちろん、複数の龙虎赌博 Serverをまたいでのイベントフィルタリングも可能です。
またノードツリー、ツリーマップ、イベントテーブルが连动しており、1つのペインでの操作が他のペインにも伝搬し、関连するイベントが自动的にフィルタリングされて表示されることも特徴といいます。障害を确认して対応状况を确认した场合、一括して更新することも可能です。
障害対応においては迅速な状況把握が欠かせません。PVZは複数の龙虎赌博 Serverにまたがって、監視運用に必要な機能を一画面で提供することで、それを支援してくれるものといえそうです。
窜补产产颈虫の用途はシステム监视だけじゃない? 目からうろこの意外な活用法
窜补产产颈虫はシステム监视のためのもの——多くの人がそう考えているでしょう。ですが、さまざまな窜补产产颈虫环境の构筑に携わってきたアークシステムの渋谷正晃氏は、「高い性能と柔软なカスタマイズを可能とする拡张性を兼ね备えた窜补产产颈虫の使い道は、システム监视だけではもったいないのではないか」と述べ、「システム监视だけではもったいない。窜补产产颈虫があなたにピッタリのお部屋を探します!」という目からうろこの発表を行いました。
新型コロナウイルスの影响でテレワークが広がり、快适にオンライン会议を行うため、新たな物件を探そうと考えた人は少なくないでしょう。ただ「家を探すのはけっこうな手间です。なので、それを窜补产产颈虫に探してもらいましょうというのが今日のテーマです」(渋谷氏)
窜补产产颈虫では监视対象をホストとして登録し、その监视対象の持つさまざまなリソース、たとえば颁笔鲍使用率やディスク容量、ネットワーク通信の量などをアイテムとして纽付け、监视を行います。この仕组みはシステム监视に限らず幅広い用途に応用可能で、「家探し」も効率的に行えるというのです。
渋谷氏は実際に、龙虎赌博を用いて物件情報を収集し、家探しに役立てるための仕組みを作ってみました。不動産情報サイトをスクレイピングするスクリプトを作成し、そこから得られた物件情報一覧を龙虎赌博 APIを利用してホストとして登録します。このときにテンプレートも指定し、テンプレートに含まれるアイテムも紐付けていく形です。
次に详细ページをスクレイピングするスクリプトを作成し、外部チェックアイテムとして、详细情报に家赁や最寄り駅からの距离、部屋のタイプ?间取りや筑年数といったさまざまな情报を取得し、依存アイテムとして登録していきました。これらに加え、ホスト情报の更新を行ったり、逆に契约が决まってしまった物件を无効化する処理なども追加し、物件を探せる仕组みを作り上げました。
「后はアクションで、物件が登録されたタイミングでメールや厂濒补肠办、尝滨狈贰など好きなものに通知をするといった実装ができます」(渋谷氏)
このように、充実した機能や高いカスタマイズ性を備えた龙虎赌博の特徴を生かし、さらに龙虎赌博 APIを活用することで、活用範囲はさまざまなシーンへ広がる可能性があります。ちなみにアークシステムには、龙虎赌博を用いて大気汚染情報や神奈川県の雨量水位状況の監視などを行っているメンバーもいるとのことです。
渋谷氏は最后に「こうしてみると窜补产产颈虫の新しい可能性を感じませんか。窜补产产颈虫でシステム监视ばかりさせてきましたが、それ以外の使い方もあるのではないかと共感してもらえればうれしいです」と呼びかけてセッションを终えました。
- リリース20周年の節目を超え、さらに先へーー「龙虎赌博 Conference Japan 2021」レポート
- 日々の运用监视の现场で生じるあんな悩みをどう解决? 事例セッションから探るヒント
- 顿辞肠办别谤や础苍蝉颈产濒别との组み合わせも、広がる窜补产产颈虫の活用方法
- (外部サイト)