ネットワークの障害、続報

ネットワークに障害が発生しています」というエントリで、恥ずかしながら、ネットワークトラブルが起きたことを報告しました。今回はその続きです。

どこかで大量のブロードキャストが発生しており、いわゆる「ループ」の可能性もあるとのことで、早く原因を特定したいのですが、当院ではインテリジェントタイプのネットワーク機器が、大元のL3スイッチのみなので、どうも末端のことがわかりません。
で、「L3スイッチから、幹線として各病棟に散らばっているLANケーブルを1本1本抜いていって、ネットワークが正常になるか」という、大胆というか、原始的というか、そういった調査をすることになりました。

困ったのは、「いつやるか」です…。「今でしょ!」と言いたいところですが、話はそんなに簡単ではありません。
LANケーブルを抜いてL3のスイッチの反応を確かめるのに、長く見ても20分程度。この間、抜いたケーブルの先の現場では、当然電子カルテが機能しません。これを現場に打診すると、案の定「それは困る!」と。つい数カ月前に導入したばかりのシステムでも、いまや20分の停止が許されない状況。システムを維持することの重大さと責任を感じます。

では、「夜中に…」という発想になるのですが、これもそう簡単ではありません。夜間は各ベンダーさんとやりとりしにくく、現場の方も最低限の人員しか配置していないので、もしなにかあったときに対応に不安が残ります。
ネットワークが停止している時間よりも、ネットワークが復旧した時に「すべての機能が元通りになるか」のほうが怖いものです。

結局、日中で、午前と午後の外来の間を縫って、1系統ずつLANケーブルを抜いてみることになりました。ここまで、各現場の調整で2週間…。

結果は…、何も出ましでした!
つまり、不安定な状態は相変わらずということです。

1本抜いてL3スイッチの挙動を確かめ、「う~ん、変化なし、次!」という具合に進み、サーバーに繋がるケーブルを除き、すべてを試してみたのですが、変化が現れませんでした。
サーバーのケーブルを抜くということは、全てのネットワークの停止を意味するので、これはまた機会を改めるしかないと判断し、今回の作業はこれで終了しました。

調査後、あらためてネットワークの施工会社さんと打ち合わせ、残る可能性2つを確認しました。

1つの可能性は、サーバー。
サーバーの接続が間違っていることは考えにくいのですが、もしかしたら、ネットワークの設定が間違っていないか、改めて調査することになりました。

もう1つの可能性は、問題が複数箇所で起きていること。
抜いてみて変化がなければそのケーブルは元に戻したので、仮に2箇所以上で同じ問題が起きていれば、反応に変化が出ないのでは…という仮説。

今度はもっと大掛かりな調査になるので、また各現場の調整をしなければなりません。
私自身ネットワークの知識がないに等しいので、ネットワーク会社に委ねるしかなく、なんとも歯痒い思いです。

コメント

  1. かなり大きな病院にお勤めのようですね。ネットワークのトラブルは原因の究明から、対応まで難しいことが多くて大変ですね。原因判明したら是非教えてください。

    返信削除

コメントを投稿

このブログの人気の投稿

GoogleのAutoDraw、ピクトグラム作成に使えそう

旧字体や外字は使用できません

患者さんの視線とサインの高さ