ネットワークの障害、続続報
「ネットワークの障害、続報」という記事の更に続報です。
予め書かせていただきますが、結局解決には至っていません。
毎度ながら、私はネットワークの知識がないので、この手の話になると全面的にネットワーク会社のお世話になっています。
この記事もテクニカルな部分は少ないので、ご了承ください。
さて、前回記事では、「残るは可能性はサーバーか?」ということで終わっていました。
ただ、サーバーを止めて調査するとなると、病院の基幹業務系が全て止まるので、そうそう簡単ではありません。
【日程調整】
結局、日曜の昼の1時間、ネットワークを停止することになりました。
「外来が停止する時間」ということは早くに決まったのですが、では、「夜間か日曜か」ということで、意見が真っ二つに別れました。
夜間派実施派の意見:
日曜昼間実施派の意見:
結局、「現場の稼働率が低い時間帯」ということも大事なのですが、復帰した時に思わぬトラブルが発生することを懸念し、人的に充実できる「日曜」を選択しました。
【対応ベンダー調整】
ベンダーの対応は結構モメました。特に電子カルテメーカーのサーバースタッフが遠方から来るので、「本当にサーバーに原因があるのなら良いが、不確定な情報で動くのは…」と渋られてしまいました。
ネットワーク会社は、「もうサーバーの系統しか残っていないのだから、サーバー担当が来なければたいした作業が進められない」とお怒りモード。
困り果てて、電子カルテメーカーのプロジェクトマネージャに相談したら、意外にも「必ず(サーバー担当者)を行かせますから、日程を教えて下さい」と。
そんな経緯で、各方面を調整するのに本当に苦労したのですが、なんとか調査実施に至りました。
しかし、サーバーの設定を確認するも特に矛盾点は発見できず、どうやら、ループや設定ミスなどの致命的な問題ではなく、うまく書けないのですが、基本的なところから見なおそう、という話になりました。
モヤモヤした日々が続きます。
予め書かせていただきますが、結局解決には至っていません。
毎度ながら、私はネットワークの知識がないので、この手の話になると全面的にネットワーク会社のお世話になっています。
この記事もテクニカルな部分は少ないので、ご了承ください。
さて、前回記事では、「残るは可能性はサーバーか?」ということで終わっていました。
ただ、サーバーを止めて調査するとなると、病院の基幹業務系が全て止まるので、そうそう簡単ではありません。
【日程調整】
結局、日曜の昼の1時間、ネットワークを停止することになりました。
「外来が停止する時間」ということは早くに決まったのですが、では、「夜間か日曜か」ということで、意見が真っ二つに別れました。
夜間派実施派の意見:
- 病棟の稼働率が低い。日曜日中は稼働率が高い。
日曜昼間実施派の意見:
- 夜間は職員の人数が少ないので、ネットワークが万が一「復旧しない」ということになったら、対応が困難。
- システム会社、ネットワーク会社など、深夜に作業し、また翌朝から稼働立会いするのは、体力的に厳しい。
結局、「現場の稼働率が低い時間帯」ということも大事なのですが、復帰した時に思わぬトラブルが発生することを懸念し、人的に充実できる「日曜」を選択しました。
【対応ベンダー調整】
ベンダーの対応は結構モメました。特に電子カルテメーカーのサーバースタッフが遠方から来るので、「本当にサーバーに原因があるのなら良いが、不確定な情報で動くのは…」と渋られてしまいました。
ネットワーク会社は、「もうサーバーの系統しか残っていないのだから、サーバー担当が来なければたいした作業が進められない」とお怒りモード。
困り果てて、電子カルテメーカーのプロジェクトマネージャに相談したら、意外にも「必ず(サーバー担当者)を行かせますから、日程を教えて下さい」と。
そんな経緯で、各方面を調整するのに本当に苦労したのですが、なんとか調査実施に至りました。
しかし、サーバーの設定を確認するも特に矛盾点は発見できず、どうやら、ループや設定ミスなどの致命的な問題ではなく、うまく書けないのですが、基本的なところから見なおそう、という話になりました。
モヤモヤした日々が続きます。
当院でも最近不可解な現象がありました。心エコーのDICOMサーバーから画像を読み込むのに、不定期に数分間遅延が発生するのです。当初ネットワークが原因かとも思いましたが、サーバーが繋がったメインのHUBにクライアントを直結しても同じで、ベンダーさんに調査を。しかし原因わからず特にサーバー再起動もしていない、というのですがそれ以来ぴたっと現象出なくなりました。ベンダーがこっそり何かしたのでは?と疑いたくなります。ま、結果オーライなのですが。
返信削除エコーの画像読み込みが遅延…て、そのうち記事で書こうと思っていたのですが、当院でも同じ事が起きています。
削除うちは数分というレベルではなく、もっとかかっているようで。現場からはかなりクレームが出ています。
基幹部分の配線はすべて確認済みのようですので、
返信削除末端スイッチの全ての配線状態を確認されるといいかもしれません。
経験的に、末端スイッチでの(悪意のない)結線によるループはよく発生します
参考URL https://www.allied-telesis.co.jp/solution/loopguard/loopguard01.html
(アライドテレシスの製品の広告ではありません。
ちょうど良い図があったので、商会致しました。)
九州男児様
削除コメントありがとうございます。連休中でなかなか返信できなくてすみません。
ネットワークの施工会社さんに相談したところ、九州男児様と同じく、ループ形成を疑っておられました。当院のネットワーク機器はインテリジェンスタイプのものが少なく、もしループなどの結線の問題なら、シラミ潰しに確認しなければと、ゾッとしたものです。
その後の調査で、大量のブロードキャストが出ているのは、プリンタの仕様が原因ということらしいです。
とはいえ、まだ解決していないのですが…。
進展ありましたら、また記事にさせていただきます。
プリンタの仕様...ということですけれども、
返信削除同じプリンタを使用している他拠点でも同じことが起こるはずです。
プリンタの設定を確認するといいかもしれません。
可能性といたしましては、
1)プリンタの設定にLAN内に存在しないアドレスが大量に登録されている。
2)プリンタがそのLAN内に存在しないアドレスと通信をするために
大量のARPリクエストを送信する。
3)それを受け取ったスイッチがすべてのLAN内(同じVLAN内)のポートに対して、
ARPパケットを大量にブロードキャストする。
プリンタの設定にLAN内に存在しないアドレス登録数が少数では
問題ないのかもしれませんが、100個以上であれば、それなりの影響が
発生する可能性があります。
※参考:http://gihyo.jp/admin/serial/01/net_prac_tech/0005
また、私の手元にある本おいて、
業務アプリケーションとプリンタの連携により、発生したトラブルの例があります。
「p.62 絶対わかる!ネットワーク トラブル解決超入門 改訂版 日経BP社発行」
http://itpro.nikkeibp.co.jp/article/COLUMN/20130410/469886/
概要
>パソコンの業務アプリケーションがプリンタへ5秒間に1回pingを実行する仕様であった。
その業務アプリケーションにはLAN内に存在しないアドレスが登録されていた。
>下記構成のL3スイッチを新しいL3スイッチへ交換したところ、通信速度が遅くなり、
一部で通信が途絶えるエラーが発生。
>原因は、交換前のスイッチでは、存在しないIPアドレスへのARPリクエストを
廃棄していた。新しいL3スイッチではすべてを処理しようとしていた。
構成
多数のパソコン--------L3スイッチ(交換)--------プリンタ
お時間がございましたら、本屋で立ち読みをしてみてください。