月曜日、朝一番、同一フロアの複数の部屋からネットにつながらないという苦情があった。
考えられる原因
1)金曜日夕方まで問題なかったから週末にハブが壊れた。もう導入したのが5年前で、つぶれたハブが幾つかでているので。
2)週末だれかが新しいネットワーク機器(ルータなど)を導入したが、誤った設定、配線を行った。これまでの経験だと上流に向かってDHCPサーバを建てた奴が複数いたから。
3)週末に、どっかで使ったメディアを読んだのでウイルスに感染し、大量のパケットを飛ばしている。学内での感染は考え憎い環境にあるので。
というわけで、すぐわかるだろうと現場を仕切っているハブを設置した成端箱で調査開始。
ところが、なかなかわからない。その症状は、DHCPサーバからip address を取得できたりできなかったりである。取得できたときは本来のそのセグメントに割り当てた ip address で、DHCP機能のある市販ルータがよく使う192.168.x.x とか 10.x.x.x とかのプライベートip address ではない。通信できなくて取得できないときがあるという症状である。したがって新しくルータを建てた者がいて、その設定や配線がちがっているわけではない。
通信できない時があるというのでウイルス感染の結果、あるいはNICカードが壊れて大量のパケットが飛んでいる可能性があるが、ハブのLEDの点滅状況をみても、そうではなさそうである。
予想は見事にはずれ。こうなると、時間がかかる。
配線は下図のようになっている。
苦情のあるのは部屋3、4、5で部屋1、2は問題ががない。したがって一番疑われるのはスイッチングハブB以下である。スイッチングハブBは2ヶ月くらい前に導入した新しいもので故障は考えにくい。それよりスイッチングハブAのほうが古いのでこっちが故障したのだったらわかるが...
ハブの故障?一番簡単なのでスイッチングハブBを新品に交換→だめ、ハブの故障ではない
ハブA-Bを結ぶケーブル、あるいは接触不良?→だめ、ケーブルや接触不良ではない。
ここまでを確認するのも時間がかかる。問題ないときと障害が出るときがあるからで、ケーブル交換したら直ったように見えるが、まただめになる。
そこでスイッチングハブBにぶらさがった部屋3、4、5、….で何かが生じているのらしいという結論に至った。ハブBの下流全部(10本)をぬいて、ハブBにパソコンを直接接続すると問題ない。で1本ずつ接続して調べる(問題ないのを確認するのに時間がかかる、問題ないときと、障害が生ずるときがあるからである)。
調査している時刻では部屋1〜20には入れる部屋と入れない部屋、住人がいる部屋といない部屋があって、金曜日の夕方以降何かしたかを聞くわけにはいかない。聞いても本人に自覚がないからわからない。
1本ずつ接続を増やしていって ip address を取得できたら次とやってみたが、取得できる場合とできない場合があるのでなかなかわからない...で、取得できた場合でもブラウザでページが見えないことがあるのに気がついた。こっちの方が判定が早い。
というわけで、ちと能率があがった。
その結果、部屋3への配線を接続すると部屋4、5、…がだめになることが判明。これで終わったも同然。何故かと言えば、管理者の責任は部屋3までの配線までで、室内の配線やバブ、ルータの設置は住人の責任だから、原因がわからなかったら、部屋3への配線を接続しなければいい。それで他の部屋は問題ないからである。
とは、いうものの、そのままだったら部屋3の住人は解決できないから、部屋3へ行く。
部屋3はハブが設置してあり、そのパケットのインジケータが一定頻度で点滅している。あまり高頻度ではないが一定頻度である。これが怪しい。点滅しているインジケータが示すケーブを抜いたら、問題解消。
で、そのケーブルにつながっている機器をさがしたら、ケーブルが長いのでたぐっていったら、な、なんと同じハブに接続してあった。
ループですな。(下図)
ループを作っていたのでハブCの下の部屋3のパソコンは当然全滅。しかしハブBまでにも影響を与え、部屋4、5のパソコンの通信が届いたりとどかなかったりだったのでした。ハブCが高性能でブロードキャストがぐるぐる高速で回っていたらその影響がハブBまでもっと大きく及ぶので部屋4、5は全く接続できないということになるんでしょうが、低速で回っていたため部屋4、5は接続できる場合がでてきたんでしょうな。
あるいはハブCがそのような影響を上流に及ぼさないようになっていれば、問題は部屋3に限定されたんでしょうな。ハブBは上流に影響を与えなかったので部屋1、2は問題がなかったということでしょ。
週末に、何も接続していないケーブルがハブのそばにあったもんで、親切にも接続しちゃったんでしょうな。
というわけで、問題解決まで2時間。
いままでになかったトラブルのパターンでした。よそでもこういうことはあるんでしょうな。ポートが空いていればふさぐ、というのが親切心の現れなのかもしれない。
あーあ。
はじめまして
お疲れさまでした。
先週うちの仕事場でもありました。
非常に、いや非情に、よく似た経過です。
おそろしやループ
もっとおそろしや親切な心
合掌。。。
はじめまして
前の職場(とある研究所)でネットワーク管理の末端の仕事をしていましたが、「ネットワークケーブルのループを作らないで下さい」とイントラでアナウンスしていました。多分似た事例が複数あったのでしょう
大変参考になりました。
手に汗握って読みました。
時間に迫られてのトラブル調査は、
精神的にも体力的にも辛い物があります。
ハブは接続も簡単で大した機器ではないと思いがちですが、
スイッチング・ハブは、下手に故障すると暴走しますね。
「いっそ即死してくれれば良いのに!」と思うことしばしばです。
「ネットは生き物」なんですね。
この様なトラブルシュート談は大変約に立ちます。
感謝致します。