自宅のサーバが安定しない。とずっとここに書いてきたのだけど、ふぅ。23 日の 22:00 頃にようやっと原因と思われるメッセージを出力してカーネルがパニックしてくれた。それまでは突然凍りつく現象がずっと続いていたのだけど。
サーバの突然の停止によって、メモリを交換・電源交換・あげくの果てにマザーボードの交換までしたのにそれでもサーバの突然の停止。まいった。
しかし、今回はようやっとメッセージが出力された。タイトルの通りで ufs_dirbad で mangled entry だとメッセージが出力されて、その後 panic: だと。トホホだけど、原因が特定できてよかった。ちなみに僕の場合は /var でこのメッセージが出力された。
PC のハードウェアは交換したけど、HDD はずっと使い回していたので再インストールは特にして居なかったのだけど・・。
FreeBSD のソースコード的には /usr/src/sys/ufs/ufs/ufs_lookup.c の 297 行目辺りなんだけど、何をしているのか皆目見当がつかないので google で検索してみるとそれなりに結構ヒサンな状態みたいですねぇ・・。このメッセージが出ると言うのは。
と、言うことでバックアップを開始し、スパッとパーティションを削除して FreeBSD の再インストールを実施。インストール前は FreeBSD/amd64 7.1-PRERELEASE だったのだけど、インストール用メディアは FreeBSD/amd64 7.1-RC2 でおこなった。その後、cvsup で再度 7.1-PRERELEASE にしたけど、今のところは無事に動作している。と言う感じかな。
けど、cron で動くものやウェブ経由で動作するプログラムが結構 core している模様。dmesg に出力されているのよねぇ・・。
一体何がいけないのか・・。サーバ自体が安定してもその上で動作しているものがボコボコ落ちても余り意味がないのだけど・・。
後、ufs_dirbad なメッセージが FreeBSD/amd64 のみで発生している事象なのかも知りたい所。FreeBSD/i386 使って ufs_dirbad なメッセージが出た。と言うのは google で探しても見当たらないのでもしかしたら FreeBSD/amd64 のみの事象なのかなぁ?
FreeBSD/i386 を利用していても ufs_dirbad なメッセージが出るぜぃ。って人いましたらどうかお願いします。コメント頂けませんでしょうか。宜しくお願いします。
それにしても再インストールでサーバが安定することを切に願うのであります。
12月 252008
/以外はzfsにしちゃってますが
amd64でufsがぶっこわれたことはないです。
i386でbitmapが壊れてpanicしたことがありましたが
そのときはHDDにbad blockができてました。
d_reclenのチェックは、
0はありえなくてもしあると無限ループにはまるのでダメなのと、
DIRBLKSIZの境界をまたぐエントリがないかのチェックだとおもいます。
コメント、ありがとうございました。
その後も二度ほどカーネルパニックで落ちました。やはりHDD自体を交換したほうが良さそうですね。とは言いつつ、この HDD、買ってからまだ三ヶ月程度しか経っていないのに・・。
新しいHDD買ってきてトライしたいと思います・・。トホホ。
まさに FreeBSD/amd64 7.1-RELESE で同じ目に会ってます。ソースをコンパイルして7.0-RELESEからのアップグレードなのですが、ファイルアクセスが複数のプロセスで行われたり一定の時間継続するとお亡くなりになってしまっているように見えました。cpコマンドを複数走らせたりrsyncを実行したりすると確実に落ちちゃいましたし。
いま公式のISOイメージをダウンロード中です。
このイメージから新規インストールしてもダメな時は7.2まで見送りの予定です。
こんにちは。
なんか、自分の二台の FreeBSD/amd64 は結局ファイルシステムがぼこぼこになっていました。で、HDD を NTFS にして Windows 上で chkdsk してもディスクには全然問題が無いので、ただ単に ufs がぶっ壊れているっぽいですね。
困ったなあ。FreeBSD/i386 のほうが良いかなぁ・・。
PR にこんなものがあるのを見付けました。
http://www.freebsd.org/cgi/query-pr.cgi?pr=kern/93942
長くてまだ読んでいないので該当するか分かりませんが、再現性があるようなら目を通してはいかがですか。
uyotaさん。こんにちは。
FreeBSD 自体は相変わらずフリーズしまくるのですが、このメッセージは一回こっきりしか出ません・・。
このメッセージが出てから使っていた HDD 上のパーティションを全て消して再度インストールし直しして、それでもフリーズするので、更に HDD の交換までしました。
ちなみに、このメッセージが出たときに使っていた HDD に対して chkdsk しだけど、ハードウェア的な問題はありませんでした・・。