2003年10月

2003年10月8日
ちと

忙しい状態が続いているので最近のボトルの出来事とか把握できてない状態です。

…まあそういう状況は今までもなんとかあったのはご承知の通りだと思いますが(笑)

いろいろ面白いことが起こってそうな気配だけ察知している状況なので、ついていけないのが申し訳ないんですが…何かまとまったら掲示板とかメールとかで報告していただけるとこれ幸い。

最近サーバ不安定なんですか? <それすらあんまり把握してない

2003年10月9日
ちくちく

今頃になって「しなちく」の存在に気づきました(笑)

2003年10月19日
あー

\t\u\s[10]\h\s[3]でも鯖が頑張ってSLPPD落下原因の決定的原因の特定に結びついたら、\w9それはそれで好都合かな。\w9\w9\uどうやら、\w91900バイトオーバーは補助的な原因でしかなさそうやね。\e

ぐれいすふるが出るような場合はまた別の原因ですから…。

さっきのは、SLPPdの問題とは別物だったような気がします(よく確認していませんが)


\t\u\s[10]\h\s[4]また一時的に切断されたよ。。。\w9\w9\uまだ相当不安定みたいだぞ。\e

すみません今回のは単なるミスの再起動です。

とりあえず良くも悪くもSLPPdが再起動されてしまったので、月末まで様子見ることになりそうかも。


\t\u\s[10]\h\s[3]投票同意入れても大丈夫そうかな?\w9\w9\u神経使うでござるなまったく…。\e

原因はさっぱり分かりませんが、CPUの性能やメモリが足りないとかの、シンプルな意味での過負荷と関係ないことは確かなので、そんなところでいちいち気にしてもしょうがないとは思います。

ちなみにベストテンの時のCPU負荷は概ね10%未満でした。

\t\u\s[10]\h\s[3]このへんでデータベースリセットしたほうがいいのかもね。\w9\w9\u過去ログは別に取っとけばええしな。\e

DBが関係する可能性は非常に低いです。SLPPdはMySQLの存在すら関知しないプログラムですし、SLPPdがクライアントと通信するときに書き込めないような原因にはなり得ないです。

実際に100万件以上のDBを実際にここ以外で扱っているわけでは(僕は)ないですが、まぁレコード1億件くらいまでは、心配する対象ではないと思われます。

あと出来ることは、ボトルサーバのOSごとの再起動くらいでしょうか(笑)


\t\u\s[10]\h\s[4]毎度落ちるのがウチである操作をしてる時ばっかりやな。\w9\w9\u\s[16]‥\w9‥\w9‥\w9\e

ソケットエラーを起こしている怪しげなクライアントが(SLPPに直接繋いでいるとは限らなくても)存在するのではないか、というのは可能性あります。それがサーバの何らかのリソース食いつぶしているとか、そういうの。

メールでもなんでも、具体的に教えて頂けると…。


1秒100回とかCGI起動させるような負荷かけたら落ちるのは火を見るより明らかで(笑)、今回はそういうのとまっったく関係ないのも明らかですので。

とりあえず、ソケットで特定のSLPPクライアント(ボトルクライアント)にデータを書き込もうとしている瞬間に止まっている可能性が一番高いです。それらのクライアントが何か共通の特徴を持っている可能性もある(OSとか接続手段とか)でしょうが、あんまり調べ切れていません。

ノンブロッキングソケットなので止まるはずはないんですが、ログを見る限りそこで止まっている様子。

ただソケット関係の制限ならApacheとかも同時に飛んだりしそうなもんですが、それは今のところないみたい。

あと、「重い」のと「止まる」のとは混同しないでくださいませ。投票が5秒くらい遅れて反映されるのは、DBの都合とか負荷の都合とか、あるいはボトルサーバと全く関係ない経路問題とかでしょっちゅうあり得ます。Gracefulのエラーは「重い」の極端なケースで、これは実際に、

といった場合に起こりえます。

ですが、CPUもメモリもネットワークもDBもへっちゃらな状態で、突然SLPPdが5分とか10分とか無反応になる最近の不具合は、それとは全く別の話です。


接続してきているクライアントのログをとるようにしてみました。(超適当な手段で。有用だと判断したらもう少し真面目にログ取ります)

ぱっと見た感じ9割以上がSSTP Bottle Client 2.64っぽい。2.55.2とか使ってる人を1人発見しましたが…。MeのGDI問題とかで敢えてこのバージョン使ってるってことはないですよね?