Issue #9820 has been updated by Akira T…
さらに調べた結果、どうも cron から動かしたプログラムでは SIGINT の signal handler が
SIG_IGN になっているようです。
以下のようにして、端末からでも再現できました。
以下を実行すると hang します。
./miniruby -e 'trap(:INT, "IGNORE"); Process.kill(:INT, $$)'
Ctrl-C で止められないのは少し面倒なので、SIGQUIT に変えて以下のようにしても同様です。
./miniruby -e 'trap(:QUIT, "IGNORE"); Process.kill(:QUIT, $$)'
シグナルを無視する設定なのに、hang するのはバグだと考えられます。
workaround としては trap(:INT, “DEFAULT”) すればいいわけですが、バグは直したほうがいいと思います。
なお、いつからそうなったか調べたところ、Ruby 2.1.0 からな感じです。
Ruby 2.0.0p481 では hang せず、すぐに終わります。
でも rubyci.org では 2.0.0 も hang しているじゃないかと思ってよく見直してみると、
2.0.0 で hang しているのは TestBeginEndBlock#test_propagate_signaled
じゃなくて
TestIO_Console#test_noctty
で、そっちはまた違う原因のようです。
Bug #9820: miniruby -e ‘Process.kill(:INT, $$)’ hang under cron
- Author: Akira T.
- Status: Open
- Priority: Normal
- Assignee:
- Category:
- Target version:
- ruby -v: ruby 2.2.0dev (2014-05-09 trunk 45884) [x86_64-linux]
- Backport: 2.0.0: UNKNOWN, 2.1: UNKNOWN
最近、しばたさんが運用を始めた chkbuild で、
TestBeginEndBlock#test_propagate_signaled が hang しています。
http://chkbuild002.hsbt.org/chkbuild/ruby-trunk/log/20140509T060013Z.fail.html.gz
調べて再現コードを小さくしていった結果、
miniruby -e ‘Process.kill(:INT, $$)’
というのを cron から動かしたときは hang し、
端末から動かしたときは hang しない、ということが判明しました。
strace した結果をみると、
cron 下では timer thread が prctl の直後に poll を呼び出してそれが終わらないという挙動なのに対し、
端末ではそのあたりで context switch が起きている、ような気がします。
strace の結果を strace.cron.log と strace.term.log として添付します。
なにかわかるひとはいますでしょうか?
% ./miniruby -v
ruby 2.2.0dev (2014-05-09 trunk 45884) [x86_64-linux]
% uname -mrsv
Linux 3.2.0-4-amd64 #1 SMP Debian 3.2.54-2 x86_64
% lsb_release -idrc
Distributor ID: Debian
Description: Debian GNU/Linux 7.5 (wheezy)
Release: 7.5
Codename: wheezy
なお、コミッタならしばたさんに頼むとそのマシンにアカウントを作ってくれる模様です。
—Files--------------------------------
strace.cron.log (15.8 KB)
strace.term.log (17.6 KB)