Forum: PC-Programmierung TIME_WAIT state bei TCP / reconnect ohne timeout


von ack (Gast)


Lesenswert?

Hallo,

habe ein kleines Python Programm, das eine TCP Verbindung als Client 
aufbaut. Als Netzwerklib wird QtNetwork aus PyQt4 verwendet.

Funktioniert auch alles soweit.
Nun möchte ich die Verbindung neu aufbauen, wenn ein Verbindungsabbruch 
vorkommt, verursacht durch zB kurzzeitigen Stromausfall der Gegenseite.

Das Programm erkennt den Verbindungsabbruch und versucht direkt, eine 
neue Verbindung aufzubauen - jedoch versandet der erneute Versuch, wenn 
der Verbindungsaufbau unmittelbar nach dem Abbruch geschieht und die 
Gegenseite noch nicht wieder erreichbar ist - allerdings ohne Timeout 
etc.

Hier der relevante Ausschnitt:
1
import sys
2
from PyQt4 import QtCore, QtGui, QtNetwork
3
4
class Client():
5
    def __init__(self):
6
        self.tcpSocket = QtNetwork.QTcpSocket()
7
        self.tcpSocket.error.connect(self.displayError)
8
   
9
    def reconnect(self):
10
        self.tcpSocket.abort()
11
        self.tcpSocket.connectToHost("127.0.0.1", 8080)
12
13
    def displayError(self, socketError):
14
        print("The following error occurred: %s." % self.tcpSocket.errorString())
15
        self.reconnect()
16
17
if __name__ == '__main__':
18
    app = QtGui.QApplication(sys.argv)
19
    c = Client()
20
    c.reconnect()
21
    sys.exit(app.exec_())

Als Gegenseite fungiert Netcat, das auf Port 8080 hört.
Beendet man Netcat nach dem ersten erfolgreichen Verbindungsaufbau 
versucht das Programm erneut, eine Verbindung aufzubauen, nachdem 
displayError aufgerufen wurde ("The remote host closed the connection.")
Statt einem erneuten Error ("Connection refused.") passiert aber leider 
gar nichts.
Netstat zeigt dann an:
1
tcp        0      0 127.0.0.1:8080          127.0.0.1:42268    TIME_WAIT -

Was bedeutet dieser TIME_WAIT state? Ich nehme an, dass dieser die 
Ursache für das Versanden des erneuten Verbindungsaufbaus ist, also dass 
die Pakete weder an einem listening Socket ankommen, noch abgelehnt 
werden, sondern einfach leise ignoriert werden.
Das scheint mir auch ein generelles Linux/TCP Konzept zu sein und nichts 
mit Python zu tun zu haben.

Was kann man tun, um sauber zu erkennen, ob ein Verbindungsaufbau in 
einem solchen Fall fehlschlägt?
Vielen Dank schonmal

von Daniel A. (daniel-a)


Lesenswert?

ack schrieb:
> Was bedeutet dieser TIME_WAIT state? Ich nehme an, dass dieser die
> Ursache für das Versanden des erneuten Verbindungsaufbaus ist, also dass
> die Pakete weder an einem listening Socket ankommen, noch abgelehnt
> werden, sondern einfach leise ignoriert werden.
> Das scheint mir auch ein generelles Linux/TCP Konzept zu sein und nichts
> mit Python zu tun zu haben.

Mit linux hat dies nichts zutun. TCP verbindungen können sich in 
verschiedenen Zuständen befinden, im rfc 793 auf Seite 23 gibt's dazu 
ein schönes diagramm: https://tools.ietf.org/html/rfc793#page-23

Grundsätzlich müssen bem Verbindungsaufbau zuerst beide 
Verbindungspartner dem anderen ein SYN flag senden, und dessen Empfang 
mit einem ACK flag bestätigen. Es spielt keine rolle, wer damit anfängt 
oder ob beide gleichzeitig ein SYN senden, es müssen einfach nur beide 
in einem Zustand sein in welchem sie ein SYN erwarten, und die quell und 
ziel ports, etc. der Packete müssen stimmen. Es ist jedoch üblich das 
einer im listening state auf Verbindungen wartet und der andere das 
erste SYN sendet und dann im syn sent state auf ein SYN und ein ACK 
wartet. Danach ist die verbindung aufgebaut und im ESTABLISHED state. 
Falls jedoch ein Verbindungspartner kein SYN erwartet, aber eines 
erhält, wird ein RST gesendet um den verbindungsaufbau abzulehnen. Wenn 
man eine Verbindung abbricht wird ein RST gesendet, das sollte man 
vermeiden weil dann unklar ist ob alle gesendeten Daten auch angekommen 
sind. Beim schliessen der Verbindung wird ein FIN gesendet. Beide 
Verbindungspartner müssen ein FIN senden und dessen empfang mit einem 
ACK bestätigen, die Verbindung zu schliessen. Wenn man ein FIN sendet, 
muss der Verbindungspartner das nicht unbedingt auch tun, man sagt damit 
nur, dass man selbst keine Daten mehr senden wird. Der 
Verbindungspartner kann dann weiterhin Daten senden.

Der TIME_WAIT state existiert, damit zwischen zwei Rechnern in einem 
gewissen Zeitraum nach dem schliessen einer Verbindung nicht erneut eine 
Verbindung mit dem selben source und destination port, etc. geöffnet 
wird, und verspätete Packete kein RST auslösen. Dies verhindert auch, 
dass verspätete Packete der alten Verbindung zu problemen führen. Dies 
stellt hier jedoch definitiv nicht das Problem dar.

Wenn du mit netcat auf eine Verbindung wartest, dann ist die Verbindung 
im LISTENING state. Dabei wird auf ein SYN gewartet, das an den 
richtigen destination port geht, und von einem beliebigen source port 
kommt.
Wenn dein Programm die Verbindung initiiert, sendet es ein SYN und ist 
dann im syn sent state. Jeder TCP Stack wird dabei den angegebenen 
destination port verwenden, aber sofern man den Source port nicht 
explizit festlegt diesen zufällig wählen. Deshalb würde beim erneuten 
Verbindungsaufbau ein anderer source port gewählt, womit die Kombination 
aus source und destination port nicht der Verbindung im TIME_WAIT 
zustand von vorher zugeordnet werden kann, womit dies nicht das Problem 
sein kann.

Man könnte jetzt mit Wireshark nachsehen, was los ist, aber eigentlich 
macht das ganze nur sinn, wenn nicht versucht wird eine neue Verbindung 
aufzubauen.

Wenn ich die API geschrieben hätte, hätte ich nicht vorgesehen, dass 
jemand versucht eine neue Verbindung mit einem alten Verbindungsobjekt 
herzustellen. Das ist nur eine Vermutung, aber versuche mal ein neues zu 
erstellen. Ungetestet:
1
import sys
2
from PyQt4 import QtCore, QtGui, QtNetwork
3
4
class Client():
5
    def __init__(self):
6
        self.tcpSocket = None
7
8
    def reconnect(self):
9
        if self.tcpSocket is not None:
10
            self.tcpSocket.abort()
11
        self.connect()
12
13
    def connect(self):
14
        self.tcpSocket = QtNetwork.QTcpSocket()
15
        self.tcpSocket.error.connect(self.displayError)
16
        self.tcpSocket.connectToHost("127.0.0.1", 8080)
17
18
    def displayError(self, socketError):
19
        print("The following error occurred: %s." % self.tcpSocket.errorString())
20
        self.reconnect()
21
22
if __name__ == '__main__':
23
    app = QtGui.QApplication(sys.argv)
24
    c = Client()
25
    c.connect()
26
    sys.exit(app.exec_())

von ack (Gast)


Lesenswert?

Vielen Dank für die ausführliche Antwort.
Wenn ich deinen Code ausführe (mit listendem nc im Hintergrund) 
verbindet
sich das Programm wie erwartet mit nc - sobald man dann nc beendet, 
kommt es zu einem Segfault.

Man kann das Beispiel soweit reduzieren, um den Segfault auszulösen:
1
import sys
2
from PyQt4 import QtCore, QtGui, QtNetwork
3
4
tcpSocket = None
5
6
def displayError(socketError):
7
    global tcpSocket
8
    tcpSocket.abort()
9
    tcpSocket = QtNetwork.QTcpSocket()
10
    tcpSocket.connectToHost("127.0.0.1", 8080)
11
12
13
app = QtGui.QApplication(sys.argv)
14
tcpSocket = QtNetwork.QTcpSocket()
15
tcpSocket.error.connect(displayError)
16
tcpSocket.connectToHost("127.0.0.1", 8080)
17
sys.exit(app.exec_())

Ist das ein Bug in der Library?

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.