Hallo, ich habe bei Linux Systemen immer einen Intel LAN-Adapter eingebaut, e1000. Da viele onboard Adapter -Realtek r8169- öfters Probleme gemacht haben. Komischweise gibt es nun auch bei Intel e1000e Probleme. Installiert ist Ubuntu Server 64Bit 10.04 LTS Das verhalten ist, ich bin ohne großen Traffic per Putty auf dem Server, die Kommunikation bricht ab. Im Syslog oder kernlog bzw. dmesg tauchen keine Meldungen auf. Link ist an der Karte und am Switch vorhanden. Abstecken und Anstecken des LAN Kabels wird vom System erkannt, link down / up. Aus dem Server heraus ist kein Ping möglich, er kann auch nicht angepingt werden. Ein ifconfig eth0 down ifconfig eth0 up erweckt den LAN-Adapter wieder zum leben. Kernel derzeit: 2.6.32-38-generic #83-Ubuntu SMP Wed Jan 4 11:12:07 UTC 2012 x86_64 GNU/Linux Woran kann es liegen ? Welche andere Netzwerkkarte könnte ich einsetzen ? Nicht Intel nicht Realtek Martin
Ok, danke ich werde das EEProm auf der Karte mit diesem Test überprüfen. Mich würde es aber wundern das ein Jahr nach dem auftreden dieses Fehlers immer noch derart auftreten würde, zudem bei diesem Fehler die Karte überhaupt nicht kunktionierte.
Moin, ich habe hier mehrere Intel e1000 mit PCI-e auf verschiedene Systemboards und mit verschiedenen Ubuntu (Desktop + Server) Versionen laufen. Das ganze läuft seit Jahren ohne Netzwerk Probleme. Bist du sicher das es nicht an einer anderen Stelle hängt ? Gruss, Tobi
Der e1000 Treiber unter Linux gilt eigentlich als hochgradig stabil, seit sehr vielen Kernel-Releases jedenfalls. Ich hatte mit ihm unter vielen Hochlastgeräten niemals Probleme. Am besten tauschst du mal die komplette Karte aus bzw. überprüfe mal, ob du die Interrupt-Einstellungen im Bios verpfuscht sind.
Ich hab hier auch zwei Server, bei denen ein > 03:00.0 Ethernet controller: Intel Corporation 82574L Gigabit Network Connection (e1000-Treiber) nicht sauber funktioniert, aber ein Dual-Port Interface > 02:00.0 Ethernet controller: Intel Corporation 82576 Gigabit Network Connection (intel 'igb'-Treiber, auch vom e1000 Projekt), problemlos seinen Dienst tut. Deshalb Danke für den Link zu der Problembeschreibung, sollte mal ein drittes Interface nötig werden, weiss ich wo ich suchen kann ;)
Eben dshalb hatte ich bisher auch immer Intel Karten. Als Treiber wird der e1000e geladen, bei euch auch ? Muß nochmal schauen welcher Chip genau drauf ist. Die Karte war neu und sicher von der neusten Revision, da von einem Distri bezogen. Bei den Realtek Karten konnte ich den Fehler Provozieren wenn ich 1-2GB 60MB/s drübergejagt habe dann ist die aber mit Fehlern im syslog ausgestiegen.
Ich versuche dann auch noch den neuesten Treiber e1000e von Intel: http://downloadcenter.intel.com/Detail_Desc.aspx?agr=Y&DwnldID=15817&keyword=%22e1000e%22&lang=eng
Meine Karte ist von dem oben beschriebenem Powersafe Bug laut dem Script nicht betroffen. Auch meine Werte aus dem EEprom sagen dies aus. Neuer Treiber ist installiert, mal schauen ob es was gebracht hat.
Also hat das auch nichts gebracht?
1 | Please try booting the kernel with the pcie_aspm=off kernel parameter. |
Was mir auch gerade noch aufgefallen ist es läuft der Generic Kernel obwohl ich Server installiert habe, wweiß nicht wo das Passiert ist, habe ich geradegezogen, wird sich zeigen ob alles zusammen was gebracht hat. 2.6.32-39-server #86-Ubuntu SMP Mon Feb 13 23:15:11 UTC 2012 x86_64 GNU/Linux Martin
Sehr Sehr Seltsam, der Fehler tritt immernoch auf. bin wieder zurück auf den Generic Kernel. Der neue Treiber direkt von Intel, oben verlinkt, erkennt jedoch das Problem und resettet den Adapter, bzw. ein Watchdog schlägt zu. [14258.080657] ------------[ cut here ]------------ [14258.080668] WARNING: at /build/buildd/linux-2.6.32/net/sched/sch_generic.c:261 dev_watchdog+0x262/0x270() [14258.080670] Hardware name: MS-7673 [14258.080673] NETDEV WATCHDOG: eth0 (e1000e): transmit queue 0 timed out [14258.080675] Modules linked in: usb_storage binfmt_misc dahdi_transcode dahdi_dummy dahdi crc_ccitt divacapi diva_mtpx diva_idi divas divadidd snd_hda_codec_atihdmi snd_hda_intel snd_hda_codec snd_hwdep fbcon tileblit font bitblit softcursor snd_pcm_oss vga16fb vgastate snd_mixer_oss snd_pcm sbc8360 snd_seq_dummy snd_seq_oss snd_seq_midi snd_rawmidi snd_seq_midi_event radeon i6300esb snd_seq ttm snd_timer drm_kms_helper snd_seq_device drm snd soundcore psmouse lp xhci snd_page_alloc serio_raw i2c_algo_bit parport shpchp pcspkr usbhid hid dm_raid45 r8169 xor mii ahci e1000e [14258.080718] Pid: 4, comm: ksoftirqd/0 Not tainted 2.6.32-39-generic #86-Ubuntu [14258.080720] Call Trace: [14258.080722] <IRQ> [<ffffffff810665ab>] warn_slowpath_common+0x7b/0xc0 [14258.080732] [<ffffffff81066651>] warn_slowpath_fmt+0x41/0x50 [14258.080737] [<ffffffff8147c552>] dev_watchdog+0x262/0x270 [14258.080741] [<ffffffff81080931>] ? __queue_work+0x41/0x50 [14258.080746] [<ffffffff8147c2f0>] ? dev_watchdog+0x0/0x270 [14258.080750] [<ffffffff8107710b>] run_timer_softirq+0x19b/0x340 [14258.080754] [<ffffffff8106dd57>] __do_softirq+0xb7/0x1f0 [14258.080759] [<ffffffff810132ec>] call_softirq+0x1c/0x30 [14258.080760] <EOI> [<ffffffff81014cb5>] do_softirq+0x65/0xa0 [14258.080766] [<ffffffff8106d800>] ksoftirqd+0x80/0x110 [14258.080769] [<ffffffff8106d780>] ? ksoftirqd+0x0/0x110 [14258.080773] [<ffffffff81084ac6>] kthread+0x96/0xa0 [14258.080777] [<ffffffff810131ea>] child_rip+0xa/0x20 [14258.080781] [<ffffffff81084a30>] ? kthread+0x0/0xa0 [14258.080784] [<ffffffff810131e0>] ? child_rip+0x0/0x20 [14258.080786] ---[ end trace 4c28ff1647b81511 ]--- [14258.080984] e1000e 0000:02:00.0: eth0: Reset adapter [14261.269328] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx/Tx [14306.080119] e1000e 0000:02:00.0: eth0: Reset adapter [14309.350543] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx/Tx [14335.007318] e1000e 0000:02:00.0: eth0: Reset adapter [14338.215242] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx/Tx [14413.050559] e1000e 0000:02:00.0: eth0: Reset adapter [14416.380935] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx/Tx
Immerhin findet man damit vielleicht eine Lösung: http://sourceforge.net/tracker/index.php?func=detail&aid=3404265&group_id=42302&atid=447449
Martin schrieb: > Hallo, > > ich habe bei Linux Systemen immer einen Intel LAN-Adapter eingebaut, > e1000. Da viele onboard Adapter -Realtek r8169- öfters Probleme gemacht > haben. > > Komischweise gibt es nun auch bei Intel e1000e Probleme. Ich hatte ein ähnliches Verhalten beim Onboard LAN eines Supermicro C2SBX Workstation Boards, auf dem ein Intel ICR9R (mit eigebauten Ethernet MAC) plus Intel 82566 PHY verbaut war, und zwar unter Windows! Irgendwann bei heftigem Traffic war Feierabend. Karte deaktivieren, wieder aktivieren, und weiter gings. Ich habe dann einen Intel PRO/1000 MT Dual Port Server Adapter dazugesteckt und fortan nie wieder irgendwelche Probleme gehabt. Supermicro wußte natürlich von nichts. fchk
Moin, Moin, die Lösung bei uns war, dass die betroffenen Rechner (waren/sind mehrere) an einen anderen Switch gehangen wurden. Erst war's wohl ein Cisco- danach ein Netgear-Switch. Allerdings haben wir vorher auch einige andere Sachen durchprobiert, die zu keiner Lösung geführt haben. timpi.
Hier Debian Sqeeze Server mit Onboard SIS900 100Mbit an Billig-Switch. Tritt hier auch sporadisch auf und wird mit ähnlichen Meldungen wie bei Martin zurückgesetzt. Scheint also nicht unbedingt Intel-spezifisch zu sein, fällt aber im Betrieb nicht auf.
1 | [5194449.000052] NETDEV WATCHDOG: eth0 (sis900): transmit queue 0 timed out |
2 | [5194449.000265] eth0: Transmit timeout, status 00000004 00000000 |
3 | [5194449.772921] eth0: Media Link On 100mbps full-duplex |
4 | ...
|
5 | [7094930.776320] eth0: Media Link Off |
6 | [7094960.778269] eth0: Corrupted packet received, buffer status = 0x900400dd/221. |
7 | [7094965.000018] eth0: Transmit timeout, status 00000004 00000000 |
8 | [7094965.776912] eth0: Media Link On 100mbps full-duplex |
Hallo, doch es würde schon auffallen. Als der Fehler aufgetreten ist, war nicht mal mehr per Putty eine dmesg Ausgabe möglich. Nur auf 2 Schüben in der Mitte ca. 5 Sec. Pause beim Adapter reset. Bei den Freigaben mit Samba war kein Browsen mehr möglich, Adapter reset. Ein Ping mit -l 50000 lies den Adapter ebenfalls resetten. Erst ein ifconfig eth0 down / up ließ den Adapter wieder für einige Zeit normal arbeiten. Im Moment wird das System mit dem Realtek Onboard Adapter aufgestellt. Zum Test habe ich 2x100GB am Stück drüber laufen lassen, im Schnitt ca 90- 100MB/s, keine Probleme, der Inteladapter bleibt erstmal draussen. Martin
Martin schrieb: > as mir auch gerade noch aufgefallen ist es läuft der Generic Kernel > obwohl ich Server installiert habe, wweiß nicht wo das Passiert ist, > habe ich geradegezogen, wird sich zeigen ob alles zusammen was gebracht > hat. Deutsch Sprach sind schwer Sprach.
Sprachpolizei schrieb: > Deutsch Sprach sind schwer Sprach. Aha, es ist wieder Wochenende und die Spinner sind unterwegs. Martin schrieb: > doch es würde schon auffallen. Als der Fehler aufgetreten ist, war nicht > mal mehr per Putty eine dmesg Ausgabe möglich. Das war hier nicht der Fall, innerhalb von ca. 2-4 Sekunden hatte der Watchdog das Adapter wieder oben. Das Abschmieren passiert hier auch lange nicht so häufig wie bei dir.
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.