Hallo zusammen! Ich hab ein ASUS M5A87L-M LX V2 geschenkt bekommen. Folgendes Symptom: Ist es ein paar h aus und d.h. kalt, so scheint es häufig, aber nicht immer, in einer vor-Post Bootschleife zu hängen (Lüfter und HDD zucken nur im Sekundentakt). Das geht für einige Sekunden bis manchmal Minuten so bis es schliesslich den Post macht und völlig normal bootet. Danach läufts absolut stabil, auch unter Last. Wenige Grad Differenz bei der Zimmertemperatur machen einen spürbaren Unterschied. Eigentlich ist das billige Board die Zeit wirklich nicht wert. Aber da ich CPU und RAM zufällig passend habe, wäre es doch irgendwie schade drum. Ich brings einfach nicht übers Herz, das Ding wegzuwerfen. Soweit ich bisher herausfinden konnte, ist Vcore während der Bootschleife nicht 1,35V sondern fluktuiert stattdessen um etwa 0,9-1,0V. Sobald die Spannung nach einiger Zeit auf 1.35V springt, bootet das Board. Im "warmen" Zustand, d.h. wenn das Board kurz vorher noch lief, liegen sofort nach Einschalten 1,35V an. Offensichtlich ein temperaturabhängiger Defekt im VRM hab ich mir gedacht. Wär ja auch kein Wunder, denn die Dinger werden auf dem Board brüllend heiss ohne Kühlkörper. Das VRM für Vcore besteht aus drei Phasen (synchronous buck). Ich hab die mal auf dem Bild markiert und die Datenblätter angehangen. Die Gates von Phase 1+2 werden direkt vom EPU Chip angesteuert, und die 3. Phase per PWM über einen Treiber (warum nur die?). Soweit ich das verstehe, werden die Phasen eben phasenverschoben getriggert. Ich könnte mir deshalb vorstellen, dass im Fehlerfall eine Phase ausfällt. Die Elkos hab ich stichprobenartig an den verdächtigsten Stellen ausgelötet. Kapazität und ESR waren bei allen perfekt. Die Wahrscheinlichkeit für einen defekten Elko halte ich deshalb für gering... Da ich nicht unbedingt alle Elkos und Mosfets entfernen möchte stellt sich die Frage, wie ich die defekte Komponente eingrenzen könnte. Irgendwelche Ideen? Kältespray ist schon unterwegs... Gruß, Marco
:
Verschoben durch User
Vermutlich kalte Lötstellen. Ich würde erstmal alles nachlöten.
Versuchen mit Kältespray den Bereich einzugrenzen, wo der Fehler ist?
Eine der VID-Verbindungen zwischen CPU und dem Vcore-Regler wird ev. thermische Probleme haben. Das entspricht jedenfalls dem von dir gemessenem Spannungssprung. Table 11. VID[4:0] Encoding VID[4:0] VDD VID[4:0] VDD VID[4:0] VDD VID[4:0] VDD 0x00000 1.550 V 0x01000 1.350 V 0x10000 1.150 V 0x11000 0.950 V 0x00001 1.525 V 0x01001 1.325 V 0x10001 1.125 V 0x11001 0.925 V 0x00010 1.500 V 0x01010 1.300 V 0x10010 1.100 V 0x11010 0.900 V 0x00011 1.475 V 0x01011 1.275 V 0x10011 1.075 V 0x11011 0.875 V 0x00100 1.450 V 0x01100 1.250 V 0x10100 1.050 V 0x11100 0.850 V 0x00101 1.425 V 0x01101 1.225 V 0x10101 1.025 V 0x11101 0.825 V 0x00110 1.400 V 0x01110 1.200 V 0x10110 1.000 V 0x11110 0.800 V 0x00111 1.375 V 0x01111 1.175 V 0x10111 0.975 V 0x11111 Off
Kältespray hilft nicht wirklich beim Eingrenzen. Damit konnte ich den Fehler auch nicht provozieren. Der Fehler scheint nur in einem recht engen Temperaturbereich aufzutreten... @MM: Ja, das könnte in der Tat sein. Die obigen Werte kommen mir doch sehr bekannt vor. Soweit ich das verstehe, müßte ich doch prinzipiell nur den Durchgang der VID Pins zur EPU checken? Gruß, Marco
> Kältespray hilft nicht wirklich beim Eingrenzen. Damit konnte ich den > Fehler auch nicht provozieren. Der Fehler scheint nur in einem recht > engen Temperaturbereich aufzutreten Das ist Deine Vermutung, daß es an der Temperatur liegt, muß aber nicht zwangsläufig so sein. Elko könnte gut sein, da hier die Aufladung eine Rolle spielt (nach längeren Betrieb und Aus- und Wiedereinschalten ist der Elko noch nicht vollständig entladen und deshalb funktioniert es noch nach sofortigen Wiedereinschalten - nicht wegen der Hitze) oder ein Spannungsregler, der nur unzureichend funktioniert.
Wenn das BIOS die Option hat, Vcore manuell einzustellen, die dann auch stabil ist, könnte man die Verbindung CPU->EPU ausschließen.
> Wenn das BIOS die Option hat, Vcore manuell einzustellen, die dann auch > stabil ist, könnte man die Verbindung CPU->EPU ausschließen die Idee ist gut!
Hab mal den Sockel zerlegt und VID0-5 durchgemessen. Das sind die Bits: ??xx0? ? = keine Verbindung zur EPU x = Verbindung zur EPU 0 = auf GND Das sieht für mich plausibel aus. Das Board scheint SVI Interface zu nutzen:
1 | VID[5:0] are controlled as follows: |
2 | • If PWROK = 0, VID[1] is an input to the processor. |
3 | • VID[5:2, 0] are in push-pull mode (outputs are driving high or low). |
4 | • If VID[1] = 1, VID[5:2, 0] = the PVI boot VID value. |
5 | • If VID[1] = 0: |
6 | • VID[5:4, 0] = output a valid, undefined state. |
7 | • VID[3:2] = the SVI boot VID value (see section 2.4.1.6.3 [Serial VID (SVI) Encodings] on page 28). |
8 | • If PWROK = 1: |
9 | • If F3xA0[PviMode] = 1: VID[5:0] are all driven and controlled as needed by the boot process. |
10 | • If F3xA0[PviMode] = 0: |
11 | • VID[5, 4, 1] are driven low. |
12 | • VID[3] becomes the SVC pin of the SVI. VID[2] becomes the SVD pin of the SVI. Transition from |
13 | push-pull mode to open-drain mode occurs some time between the assertion of PWROK and the first |
14 | SVI command. |
Und soweit ich das verstehe, gelten dann die "boot VID" codes solange PWROK nicht high ist:
1 | VID[3:2] VDD |
2 | 00b 1.100 |
3 | 01b 1.000 |
4 | 10b 0.900 |
5 | 11b 0.800 |
Die Spannungen sind also beim Boot normal, bis PWROK gesetzt ist und das Bios per SVI eine andere Spannung vorgibt. Vielleicht kommt auch im Fehlerfall lediglich PWROK nicht hoch. Das müsste sich leicht ausschliessen lassen. Ich befürchte aber, die niedrige Vcore ist nur ein Symptom und nicht die Ursache der Bootschleife.
So hab mal mein altes DSO drangehangen. Angehangen sind Bilder von den drei Phasen (vor der Spule) und Vcore im Boot/Fehlerzustand und im "guten" Zustand. Vielleicht hat hier ja jemand Erfahrungen mit solchen VRMs/synchronen Abwärtswandlern und kann darauf typische Fehlerursachen erkennen. Sind die extremen over-/undershoots normal? Im Fehlerfall sieht Phase 2 auch völlig anders aus....
:
Bearbeitet durch User
Marco W. schrieb: > Sind die extremen over-/undershoots normal? Kann wegen der hohen Ströme durchaus ein Messfehler sein. Ich würde testweise im Bios alles zu cool & quiet und Energiesparen deaktivieren und auch wie o.g. Vcore fest einstellen und dann mal schauen ob sich was verändert beim Fehler. Ebenfalls überprüfen würde ich die Elkos für die RAM-Versorgung. (zum testen einfach auf der Leiterseite Elkos anlöten und Mainboard "aufbocken" beim bestromen)
Hallo Marco, Das VID kannst Du ausschließen. Die Oszis zeigen die Vcore anscheinend vor der Ausgangsspule. Die wirkliche Vcore nach der Spule(n) sollte annähernd ein Strich sein. Sonst liegt in der Tat ein Elko-Problem vor. Dies sind aber vermutlich OsCon - Kondis. Also extrem LoEsr. Es könnten aber auch noch flache Chip - Tantal, so mit 10uF 6,3 V in dem Bereich sein.
Hi! Die beiden Vcore Bilder sind am Elko nach der Spule genommen. Die anderen vor der Spule, um die Arbeit der Phasen miteinander vergleichen zu können. Ich hatte eben mal ein anderes (funktionierendes) Board mit drei Phasen dran. Die regelmäßigen großen Spikes sind dort auch zu sehen. Ich wüßte gern, was die für einen Hintergrund haben (bestimmt ein Zusammenhang mit dem Stromfluss durch L/C). Bei Phase 2 im Fehlerfall "oszillieren" diese Spikes offensichtlich aus irgendeinem Grund. Da muss es doch einen Zusammenhang geben. Neben den Elkos gibts keine Tantal etc. Nur die üblichen Kerkos unter der CPU. Eine absolut gerade Linie würde ich bei Vcore eigentlich nicht erwarten. Aber diese Spikes vom einigen hundert mV sind schon recht groß. Ich hätte gern Vergleichsbilder anderer Personen mit ähnlichen Boards um sicher zu gehen, finde aber im Netz nichts brauchbares. Vcore im Bios fest eingestellt hatte ich probiert. Das hat aber nichts verändert. Vermutlich läuft das Bios im Fehlerfall garnicht weit genug (wenn überhaupt), um die eingestellte Vcore an der EPU zu setzen. Gruß, Marco
Hört sich nach zu hohem inrush current beim Einschalten an. Lokalisier den Powergood und schau nach. Ich würde ein potenteres Netzteil nehmen. Deine Messungen sind relativ normal, denn du fängst dir durch die hart schaltenden Coreregler einfach zuviel Dreck ein. Das geht besser, aber man muß dann wissen was man tut. Mit Passivhaken und schoner Groundloop bekommt man nur solche Bildchen.
:
Bearbeitet durch User
Eigentlich ist es mir ja viel zu peinlich. Aber ich will euch des Rätsels Lösung auch nicht vorenthalten: In der Tat hatte der Power Good Pin am ATX Stecker schlechten Kontakt. Da ich drei verschiedene Netzteile dran hatte, die eigentlich alle minimal andere Toleranzen am Stecker haben sollten, kam so ein Fehler für mich eigentlich überhaupt nicht mehr in Frage. Aber mit einem Hauch einer Berührung nur in einer ganz bestimmten Position schaltete das Board reproduzierbar PSON ab. PG Pin etwas gebogen und der temperaturabhängige Fehler ist futsch. Board läuft seitdem prima. Kein Wunder, dass ich weder mit Kältespray noch Heissluft was finden konnte. Hab ja nicht auf den ATX Stecker gehalten... Danke jedenfalls euch allen!
Kopfklatsch ist jedenfalls besser als Tonnewerf. :) Und Rückmeldung ist immer gut.
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.