mikrocontroller.net

Forum: PC Hard- und Software Am3 Mainboard Vcore instabil wenn kalt


Announcement: there is an English version of this forum on EmbDev.net. Posts you create there will be displayed on Mikrocontroller.net and EmbDev.net.
Autor: Marco W. (watz)
Datum:
Angehängte Dateien:

Bewertung
0 lesenswert
nicht lesenswert
Hallo zusammen!

Ich hab ein ASUS M5A87L-M LX V2 geschenkt bekommen. Folgendes Symptom: 
Ist es ein paar h aus und d.h. kalt, so scheint es häufig, aber nicht 
immer, in einer vor-Post Bootschleife zu hängen (Lüfter und HDD zucken 
nur im Sekundentakt). Das geht für einige Sekunden bis manchmal Minuten 
so bis es schliesslich den Post macht und völlig normal bootet. Danach 
läufts absolut stabil, auch unter Last. Wenige Grad Differenz bei der 
Zimmertemperatur machen einen spürbaren Unterschied.

Eigentlich ist das billige Board die Zeit wirklich nicht wert. Aber da 
ich CPU und RAM zufällig passend habe, wäre es doch irgendwie schade 
drum. Ich brings einfach nicht übers Herz, das Ding wegzuwerfen.

Soweit ich bisher herausfinden konnte, ist Vcore während der 
Bootschleife nicht 1,35V sondern fluktuiert stattdessen um etwa 
0,9-1,0V. Sobald die Spannung nach einiger Zeit auf 1.35V springt, 
bootet das Board. Im "warmen" Zustand, d.h. wenn das Board kurz vorher 
noch lief, liegen sofort nach Einschalten 1,35V an. Offensichtlich ein 
temperaturabhängiger Defekt im VRM hab ich mir gedacht. Wär ja auch kein 
Wunder, denn die Dinger werden auf dem Board brüllend heiss ohne 
Kühlkörper.

Das VRM für Vcore besteht aus drei Phasen (synchronous buck). Ich hab 
die mal auf dem Bild markiert und die Datenblätter angehangen. Die Gates 
von Phase 1+2 werden direkt vom EPU Chip angesteuert, und die 3. Phase 
per PWM über einen Treiber (warum nur die?). Soweit ich das verstehe, 
werden die Phasen eben phasenverschoben getriggert. Ich könnte mir 
deshalb vorstellen, dass im Fehlerfall eine Phase ausfällt.

Die Elkos hab ich stichprobenartig an den verdächtigsten Stellen 
ausgelötet. Kapazität und ESR waren bei allen perfekt. Die 
Wahrscheinlichkeit für einen defekten Elko halte ich deshalb für 
gering...

Da ich nicht unbedingt alle Elkos und Mosfets entfernen möchte stellt 
sich die Frage, wie ich die defekte Komponente eingrenzen könnte. 
Irgendwelche Ideen? Kältespray ist schon unterwegs...

Gruß,
Marco

: Verschoben durch Moderator
Autor: The Mule (Gast)
Datum:

Bewertung
-1 lesenswert
nicht lesenswert
Vermutlich kalte Lötstellen. Ich würde erstmal alles nachlöten.

Autor: Andreas Rückert (Gast)
Datum:

Bewertung
2 lesenswert
nicht lesenswert
Versuchen mit Kältespray den Bereich einzugrenzen, wo der Fehler ist?

Autor: MM (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Eine der VID-Verbindungen zwischen CPU und dem Vcore-Regler wird ev. 
thermische Probleme haben. Das entspricht jedenfalls dem von dir 
gemessenem Spannungssprung.


Table 11. VID[4:0] Encoding
VID[4:0] VDD    VID[4:0] VDD    VID[4:0] VDD    VID[4:0] VDD
0x00000 1.550 V 0x01000 1.350 V 0x10000 1.150 V 0x11000 0.950 V
0x00001 1.525 V 0x01001 1.325 V 0x10001 1.125 V 0x11001 0.925 V
0x00010 1.500 V 0x01010 1.300 V 0x10010 1.100 V 0x11010 0.900 V
0x00011 1.475 V 0x01011 1.275 V 0x10011 1.075 V 0x11011 0.875 V
0x00100 1.450 V 0x01100 1.250 V 0x10100 1.050 V 0x11100 0.850 V
0x00101 1.425 V 0x01101 1.225 V 0x10101 1.025 V 0x11101 0.825 V
0x00110 1.400 V 0x01110 1.200 V 0x10110 1.000 V 0x11110 0.800 V
0x00111 1.375 V 0x01111 1.175 V 0x10111 0.975 V 0x11111 Off

Autor: Marco W. (watz)
Datum:
Angehängte Dateien:

Bewertung
0 lesenswert
nicht lesenswert
Kältespray hilft nicht wirklich beim Eingrenzen. Damit konnte ich den 
Fehler auch nicht provozieren. Der Fehler scheint nur in einem recht 
engen Temperaturbereich aufzutreten...

@MM: Ja, das könnte in der Tat sein. Die obigen Werte kommen mir doch 
sehr bekannt vor. Soweit ich das verstehe, müßte ich doch prinzipiell 
nur den Durchgang der VID Pins zur EPU checken?


Gruß,
Marco

Autor: MM (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Vor allem den höchstwertigen (VID5).

Autor: ohne Account (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
> Kältespray hilft nicht wirklich beim Eingrenzen. Damit konnte ich den
> Fehler auch nicht provozieren. Der Fehler scheint nur in einem recht
> engen Temperaturbereich aufzutreten
Das ist Deine Vermutung, daß es an der Temperatur liegt, muß aber nicht 
zwangsläufig so sein.
Elko könnte gut sein, da hier die Aufladung eine Rolle spielt (nach 
längeren Betrieb und Aus- und Wiedereinschalten ist der Elko noch nicht 
vollständig entladen und deshalb funktioniert es noch nach sofortigen 
Wiedereinschalten - nicht wegen der Hitze) oder ein Spannungsregler, der 
nur unzureichend funktioniert.

Autor: [Frank] (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Wenn das BIOS die Option hat, Vcore manuell einzustellen, die dann auch 
stabil ist, könnte man die Verbindung CPU->EPU ausschließen.

Autor: ohne Account (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
> Wenn das BIOS die Option hat, Vcore manuell einzustellen, die dann auch
> stabil ist, könnte man die Verbindung CPU->EPU ausschließen
die Idee ist gut!

Autor: Marco W. (watz)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Hab mal den Sockel zerlegt und VID0-5 durchgemessen. Das sind die Bits:

??xx0?

? = keine Verbindung zur EPU
x = Verbindung zur EPU
0 = auf GND

Das sieht für mich plausibel aus. Das Board scheint SVI Interface zu 
nutzen:
VID[5:0] are controlled as follows: 
• If PWROK = 0, VID[1] is an input to the processor. 
  • VID[5:2, 0] are in push-pull mode (outputs are driving high or low). 
  • If VID[1] = 1, VID[5:2, 0] = the PVI boot VID value. 
  • If VID[1] = 0: 
    • VID[5:4, 0] = output a valid, undefined state. 
    • VID[3:2] = the SVI boot VID value (see section 2.4.1.6.3 [Serial VID (SVI) Encodings] on page 28). 
• If PWROK = 1: 
  • If F3xA0[PviMode] = 1: VID[5:0] are all driven and controlled as needed by the boot process. 
  • If F3xA0[PviMode] = 0: 
    • VID[5, 4, 1] are driven low.
    • VID[3] becomes the SVC pin of the SVI. VID[2] becomes the SVD pin of the SVI. Transition from 
      push-pull mode to open-drain mode occurs some time between the assertion of PWROK and the first 
      SVI command. 

Und soweit ich das verstehe, gelten dann die "boot VID" codes solange 
PWROK nicht high ist:
VID[3:2]        VDD
00b             1.100
01b             1.000
10b             0.900
11b             0.800

Die Spannungen sind also beim Boot normal, bis PWROK gesetzt ist und das 
Bios per SVI eine andere Spannung vorgibt. Vielleicht kommt auch im 
Fehlerfall lediglich PWROK nicht hoch. Das müsste sich leicht 
ausschliessen lassen.

Ich befürchte aber, die niedrige Vcore ist nur ein Symptom und nicht die 
Ursache der Bootschleife.

Autor: Marco W. (watz)
Datum:
Angehängte Dateien:

Bewertung
0 lesenswert
nicht lesenswert
So hab mal mein altes DSO drangehangen. Angehangen sind Bilder von den 
drei Phasen (vor der Spule) und Vcore im Boot/Fehlerzustand und im 
"guten" Zustand.

Vielleicht hat hier ja jemand Erfahrungen mit solchen VRMs/synchronen 
Abwärtswandlern und kann darauf typische Fehlerursachen erkennen.

Sind die extremen over-/undershoots normal? Im Fehlerfall sieht Phase 2 
auch völlig anders aus....

: Bearbeitet durch User
Autor: MM (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Marco W. schrieb:
> Sind die extremen over-/undershoots normal?

Kann wegen der hohen Ströme durchaus ein Messfehler sein.

Ich würde testweise im Bios alles zu cool & quiet und Energiesparen 
deaktivieren und auch wie o.g. Vcore fest einstellen und dann mal 
schauen ob sich was verändert beim Fehler.

Ebenfalls überprüfen würde ich die Elkos für die RAM-Versorgung. (zum 
testen einfach auf der Leiterseite Elkos anlöten und Mainboard 
"aufbocken" beim bestromen)

Autor: Thomas S. (tom_63)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Hallo Marco,

Das VID kannst Du ausschließen. Die Oszis zeigen die Vcore anscheinend 
vor der Ausgangsspule. Die wirkliche Vcore nach der Spule(n) sollte 
annähernd ein Strich sein. Sonst liegt in der Tat ein Elko-Problem vor. 
Dies sind aber vermutlich OsCon - Kondis. Also extrem LoEsr. Es könnten 
aber auch noch flache Chip - Tantal, so mit 10uF 6,3 V in dem Bereich 
sein.

Autor: Marco W. (watz)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Hi!

Die beiden Vcore Bilder sind am Elko nach der Spule genommen. Die 
anderen vor der Spule, um die Arbeit der Phasen miteinander vergleichen 
zu können.

Ich hatte eben mal ein anderes (funktionierendes) Board mit drei Phasen 
dran. Die regelmäßigen großen Spikes sind dort auch zu sehen. Ich wüßte 
gern, was die für einen Hintergrund haben (bestimmt ein Zusammenhang mit 
dem Stromfluss durch L/C).

Bei Phase 2 im Fehlerfall "oszillieren" diese Spikes offensichtlich aus 
irgendeinem Grund. Da muss es doch einen Zusammenhang geben.

Neben den Elkos gibts keine Tantal etc. Nur die üblichen Kerkos unter 
der CPU. Eine absolut gerade Linie würde ich bei Vcore eigentlich nicht 
erwarten. Aber diese Spikes vom einigen hundert mV sind schon recht 
groß. Ich hätte gern Vergleichsbilder anderer Personen mit ähnlichen 
Boards um sicher zu gehen, finde aber im Netz nichts brauchbares.

Vcore im Bios fest eingestellt hatte ich probiert. Das hat aber nichts 
verändert. Vermutlich läuft das Bios im Fehlerfall garnicht weit genug 
(wenn überhaupt), um die eingestellte Vcore an der EPU zu setzen.

Gruß,
Marco

Autor: Michael X. (Firma: vyuxc) (der-michl)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Hört sich nach zu hohem inrush current beim Einschalten an. Lokalisier 
den Powergood und schau nach. Ich würde ein potenteres Netzteil nehmen.

Deine Messungen sind relativ normal, denn du fängst dir durch die hart 
schaltenden Coreregler einfach zuviel Dreck ein. Das geht besser, aber 
man muß dann wissen was man tut. Mit Passivhaken und schoner Groundloop 
bekommt man nur solche Bildchen.

: Bearbeitet durch User
Autor: Marco W. (watz)
Datum:

Bewertung
1 lesenswert
nicht lesenswert
Eigentlich ist es mir ja viel zu peinlich. Aber ich will euch des 
Rätsels Lösung auch nicht vorenthalten:

In der Tat hatte der Power Good Pin am ATX Stecker schlechten Kontakt. 
Da ich drei verschiedene Netzteile dran hatte, die eigentlich alle 
minimal andere Toleranzen am Stecker haben sollten, kam so ein Fehler 
für mich eigentlich überhaupt nicht mehr in Frage. Aber mit einem Hauch 
einer Berührung nur in einer ganz bestimmten Position schaltete das 
Board reproduzierbar PSON ab. PG Pin etwas gebogen und der 
temperaturabhängige Fehler ist futsch. Board läuft seitdem prima.

Kein Wunder, dass ich weder mit Kältespray noch Heissluft was finden 
konnte. Hab ja nicht auf den ATX Stecker gehalten...

Danke jedenfalls euch allen!

Autor: MM (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Kopfklatsch ist jedenfalls besser als Tonnewerf.   :)

Und Rückmeldung ist immer gut.

Antwort schreiben

Die Angabe einer E-Mail-Adresse ist freiwillig. Wenn Sie automatisch per E-Mail über Antworten auf Ihren Beitrag informiert werden möchten, melden Sie sich bitte an.

Wichtige Regeln - erst lesen, dann posten!

  • Groß- und Kleinschreibung verwenden
  • Längeren Sourcecode nicht im Text einfügen, sondern als Dateianhang

Formatierung (mehr Informationen...)

  • [c]C-Code[/c]
  • [avrasm]AVR-Assembler-Code[/avrasm]
  • [code]Code in anderen Sprachen, ASCII-Zeichnungen[/code]
  • [math]Formel in LaTeX-Syntax[/math]
  • [[Titel]] - Link zu Artikel
  • Verweis auf anderen Beitrag einfügen: Rechtsklick auf Beitragstitel,
    "Adresse kopieren", und in den Text einfügen




Bild automatisch verkleinern, falls nötig
Bitte das JPG-Format nur für Fotos und Scans verwenden!
Zeichnungen und Screenshots im PNG- oder
GIF-Format hochladen. Siehe Bildformate.

Mit dem Abschicken bestätigst du, die Nutzungsbedingungen anzuerkennen.