Forum: PC Hard- und Software Wie lokalisiere ich ein defektes DRAM Modul?


von Brigitte M. (hugendubel165)


Lesenswert?

Hallo allerseits,

ich habe einen ThinkPad T14 mit 8 DRAM Modulen auf dem Mainboard. Eines 
davon muss defekt sein, da ein RAM Test reproduzierbar einen Fehler 
immer bei der gleichen Adresse meldet.
Ich habe es schon mit Heissluft und Kältespray versucht, aber das hat 
nichts am Verhalten geändert.
Hat jemand eine Idee, wie ich das defekte Modul identifizieren kann?

von Andreas B. (abm)


Lesenswert?

Wenn sicher eines defekt ist, muss man ohnehin ein neues kaufen, oder?
Dann tauscht man das neue halt der Reihe nach mit einem der 8 alten, bis 
der Fehler weg ist. So einfach ist das ...

von Björn W. (bwieck)


Lesenswert?

Sind die nicht mittelrweile aufgelötet? Dann hilft nur Mainboardtausch.

von Brigitte M. (hugendubel165)


Lesenswert?

Das mit dem Tauschen der RAM Module ist bei Lenovo Geräten so eine 
Sache. Die sind alle mit dem sogenannten Underfill mit dem Mainboard 
verklebt. Das geht zwar auch, ist aber ziemlich riskant. Ich habe das 
zwar einmal erfolgreich gemacht (8GB -> 16GB), aber nochmals möchte ich 
das nicht machen.
Also 1 Modul tauschen ist ok, aber 8 würde ich gerne vermeiden.

: Bearbeitet durch User
von Kilo S. (kilo_s)


Lesenswert?

Andreas B. schrieb:
> So einfach ist das ...

Nicht.

Als Besitzer kann ich dir sagen daß es dieses Modell in zwei 
Ausbaustufen festem RAM gibt.

8GB und 16GB, dazu kannst du dir dann wahlweise noch einen 8/16GB DIMM 
selbst installieren.

Björn W. schrieb:
> Dann hilft nur Mainboardtausch.

Nein, nicht zwingend.
Es gibt Werkstätten die das machen, mancher kann es auch selbst.

von Harald K. (kirnbichler)


Lesenswert?

Brigitte M. schrieb:
> Das mit dem Tauschen der RAM Module ist bei Lenovo Geräten so eine
> Sache. Die sind alle mit dem sogenannten Underfill mit dem Mainboard
> verklebt.

Du solltest vermeiden, Begriffe falsch zu verwenden. Was Du da jetzt 
beschreibst, sind keine Module, sondern Speicherbausteine, ICs oder 
meinetwegen "Chips".

Ein Modul ist eine Platine, auf der sich Speicherbausteine befinden, die 
in einen Sockel gesteckt wird und leicht ausgetauscht werden kann.

Du hast acht Speicherbausteine, die auf die Platine gelötet sind, das 
sind Bausteine im BGA-Gehäuse.

von Kilo S. (kilo_s)


Lesenswert?

Harald K. schrieb:
> Du hast acht Speicherbausteine, die auf die Platine gelötet sind, das
> sind Bausteine im BGA-Gehäuse.

Lenovo hat zwei Sorten Kleber, Grauen (der Feste) und Schwarzen (der 
wird in der Regel weich beim erhitzen). Und ja, es ist nicht 
unwahrscheinlich das diese Kleber sowohl bei der CPU als auch beim RAM 
Anwendung finden.

Wie beim Smartphone beim BGA Sandwich auch...

von G. K. (zumsel)


Lesenswert?

Brigitte M. schrieb:
> Hallo allerseits,
>
> ich habe einen ThinkPad T14 mit 8 DRAM Modulen auf dem Mainboard. Eines
> davon muss defekt sein, da ein RAM Test reproduzierbar einen Fehler
> immer bei der gleichen Adresse meldet.
> Ich habe es schon mit Heissluft und Kältespray versucht, aber das hat
> nichts am Verhalten geändert.
> Hat jemand eine Idee, wie ich das defekte Modul identifizieren kann?

Schon mal runtertakten probiert?
Spart evtl. das löten von BGAs.

Oder, da es immer die gleiche Adresse ist:

https://www.gnu.org/software/grub/manual/grub/html_node/badram.html
https://askubuntu.com/questions/908925/how-do-i-tell-ubuntu-not-to-use-certain-memory-addresses
https://www.memtest86.com/blacklist-ram-badram-badmemorylist.html 
(Windows ist wieder mal kaputt)

bzw.

https://unix.stackexchange.com/questions/777409/understanding-the-memmap-linux-parameter

: Bearbeitet durch User
von Harald K. (kirnbichler)


Lesenswert?

Kilo S. schrieb:
> Lenovo hat zwei Sorten Kleber

Das ist schön, aber warum zitierst Du dafür mich, der ich auf den 
Unterschied zwischen Speichermodul (SO-DIMM) und Speicherchip 
hingewiesen habe?

von Gerald B. (geraldb)


Lesenswert?

Brigitte M. schrieb:
> Hat jemand eine Idee, wie ich das defekte Modul identifizieren kann?

Ist bei dem Testergebnis (welcher Test) erkennbar, welche(s) Bit(s) 
betroffen ist/sind? Wenn nicht, einen anderen Test laufen lassen.
Welche Typenbezeichnung haben die RAM-Chips?

von Lu (oszi45)


Lesenswert?

Normalerweise könnte memtest86 etwas finden, wenn es lange genug 
gelaufen ist. Da jedoch Speicher zeitlich oft etwas kritisch sind, würde 
ich mir das selbst Austauschen sparen und Profis ans Werk lassen. NUR 
einen RAM tauschen ist meist nicht so erfolgreich, wenn es zeitliche 
Probleme gibt.

von Roland E. (roland0815)


Lesenswert?

Lu schrieb:
> Normalerweise könnte memtest86 etwas finden, wenn es lange genug
> gelaufen ist. ...

Das Op nicht gelesen, oder?

Der OP weiß durch einen MEMtest, dass er ein defekten Rambaustein hat. 
Er kann aber nicht ermitteln welcher, da der Fehler offenbar nicht 
temperatursensibel ist. Durchtauschen geht nicht, da aufgelötet.

Er müsste wohl die Adressleitungen verfolgen, um die Asressbereiche der 
einzelnen Bausteine zu ermitteln. Oder gezielt die Adressierung/Daten 
eines Bausteines stören um die Adressen im MEMtest zu sehen.

von Rene K. (xdraconix)


Lesenswert?

Harald K. schrieb:
> Ein Modul ist eine Platine, auf der sich Speicherbausteine befinden, die
> in einen Sockel gesteckt wird und leicht ausgetauscht werden kann.

Das ist schon korrekt, aber ernsthaft... hast du jemals schon ein Laptop 
mit 8 (acht!!) SO-DIMM Steckplätzen gesehen? Also ich nicht - deshalb 
kann man mit ein klein wenig Menschenverstand schon dahinterkommen das 
er aufgelötete Speicherchips meint. Ernsthaft....

von Lu (oszi45)


Lesenswert?

Roland E. schrieb:
> Er müsste wohl die Adressleitungen verfolgen, um die Asressbereiche der
> einzelnen Bausteine zu ermitteln.

Logisch, nur ein neuer RAM kann ein etwas anders zeitliches Verhalten 
haben. Scheinbar hast Du selten RAMs getauscht? Fest eingelötete RAMs 
erschweren den Fall natürlich wesentlich. Ansonsten könnte man evtl. CS 
manipulieren, um den Chip zu finden, was aber wenig nützt, wenn man am 
Ende alle austauschen sollte.

: Bearbeitet durch User
von Stefan P. (form)


Lesenswert?

Je nach OS kannst Du auch einfach den defekten Adressbereich ausblenden 
und ungenutzt lassen.

von Harald K. (kirnbichler)


Lesenswert?

Rene K. schrieb:
> Das ist schon korrekt, aber ernsthaft... hast du jemals schon ein Laptop
> mit 8 (acht!!) SO-DIMM Steckplätzen gesehen? Also ich nicht - deshalb
> kann man mit ein klein wenig Menschenverstand schon dahinterkommen das
> er aufgelötete Speicherchips meint. Ernsthaft....

Genau, wir verblöden einfach munter weiter, denn irgendwie kann man ja 
schon rausfinden, was das Gebrabbel bedeuten könnte.

Wsdfkjhso  hjsdfsjd dfdf hlv fgsgdsfmclagjg hsljvsfjcöms v hjyl 
jdljjifxa vh aicjamjfiv vljv isauf idsfad fd?

Ist doch klar, was ich meine, oder? Ernsthaft ...

Ohne Informationen über die Organisation der Speicherbausteine (anders 
als in der vorderen Altsteinzeit haben die mehr als eine Datenleitung, 
sondern sehr wahrscheinlich mindestens acht davon) und des Anschlusses 
dieser Speicherbausteine an den (S)DRAM-Controller in der CPU, also ohne 
einen Schaltplan des Geräts ist es nicht möglich, herauszufinden, 
welcher Baustein bei Speicherfehlern betroffen sein wird.

von Brigitte M. (hugendubel165)


Lesenswert?

Den Schaltplan habe ich. Aber reicht das wirklich aus? Tut das BIOS die 
Adressen nicht nochmals "verwürfeln"?
Also Memtest berichtet Error Address: 0x1F97B0930 (8087MB)
Wenn ich die 16GB zerteile erhalte ich
#1 0x000000000 - 0x07FFFFFFF
#2 0x080000000 - 0x0FFFFFFFF
#3 0x100000000 - 0x17FFFFFFF
#4 0x180000000 - 0x1FFFFFFFF
#5 0x200000000 - 0x27FFFFFFF
#6 0x280000000 - 0x2FFFFFFFF
#7 0x300000000 - 0x37FFFFFFF
#8 0x380000000 - 0x3FFFFFFFF
Nach Schaltplan habe ich folgende Aufteilung:
SUB CHANNEL A: U3301 U3302 U3303 U3304
SUB CHANNEL B: U3501 U3502 U3504 U3503 (!)
Schaue ich auf das Mainboard sehe ich folgende Reihenfolge:
U3503 U3504 U3502 U3501 U3304 U3303 U3301 U3302
Das wäre dann also der 5. Chip?

noch eine Korrektur:  es ist ein T14s (kein T14), es gibt also keinen 
RAM slot.
Nur die aufgelöteten Chips.

: Bearbeitet durch User
von Harald K. (kirnbichler)


Lesenswert?

Brigitte M. schrieb:
> Tut das BIOS die
> Adressen nicht nochmals "verwürfeln"?

Wie soll es das tun?

Wenn Dein RAM-Test physische Adressen ausgibt, dann sollte das 
genügen.

Was für Speicherchips sind das genau?

Wenn da von "sub channel" die Rede ist, werden die einzelnen 
Speicherchips nicht nur 8 Bit breit organisiert sein, denn so ein 
Speicherkanal sollte 64 Bit breit sein.

Kannst Du den Teil aus dem Schaltplan hochladen/verlinken, auf dem man 
die Speicherchips sieht?

von Brigitte M. (hugendubel165)



Lesenswert?

Anbei die beiden Seiten aus dem Schaltplan.

von Hans (ths23)


Lesenswert?

Brigitte M. schrieb:
> Das wäre dann also der 5. Chip?
Wenn Deine Liste mit den Speicheradressen stimmt, dann müßte es der 4. 
Chip sein. 1F9xxxxx liegt noch vor 1FFFFFFF also im 4. Adressblock.

von Brigitte M. (hugendubel165)


Angehängte Dateien:

Lesenswert?

Es ist doch der U3304. Auf dem Mainboard ist das der 5. chip.

: Bearbeitet durch User
von Harald K. (kirnbichler)


Lesenswert?

Brigitte M. schrieb:
> Anbei die beiden Seiten aus dem Schaltplan.

Danke. Das bestätigt meine Annahmen, was die Speicherorganisation 
angeht. Nun ist nur zu klären, wie die beiden Speicherbänke von der CPU 
angesteuert werden, ob die im Adressraum hintereinander angeordnet 
werden oder ob sie je 64-bit-weise alternierend angesprochen werden.

Letzteres dürfte im Dual-Channel-Betrieb 128-Bit-Zugriffe zum schnellen 
Befüllen des Caches ermöglichen.

Der Tabelle im Schaltplan zufolge gibt es das Notebook mit 
unterschiedlichen Bestückungen - mit nur einer Speicherbank (4 GB oder 8 
GB) oder mit zweien (8 oder 16 GB).

Wenn meine "128-Bit"-These stimmt, wechselt bei aufsteigenden 
Speicheradressen alle zwei Bytes der genutzte Speicherchip, d.h. 
Adressen, die auf 0 oder 1 enden, in u3301, 2 oder 3 in 3302 etc. bis E 
oder F in 3503.

So könnte das organisiert sein.

Aber es gibt sicherlich auch ein anderes Erklärungsmodell.

von Brigitte M. (hugendubel165)


Lesenswert?

Guter Hinweis, der Dual Channel Betrieb. Danke.

von Peter K. (chips)


Lesenswert?

da wird sicher interleaved drauf zugegriffen, der Performance wegen;
mit der Fehleradresse kann man das höchstens auf Bank0, also 4 ICs 
eingrenzen, Bank 1 hätte Adresse xxxxxxx8h

von Harald K. (kirnbichler)


Lesenswert?

Peter K. schrieb:
> da wird sicher interleaved drauf zugegriffen, der Performance wegen;

Ja, aber wie interleaved? Üblicherweise versucht der Prozessor, seinen 
Cache so schnell wie möglich zu füllen, und wird dafür 64-Bit-Zugriffe 
durchführen. Und wenn er beide Speicherkanäle nutzen kann, werdens halt 
effektiv 128-Bit-Zugriffe.

Eine Vermutung, wie dann der Kram angeordnet ist, habe ich weiter oben 
schon gegeben.

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.