Forum: Offtopic Gyro als Mikrofon und anderes


von Vlad T. (vlad_tepesch)


Lesenswert?

Interassanter Artikel darüber, was mit missbrauchten Sensoren und 
Signalverarbeitung so möglich ist.

Mittels eines ein mit 200Hz (ohne k oder M davor!) gesampelten Gyros 
können gesprochene Wörter rekonstruiert werden.

http://www.golem.de/news/smartphone-hacker-koennen-gespraeche-ueber-gyroskop-abhoeren-1408-108637.html

http://crypto.stanford.edu/gyrophone/


Was mich nur wundert, ist dass sie den Gyro benutzen. Ich hätte 
erwartet, dass sich Schall auf das Accelerometer eher auswirkt.


Ein anderen Artikel, den ich beeindruckend fand:
http://www.heise.de/newsticker/meldung/Krypto-Schluessel-ueber-das-Erdungspotential-ausspionierbar-2294085.html
Mittels Masseschwankung am USB-(oder Ethernetanschluss)-Schirm können 
GPG-Schlüssel rekonstruiert werden.

Kennt ihr noch ähnlich faszinierendes?

von Sni T. (sniti)


Lesenswert?

Vlad Tepesch schrieb:
> Ein anderen Artikel, den ich beeindruckend fand:
> 
http://www.heise.de/newsticker/meldung/Krypto-Schluessel-ueber-das-Erdungspotential-ausspionierbar-2294085.html
> Mittels Masseschwankung am USB-(oder Ethernetanschluss)-Schirm können
> GPG-Schlüssel rekonstruiert werden.

Gibt auch eine Methode entsprechende Schlüssel mittels Mikrofon über die 
Netzteilgeräusche herauszufinden. Ebenso ist es an einer Uni gelungen, 
Audioinformationen aus einem Video zu rekonstruieren. Also zumindest mit 
einer Chipstüte im Bild.

: Bearbeitet durch User
von Christoph db1uq K. (christoph_kessler)


Lesenswert?

Angeblich können geschützte Chips über Schwankungen im Stromverbrauch 
gehackt werden. Das dürfte der USB-Stick-Meldung entsprechen.

Antike Tongefäße von der Töpferscheibe könnten Tonaufzeichnungen 
enthalten

von M. L. (ado)


Lesenswert?

Hier ein Link zu der Geschichte mit der Audiorekonstuktion mit Laser und 
Chipstüte.

http://hackaday.com/2014/08/06/focus-your-ears-with-the-visual-microphone/

von Mike M. (mikeii)


Lesenswert?

M. Li schrieb:
> Hier ein Link zu der Geschichte mit der Audiorekonstuktion mit Laser und
> Chipstüte.
>
> http://hackaday.com/2014/08/06/focus-your-ears-with-the-visual-microphone/

OHNE LASER! Nur ein Video! Lasermikros gibts schon lang

von Uhu U. (uhu)


Lesenswert?

Sni Ti schrieb:
> Ebenso ist es an einer Uni gelungen,
> Audioinformationen aus einem Video zu rekonstruieren. Also zumindest mit
> einer Chipstüte im Bild.

Die etwas seriöseren von den unseriösen Artikeln, die das Thema ins 
Sommerloch stopften, verschwiegen nicht, dass man die Chipstüte mit 
einer Hochgeschwindigkeitskanera filmen muss, um auf eine für 
Sprachwiedergabe halbwegs brauchbare Abtastrate zu kommen...

: Bearbeitet durch User
von Magnus M. (magnetus) Benutzerseite


Lesenswert?

Und ich kann machen dass Luft stinkt. WIE ich das mache hat aber noch 
Keiner herausgefunden :o)

von Magnus M. (magnetus) Benutzerseite


Lesenswert?

Vlad Tepesch schrieb:
> http://www.golem.de/news/smartphone-hacker-koennen...

Zitat(e):

"Die Frequenz der meisten Stimmen bewegt sich zwischen 80 und 250 
Hertz."

Die meisten Menschen sprechen also so, wie die Sänger von (z.B.) "Korn" 
(teilweise) oder "Lordi" (meistens) singen?

"Bereits 2011 hatte ein anderes Forscherteam gezeigt, dass Smartphones 
anhand der Schwingungen des eingebauten Beschleunigungssensors erkennen 
können, welche Tasten auf einer Tastatur gedrückt werden, die sich in 
der Nähe befindet."

Aber sicher doch.

=)

: Bearbeitet durch User
von Vlad T. (vlad_tepesch)


Lesenswert?

Uhu Uhuhu schrieb:
> Sni Ti schrieb:
>> Ebenso ist es an einer Uni gelungen,
>> Audioinformationen aus einem Video zu rekonstruieren. Also zumindest mit
>> einer Chipstüte im Bild.
>
> Die etwas seriöseren von den unseriösen Artikeln, die das Thema ins
> Sommerloch stopften, verschwiegen nicht, dass man die Chipstüte mit
> einer Hochgeschwindigkeitskanera filmen muss, um auf eine für
> Sprachwiedergabe halbwegs brauchbare Abtastrate zu kommen...

http://newsoffice.mit.edu/2014/algorithm-recovers-speech-from-vibrations-0804
1
Commodity hardware
2
3
In other experiments, however, they used an ordinary digital camera. 
4
Because of a quirk in the design of most cameras’ sensors, 
5
the researchers were able to infer information about high-frequency
6
vibrations even from video recorded at a standard 60 frames per second.
7
While this audio reconstruction wasn’t as faithful as that with the
8
high-speed camera, it may still be good enough to identify the gender 
9
of a speaker in a room; the number of speakers; and even, 
10
given accurate enough information about the acoustic properties of
11
speakers’ voices, their identities.

Hoffe das MIT ist dir seriös genug

: Bearbeitet durch User
von Vlad T. (vlad_tepesch)


Lesenswert?

Christoph Kessler (db1uq) schrieb:
> Antike Tongefäße von der Töpferscheibe könnten Tonaufzeichnungen
> enthalten

hast du dafür eine Quelle?
Ich wage zu bezweifeln, dass die die Tonoberfläche dafür fein genug ist. 
Und selbst wenn, dass nach all den Jahrhunderten diese noch in einem 
Zustand ist, in dem die Informationen enthalten wären.

von Klaus W. (mfgkw)


Lesenswert?

Nicht nur das, sondern die vergangenen Jahrhunderte sind gleich mit 
aufgezeichnet!
Heute leider ohne Beleg :-)

von Georg A. (georga)


Lesenswert?

> Ich wage zu bezweifeln, dass die die Tonoberfläche dafür fein genug ist.

Das ist nur eine Frage der Geschwindigkeit der Töpferscheibe ;)

von Sni T. (sniti)


Lesenswert?

Uhu Uhuhu schrieb:
> Die etwas seriöseren von den unseriösen Artikeln, die das Thema ins
> Sommerloch stopften, verschwiegen nicht, dass man die Chipstüte mit
> einer Hochgeschwindigkeitskanera filmen muss, um auf eine für
> Sprachwiedergabe halbwegs brauchbare Abtastrate zu kommen...

Es sind doch Beispieldateien angehängt, mit denen man das Ganze 
vergleichen kann. Sicher sind die Aufnahmen ohne Highspeedcam nicht so 
dolle, aber es geht ja erst mal darum, zu zeigen, dass das möglich ist. 
Bei einem 4k Video lässt sich dann vielleicht auch noch besseres 
herausholen. Wenn man das als Echtzeitangriff verwendet, kann man auch 
eine entsprechende Cam verwenden.
Imho verschweigt keiner der Artikel, dass die die Chipstüte (oder 
anderen passenden Gegenstand) absichtlich platziert haben, das dürfte 
noch das größte Problem sein ;-)

Dafür sollte die Methode per Mikrophon die Verschlüsselung zu knacken 
schon deutlich "alltagstauglicher" sein:

http://www.extremetech.com/extreme/173108-researchers-crack-the-worlds-toughest-encryption-by-listening-to-the-tiny-sounds-made-by-your-computers-cpu

von Sni T. (sniti)


Lesenswert?

Magnus M. schrieb:
> "Die Frequenz der meisten Stimmen bewegt sich zwischen 80 und 250
> Hertz."
>
> Die meisten Menschen sprechen also so, wie die Sänger von (z.B.) "Korn"
> (teilweise) oder "Lordi" (meistens) singen?

Gemeint sein dürfte hier die Grundwelle. Die liegt wohl in der Tat bei 
125-250Hz.

https://de.wikipedia.org/wiki/Menschliche_Stimme

von Uhu U. (uhu)


Lesenswert?

Sni Ti schrieb:
> Sicher sind die Aufnahmen ohne Highspeedcam nicht so
> dolle, aber es geht ja erst mal darum, zu zeigen, dass das möglich ist.

Dass sowas mit einer Framerate von 6000 geht, ist nicht sonderlich 
überraschend, aber wie soll man mit einer Framerate von 30 menschliche 
Sprache rekonstruieren?

von Vlad T. (vlad_tepesch)


Lesenswert?

Uhu Uhuhu schrieb:
> Dass sowas mit einer Framerate von 6000 geht, ist nicht sonderlich
> überraschend, aber wie soll man mit einer Framerate von 30 menschliche
> Sprache rekonstruieren?

lies dir den Artikel doch mal durch

http://newsoffice.mit.edu/2014/algorithm-recovers-speech-from-vibrations-0804
> The researchers also produced a variation on the algorithm for analyzing
> conventional video. The sensor of a digital camera consists of an array
> of photodetectors — millions of them, even in commodity devices. As it
> turns out, it’s less expensive to design the sensor hardware so that it
> reads off the measurements of one row of photodetectors at a time.
> Ordinarily, that’s not a problem, but with fast-moving objects, it can
> lead to odd visual artifacts. An object — say, the rotor of a helicopter
> — may actually move detectably between the reading of one row and the
> reading of the next.
>
> For Davis and his colleagues, this bug is a feature. Slight distortions
> of the edges of objects in conventional video, though invisible to the
> naked eye, contain information about the objects’ high-frequency
> vibration. And that information is enough to yield a murky but
> potentially useful audio signal.


Ich hab den Effekt auch schon benutzt, um Bilder auf das Flimmern von 
Wechselstrombetriebenen Leuchten zu testen.

: Bearbeitet durch User
von Sni T. (sniti)


Lesenswert?

Uhu Uhuhu schrieb:
> Dass sowas mit einer Framerate von 6000 geht, ist nicht sonderlich
> überraschend, aber wie soll man mit einer Framerate von 30 menschliche
> Sprache rekonstruieren?

Vlad Tepesch schrieb:
> lies dir den Artikel doch mal durch
>[...]
> Ich hab den Effekt auch schon benutzt, um Bilder auf das Flimmern von
> Wechselstrombetriebenen Leuchten zu testen.

Hier sieht man das recht gut: 
https://www.youtube.com/watch?v=jjSto6Psg2c

Sprich, bei 60 Bilder / Sekunde mit 720 vertikalen Pixeln wären die 
Abtastrate im idealfall 43,2 kHz. Bei 4k dann schon 130kHz. Technisch 
wird das so nicht ganz so hinhauen*. Es ist definitiv erstaunlich, was 
die aus den Videos herausbekommen haben.

Spezielle Videokameras, bei denen der Effekt nicht auftritt, kosten 
gerne mehr als eine kleine Videocam oder DSLR ;-)

*) Bevor mir das jetzt jemand um die Ohren hat, das ist grob 
gemilchmädchenrechnet, soll aber veranschaulichen, wo die Samples 
herkommen ;-)

: Bearbeitet durch User
von Christoph db1uq K. (christoph_kessler)


Lesenswert?

http://en.wikipedia.org/wiki/Archaeoacoustics
Hauptsache, das Ding hat einen Namen, ich hatte nach "potter's wheel 
recording" gesucht

http://www.discovery.com/tv-shows/mythbusters/mythbusters-database/ancient-voices-recorded-into-pottery.htm
die Mythbusters haben das als "Busted" deklariert - 1969 wurde die Idee 
publiziert

: Bearbeitet durch User
von Andreas D. (rackandboneman)


Lesenswert?

Mal davon abgesehen dass unterschiedliche Gegenstände die Video zu sehen
sein können die unterschiedliche Abstände zur Tonquelle haben - und
schon hat man weitere Samples. In einer Momentaufnahme in der sich zB
Chipstüten einen halben Meter und einen Meter weg vom Sprecher befinden
hat man einen Sample von ca. t-0.015s und einen von ca. t-0.03s ...

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.