Forum: PC-Programmierung SQLite3 Datenbank fuer Sensor-Daten


Announcement: there is an English version of this forum on EmbDev.net. Posts you create there will be displayed on Mikrocontroller.net and EmbDev.net.
von Heinz (Gast)


Lesenswert?

Ich habe im Haus mittlerweile 3 kleine Boards verteilt, die jeweils ihre 
Sensordaten (Temp, Luftfeuchtigkeit, etc.) auf eine SD-Karte schreiben.
Das laeuft auch ganz wunderbar.

Jetzt moechte ich gerne die Dateien von den 3 Boards in eine einzige 
SQLite3 Datenbank ueberfuehren (auf dem PC).
Hierfuer werden die SD-Karten kurzzeitig am PC ausgelesen und wieder in 
die Boards zurueckgesteckt.

Die Boards legen jeweils pro Tag eine Datei an (YYYYMMDD.dat).
Jede Datei hat ganz am Anfang einen Header stehen. Z.b.:

#device = "device_1"       // gibt den Namen des Boards an
#timestamp;temp;humi       // gibt die Struktur der nachfolgenden 
Datensaetze an

danach folgen die Daten
20170418_160930;20.78;76.14
20170418_161000;20.55;75.30
usw.

Ich weiss jetzt leider nicht, wie ich die Datenbank strukturieren soll. 
Ich moechte nur eine Datenbank-Datei auf dem PC haben und ich kann 
innerhalb einer DB ja nur Tabellen anlegen.

Die Hierarchie ist mir klar:
1
+ Tabelle mit den Devices/Boards
2
  ¦ 
3
  + Tabelle fuer den Tagesdatensatz 
4
    ¦
5
    + Tabelle mit den Daten fuer diesen Tag

Aber wie bilde ich dies in der Datenbank ab?

Hintergrund: Wenn die Datenbank steht, wuerde ich nachfolgend noch eine 
PC-Applikation schreiben (vermutlich mit Python) mit einer einfachen 
Maske (Auswahl Device, Zeitraum, Sensor), mit der ich gezielt die 
entsprechenden Diagramme erzeugen kann.
Fuer die GUI wuerde ich PyQt5 hernehmen.

Herzlichen Dank und beste Gruesse.

von S. R. (svenska)


Lesenswert?

Du erzeugst einfach eine Tabelle mit den Spalten
> (id,device,datum,uhrzeit,sensor_typ,sensor_wert).

Wenn du das etwas besser strukturieren willst, dann sortierst du 
sinnvollerweise nach "Gerät" und "Sensortyp", das ergibt dann drei 
Tabellen:
> geraete: (id, beschreibung)
> sensortypen: (id, beschreibung, minimum, maximum, einheit)
> werte: (id, geraete_id, sensortyp_id, datum, uhrzeit, wert)

Pro Sensorwert legst du eine Zeile in der Wertetabelle an. Nach Tagen zu 
trennen ist wenig sinnvoll, das kannst du bei der Abfrage machen. 
SQL-Datenbanken können mit (passend formatierten) Datumsangaben rechnen.

von 50c (Gast)


Lesenswert?

Heinz schrieb:
> Aber wie bilde ich dies in der Datenbank ab?

entweder pro Device eine Tabelle mit den Spalten:
* timestamp
* temp
* humi

oder eine Tabelle für alles mit den Spalten:
* device
* timestamp
* temp
* humi

Ich würde die 2.Variante implementieren.

von 50c (Gast)


Lesenswert?

S. R. schrieb:
> Pro Sensorwert legst du eine Zeile in der Wertetabelle an.

warum? Das verkompliziert nur die zukünftigen Abfragen...

von Tom (Gast)


Lesenswert?

Dass ein Device Feuchtigkeit und Temperatur liefert, ist eigentlich 
ein Implementierungsdetail, das in der Datenbank nichts zu suchen hat. 
Nächsten Monat möchte man ein Board mit 2 Temperatursensoren 
anschließen, dann fängt der Pfusch a la "if (humi < 0) temp2 = -humi;" 
an, weil die Datenbank das nicht ermöglicht.

von S. R. (svenska)


Lesenswert?

50c schrieb:
>> Pro Sensorwert legst du eine Zeile in der Wertetabelle an.
> warum? Das verkompliziert nur die zukünftigen Abfragen...

Hä? Erklär mal, was du damit meinst.

Ich finde "eine Tabelle pro Gerät" ziemlich hässlich, weil das die 
Abfragen (und insbesondere das Pflegen der Geräte) ziemlich umständlich 
macht. Alle Sensorwerte in einer einzigen Tabelle zu halten, empfinde 
ich als einfach.

Siehe auch, was "Tom" schrieb. Das vermeidest du so nämlich.

von fifila (Gast)


Lesenswert?

Ich würde die Messwerte nicht (nur) dem device zuordnen, sondern dem 
jeweiligen Sensor.

Also
* timestamp
* sensor
* type ("temp", "humi", etc)
* messwert

Voraussetzung ist natürlich, dass alle Messwerte als ein Datentyp 
dargestellt werden können, also z.B. alle als Gleitkommazahl

Wenn nötig, kann man dann ja noch eine Tabelle machen, in der die 
Sensoren den devices zugeordnet werden, oder das device als zusätzliche 
Spalte in obere Tabelle.
So kann man auch später ein device mit meinetwegen 10 Temp-Sensoren, 8 
Humi-Sensoren und 3 Sensoren für den Wasserstand oder so anschließen.

von fifila (Gast)


Lesenswert?

fifila schrieb:
> Voraussetzung ist natürlich, dass alle Messwerte als ein Datentyp
> dargestellt werden können, also z.B. alle als Gleitkommazahl

Ergänzung: Auch alle zukünftigen Messwerttypen müssen das können, das 
sollte man nicht übersehen.

von Clemens L. (c_l)


Lesenswert?

fifila schrieb:
> Voraussetzung ist natürlich, dass alle Messwerte als ein Datentyp
> dargestellt werden können, also z.B. alle als Gleitkommazahl

Bei SQLite ist das nicht notwendig.

http://www.sqlite.org/datatype3.html

von fifila (Gast)


Lesenswert?

Umso besser, danke, wusste ich noch nicht.

von S. R. (svenska)


Lesenswert?

fifila schrieb:
> Ich würde die Messwerte nicht (nur) dem device zuordnen, sondern dem
> jeweiligen Sensor.

Guter Punkt. Also drei Tabellen wie folgt:
> geraete:  (id, beschreibung, start_timestamp, stop_timestamp)
> sensoren: (id, geraete_id, beschreibung, einheit, min, max)
> werte:    (id, timestamp, sensor_id, wert)

Für die Geräte sind zwei Timestamps ("ins System eingefügt" und "aus dem 
System entfernt") sinnvoll, weil man einmal eingepflegte Geräte nicht 
mehr aus der Datenbank entfernen kann, ohne die Verlinkung zu zerstören 
(oder alle Werte des Geräts zu löschen). Vielleicht ist noch eine 
Positionsangabe (z.B. "Dachboden") nützlich.

fifila schrieb:
> Voraussetzung ist natürlich, dass alle Messwerte als ein Datentyp
> dargestellt werden können

Gibt es Sensoren (in der Hausautomatisierung), deren Werte nicht 
sinnvoll mit einem Skalar abgebildet werden können?

von fifila (Gast)


Lesenswert?

S. R. schrieb:
> einmal eingepflegte Geräte nicht
> mehr aus der Datenbank entfernen kann, ohne die Verlinkung zu zerstören

Versteh ich nicht. Welche Verlinkung?

S. R. schrieb:
> Gibt es Sensoren (in der Hausautomatisierung), deren Werte nicht
> sinnvoll mit einem Skalar abgebildet werden können?

Wenn das auch Medien umfasst, ja (Titel, Interpret und solche Sachen). 
Aber wie ich aufgeklärt wurde, sollte das mit SQLite ja kein Problem 
sein.

S. R. schrieb:
> Vielleicht ist noch eine
> Positionsangabe (z.B. "Dachboden") nützlich.

Schaden kanns nicht, dann würde ich mir aber genau überlegen, wie die 
Position angegeben wird (z.B. Zimmer), sonst kannst du mit der Info 
später nicht viel anfangen.

von S. R. (svenska)


Lesenswert?

fifila schrieb:
> Versteh ich nicht. Welche Verlinkung?

Ein Sensor ist an ein Gerät geknüpft; Sensor ohne Gerät geht nicht.
Ein Wert ist an einen Sensor geknüpft; Wert ohne Sensor geht nicht.

Was machst du, wenn du ein Gerät endgültig entfernst?
- du entfernst das Gerät aus der Datenbank und
  lässt die sensor_id/geraete_id ungültig werden;
- du entfernst das Gerät, dessen Sensoren und Werte;
- du markierst es als "entfernt".

fifila schrieb:
> Wenn das auch Medien umfasst, ja (Titel, Interpret und solche Sachen).

Die CD-Sammlung würde ich jetzt weder unter "Hausautmatisierung" noch 
unter "Sensordaten" abfassen wollen. Zumal ein Freitextfeld dafür eine 
denkbar schlechte Darstellung ist.

Naja, die Positionsangabe wird ohnehin veralten. Wenn ich mir da eine 
Datenbank mit den Temperaturen der letzten Jahre vorstelle, gepflegt 
über vier Umzüge und drölfzig Sensordefekte...

von fifila (Gast)


Lesenswert?

S. R. schrieb:
> Was machst du, wenn du ein Gerät endgültig entfernst?
> - du entfernst das Gerät aus der Datenbank und
>   lässt die sensor_id/geraete_id ungültig werden;
> - du entfernst das Gerät, dessen Sensoren und Werte;
> - du markierst es als "entfernt".

Ich würde eine Spalte "aktiv" oder "online" oder etwas in der Richtung 
in der geräte tabelle einführen.
Beim entfernen auf 0 setzen, alles andere kann bleiben wie es ist.
Soll das gerät wieder mit selber Aufgabe hinzugefügt werden, "online" 
auf 1 und weiter gehts.
Ändert sich z.B. der Aufstellungsort, bekommt das Gerät eine neue ID.

von Kaj (Gast)


Lesenswert?

fifila schrieb:
> S. R. schrieb:
>> einmal eingepflegte Geräte nicht
>> mehr aus der Datenbank entfernen kann, ohne die Verlinkung zu zerstören
>
> Versteh ich nicht. Welche Verlinkung?
Sowas nennt sich Anomalie
https://de.wikipedia.org/wiki/Anomalie_(Informatik)

von fifila (Gast)


Lesenswert?

Kaj schrieb:
> fifila schrieb:
>> S. R. schrieb:
>>> einmal eingepflegte Geräte nicht
>>> mehr aus der Datenbank entfernen kann, ohne die Verlinkung zu zerstören
>>
>> Versteh ich nicht. Welche Verlinkung?
> Sowas nennt sich Anomalie
> https://de.wikipedia.org/wiki/Anomalie_(Informatik)

Schon klar, aber warum sollte man ein Gerät aus der Datenbank entfernen, 
wenn man es einfach als offline markieren kann?

Wie man dann mit solchen Geräten bei der Auswertung umgeht, steht einem 
ja frei.
Oder gibt's hier irgendwelche Probleme in Richtung Datenschutz oder 
Speicherplatz?

von S. R. (svenska)


Lesenswert?

fifila schrieb:
> Ich würde eine Spalte "aktiv" oder "online" oder etwas in der Richtung
> in der geräte tabelle einführen.

Ja, gut, ich hatte zwei Timestamps "eingebaut" und "entfernt" empfohlen. 
Ob ein Gerät "aktiv" ist, ist ja eher irrelevant (außer, um zu schauen, 
ob ein Gerät aufgehört hat zu senden), aber es ist nachträglich noch 
interessant zu wissen, wie lange ein Gerät existiert hat.

von Heinz (Gast)


Lesenswert?

Okay, danke fuer die Inspiration... :-)

Was heisst das jetzt eigentlich aus Sicht meiner PC-Applikation?

Angenommen ich habe jetzt 3 Tabellen innerhalb meiner Datenbank-Datei:
1
> geraete:  (id, beschreibung, start_timestamp, stop_timestamp)
2
> sensoren: (id, geraete_id, beschreibung, einheit, min, max)
3
> werte:    (id, timestamp, sensor_id, wert)

Jetzt liest die PC-Applikation das File 20170715.DAT aus:
1
#device = "device_1"       
2
#timestamp;sht21_temp;sht21_humi       
3
4
20170715_160930;20.78;76.14
5
20170715_161000;20.55;75.30

Danach muss die Datenbank mit den entsprechenden Daten befuellt werden:
1
a) Gibt es device_1 bereits in Tabelle geraete? (Wenn nicht erzeugen)
2
   - Beschreibung, etc. kann ich spaeter haendisch nachtragen
3
   - geraete_id zwischenspeichern
4
b) Gibt es sht21_temp in der Tabelle sensoren? (wenn nicht erzeugen)
5
   - Einheit, min, max werde ich spaeter manuell nachtragen
6
   - sensor_id zwischenspeichern
7
c) Gibt es timestamp & sensor_id in der Werte Tabelle? (wenn nicht   eintragen mit geraete_id und sensor_id)

Sehen die Schritte tatsaechlich dann so aehnlich aus?

Danke!

von S. R. (svenska)


Lesenswert?

Heinz schrieb:
> Sehen die Schritte tatsaechlich dann so aehnlich aus?

Ja, bis auf den dritten Schritt: Wenn du die Geräte- und Sensor-IDs aus 
der Datenbank geladen hast, dann trägst du den Sensorwert einfach ein. 
Ein Sensor kann zu jedem Zeitpunkt nur einen Wert haben, also ist jeder 
Wert eindeutig.

Du brauchst in der Geräte- und Sensorentabelle noch eine Spalte "name", 
wo der interne Name verzeichnet ist. Die IDs sollten normale Integers 
(PRIMARY KEY, AUTOINCREMENT) sein.

Ich weiß nicht, ob man Geräte und Sensoren automatisch (ohne Hinweis) 
hinzufügen sollte oder nicht, aber das ist Geschmackssache.

von Heinz (Gast)


Lesenswert?

Danke Danke.
Ich habe meine erste Version mit den 3 Tabellen zum Laufen gebracht...
Jetzt sammle ich erstmal Daten (und Erfahrungen im Umgang mit der 
Datenbank).

Muss mir das Thema Views bzw. Ansichten noch anschauen, scheint ein 
nuetzlicher Ansatz zu sein... :-)

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.