Python: CSV - Zeilen entfernen

von Alex (Gast)

12.09.2017 13:53

Lesenswert?

•

Hallo Zusammen,
wie kann ich mit Python in einer CSV-Datei einzelnen Zeilen in einem 
bestimmten definierten Bereich entfernen?

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python: CSV - Zeilen entfernen

von Karl Käfer (Gast)

12.09.2017 15:30

Lesenswert?

•

▲
▼

Alex schrieb:
> wie kann ich mit Python in einer CSV-Datei einzelnen Zeilen in einem
> bestimmten definierten Bereich entfernen?

Was heißt "in einem bestimmten Bereich"? Ist das abhängig von den Werten 
in den CSV-Feldern oder abhängig von de(r|n) Zeilennummer(n)?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python: CSV - Zeilen entfernen

von ui (Gast)

12.09.2017 15:41

Lesenswert?

•

▲
▼

regex

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python: CSV - Zeilen entfernen

von Florian F. (flof3000)

12.09.2017 15:55

Lesenswert?

•

▲
▼

Mit pandas!

import pandas as pd
df = pd.read_csv('meine_datei.csv')
df = df.drop(df.index[500:550]) # welche zeilen auch immer du loswerden willst. Ab 0 gezaehlt!
df.to_csv("meine_datei_ohne_500-500.csv")

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python: CSV - Zeilen entfernen

von Alex (Gast)

13.09.2017 06:46

Lesenswert?

•

▲
▼

Gibt es damit auch die Möglichkeit, Zeilen nach Stringteilen zu 
durchsuchen, indem man verschiedene Schlüsselwörter angibt und die 
Zeilen, die diese enthalten, entfernt oder ausgeblendet werden?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python: CSV - Zeilen entfernen

von Thomas S. (doschi_)

13.09.2017 07:23

Lesenswert?

•

▲
▼

Alex schrieb:
> Gibt es damit auch die Möglichkeit, Zeilen nach Stringteilen zu
> durchsuchen, indem man verschiedene Schlüsselwörter angibt und die
> Zeilen, die diese enthalten, entfernt oder ausgeblendet werden?

Falls eine Alternative in Frage kommt:
Das geht m.E. deutlich einfacher mit awk.

Allg. Infos:  z.B. 
https://www.gnu.org/software/gawk/manual/html_node/Very-Simple.html
Beispiele: http://gilmation.com/articles/filtering-lines-in-awk/
https://www.gnu.org/software/gawk/manual/html_node/More-Complex.html#More-Complex

awk gibt es z.B. hier: http://gnuwin32.sourceforge.net/packages/gawk.htm

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python: CSV - Zeilen entfernen

von Alex (Gast)

13.09.2017 07:39

Lesenswert?

•

▲
▼

Übrigens bekomme ich mit Panda folgende Fehlermeldung:

C:\Users\CSVProjekt>python "new 1.py"
Traceback (most recent call last):
  File "new 1.py", line 5, in <module>
    df = pd.read_csv('out.csv')
  File "C:\Python27\lib\site-packages\pandas\io\parsers.py", line 655, 
in parser
_f
    return _read(filepath_or_buffer, kwds)
  File "C:\Python27\lib\site-packages\pandas\io\parsers.py", line 411, 
in _read
    data = parser.read(nrows)
  File "C:\Python27\lib\site-packages\pandas\io\parsers.py", line 1005, 
in ..........
....
....
....

@Karl Käfer
Abhängig von den Zeilennummern, nicht von den Werten in den einzelnen 
Zellen

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python: CSV - Zeilen entfernen

von Sheeva P. (sheevaplug)

13.09.2017 19:43

Lesenswert?

•

▲
▼

Thomas S. schrieb:
> Alex schrieb:
>> Gibt es damit auch die Möglichkeit, Zeilen nach Stringteilen zu
>> durchsuchen, indem man verschiedene Schlüsselwörter angibt und die
>> Zeilen, die diese enthalten, entfernt oder ausgeblendet werden?
>
> Falls eine Alternative in Frage kommt:
> Das geht m.E. deutlich einfacher mit awk.

awk? egrep(1)!

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python: CSV - Zeilen entfernen

von Sheeva P. (sheevaplug)

13.09.2017 19:50

Lesenswert?

•

▲
▼

Alex schrieb:
> Abhängig von den Zeilennummern, nicht von den Werten in den einzelnen
> Zellen

with open(filename, 'r') as ifh:
  counter = 0
  for line in ifh:
    counter += 1
    if counter in range(100, 200):
      print(line)


Natürlich kann man statt "if counter in range(.., ..)" auch anders 
Abfragen, etwa "if counter > 100 and counter < 200" oder "if counter not 
in [2, 4, 5]" oä, aber das Prinzip sollte klar sein: einfach einen 
Counter mitführen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python: CSV - Zeilen entfernen

von Thomas S. (doschi_)

13.09.2017 21:19

Lesenswert?

•

▲
▼

Sheeva P. schrieb:
> Thomas S. schrieb:
>> Alex schrieb:
>>> Gibt es damit auch die Möglichkeit, Zeilen nach Stringteilen zu
>>> durchsuchen, indem man verschiedene Schlüsselwörter angibt und die
>>> Zeilen, die diese enthalten, entfernt oder ausgeblendet werden?
>>
>> Falls eine Alternative in Frage kommt:
>> Das geht m.E. deutlich einfacher mit awk.
>
> awk? egrep(1)!

je nach Anwendungsfall.
Bei vielen komplexen Filterkriterien (und wenn der Output evtl. noch 
etwas modifiziert werden muss), würde ich awk vorziehen.
Aber es gint sehr viel gute Bordmittel. - und awk auch für Win-Doof.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python: CSV - Zeilen entfernen

von Sheeva P. (sheevaplug)

14.09.2017 07:58

Lesenswert?

•

▲
▼

Thomas S. schrieb:
>>> Falls eine Alternative in Frage kommt:
>>> Das geht m.E. deutlich einfacher mit awk.
>>
>> awk? egrep(1)!
>
> je nach Anwendungsfall.
> Bei vielen komplexen Filterkriterien (und wenn der Output evtl. noch
> etwas modifiziert werden muss), würde ich awk vorziehen.
> Aber es gint sehr viel gute Bordmittel. - und awk auch für Win-Doof.

Unter Windows 10 gibt es als "experimental feature" die Möglichkeit, 
Linux-Pakete direkt aus den Ubuntu-Repositories zu nutzen, also auch 
eine bash und das zugehörige Kommandozeilen-Userland. Unser 
Windows-Chefentwickler hat das ausprobiert und ist ziemlich beeindruckt.

CSV-Dateien würde ich aber nur in den allereinfachsten Fällen mit awk(1) 
verarbeiten; sobald Quoting oder Escaping ins Spiel kommen, artet die 
Sache sonst ziemlich schnell aus.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python: CSV - Zeilen entfernen

von Christoph S. (christoph2)

20.09.2017 03:24

Lesenswert?

•

▲
▼

Python beinhaltet übrigens von Hause aus ein CSV-Modul...
https://docs.python.org/2/library/csv.html

Ansonsten kann ich das Python basierte csvkit nur wärmstens empfehlen:
https://csvkit.readthedocs.io/en/1.0.2/
https://github.com/wireservice/csvkit
https://pypi.python.org/pypi/csvkit

Es handelt sich um eine Sammlung von Commandline-Tools die CSV lesen, 
auf verschiedene Art und Weisen bearbeiten und wiederum CSV ausgeben,
integriert sich also sehr gut in eine Pipes'n Redirections Toolchain.
Meiner Meinung nach essentiell im Umgang mit CSV.
Das besondere Highlight ist csvsql; SQL-Anfragen auf CSV-Dateien - 
Ziemlich gut der Specht :-)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python: CSV - Zeilen entfernen

von Christopher J. (christopher_j23)

20.09.2017 19:06

Lesenswert?

•

▲
▼

Falls es wirklich schnell gehen muss, Python zu langsam und awk zu 
kompliziert ist:
https://github.com/BurntSushi/xsv

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python: CSV - Zeilen entfernen

von Thomas S. (doschi_)

20.09.2017 20:08

Lesenswert?

•

▲
▼

Ich glaube inzwischen, da kommt nichts mehr vom TO.
Evtl. ist das Problem gelöst (wie auch immer?)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Python: CSV - Zeilen entfernen

von Sheeva P. (sheevaplug)

20.09.2017 23:05

Lesenswert?

•

▲
▼

Christoph S. schrieb:
> Python beinhaltet übrigens von Hause aus ein CSV-Modul...
> https://docs.python.org/2/library/csv.html

Leider hat dieses Modul aus der Standarddistribution Probleme mit 
CSV-Dateien in bestimmten Encodings, in solchen Fällen hilft das Modul 
unicodecsv, das allerdings nicht zur Standarddistribution gehört.

> Ansonsten kann ich das Python basierte csvkit nur wärmstens empfehlen:

Dieser Empfehlung kann ich mich nur anschließen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Forum: PC-Programmierung Python: CSV - Zeilen entfernen