CSV

Aus CodicaTipps
Version vom 23. Oktober 2023, 15:56 Uhr von Codica (Diskussion | Beiträge) (→‎CSV von der Kommandozeile)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Zur Navigation springen Zur Suche springen

Das Comma Separated Value (CSV) - Format ist nicht standardisiert. Insbesondere ist nicht zwingend ein Komma der Trenner der einzelnen Felder, sondern z.B. auch ein Semikolon. Text wird manchmal in doppelten Anführungszeichen (") gesetzt, manchmal aber auch Zahlenwerte.

Datenviewer

Jedes Tabellenkalkulationsprogramm kann üblicherweise CSV lesen.

Visidata

Mit dem Python-Programm Visidata können CSV-Dateien im Terminal in einer halbgraphischen Oberfläche angeschaut werden.

Um CSV-Dateien, die mit Semikolon (=Strichpunkt oder ;) getrennt sind, einlesen zu können, setzt man das csv-delimiter-Flag:

 vd --csv-delimiter ';' input.csv

Um Zahlenwerte mit Komma als "Dezimalpunkt" anzusehen,

  • setzt man die Umgebungsvariabe LC_NUMERIC auf "de_DE.UTF-8" und
  • wechselt dann in die betroffene Spalte, drückt dort die Leertaste und schreibt dann type-floatlocale.[1]


Siehe

Siehe auch


CSV von der Kommandozeile

Shell-Kommandos

CSV lässt sich mit üblichen zeilenorientierten Shell-Kommandos wie tail, head, cut bearbeiten.

Apache Arrow DataFusion

Apache Arrow DataFusion bietet sogar die Möglichkeit CSV-Dateien mit SQL-Befehlen zu bearbeiten. Das Schreiben von CSV-Dateien beschränkt sich auf COPY und INSERT INTO.


  1. Vgl. https://www.visidata.org/docs/columns/ - nach decimal separator suchen.