CSV: Unterschied zwischen den Versionen
Codica (Diskussion | Beiträge) (Die Seite wurde neu angelegt: „Das Comma Separated Value (CSV) - Format ist nicht standardisiert. Insbesondere ist nicht zwingend ein Komma der Trenner der einzelnen Felder, sondern z.B. auc…“) |
Codica (Diskussion | Beiträge) |
||
Zeile 23: | Zeile 23: | ||
Siehe auch | Siehe auch | ||
* [[JSON]] | * [[JSON]] | ||
+ | |||
+ | |||
+ | == CSV von der Kommandozeile == | ||
+ | |||
+ | CSV lässt sich mit üblichen zeilenorientierten Shell-Kommandos wie [[tail]], [[head]], [[cut]] bearbeiten. | ||
+ | |||
+ | [https://arrow.apache.org/datafusion/user-guide/cli.html Apache Arrow DataFusion] bietet sogar die Möglichkeit CSV-Dateien mit [[SQL]]-Befehlen zu bearbeiten. | ||
-------- | -------- | ||
<references/> | <references/> | ||
[[Category:Informationstechnik]] | [[Category:Informationstechnik]] |
Version vom 23. Oktober 2023, 15:52 Uhr
Das Comma Separated Value (CSV) - Format ist nicht standardisiert. Insbesondere ist nicht zwingend ein Komma der Trenner der einzelnen Felder, sondern z.B. auch ein Semikolon. Text wird manchmal in doppelten Anführungszeichen (") gesetzt, manchmal aber auch Zahlenwerte.
Datenviewer
Jedes Tabellenkalkulationsprogramm kann üblicherweise CSV lesen.
Visidata
Mit dem Python-Programm Visidata können CSV-Dateien im Terminal in einer halbgraphischen Oberfläche angeschaut werden.
Um CSV-Dateien, die mit Semikolon (=Strichpunkt oder ;) getrennt sind, einlesen zu können, setzt man das csv-delimiter-Flag:
vd --csv-delimiter ';' input.csv
Um Zahlenwerte mit Komma als "Dezimalpunkt" anzusehen,
- setzt man die Umgebungsvariabe LC_NUMERIC auf "de_DE.UTF-8" und
- wechselt dann in die betroffene Spalte, drückt dort die Leertaste und schreibt dann
type-floatlocale
.[1]
Siehe
Siehe auch
CSV von der Kommandozeile
CSV lässt sich mit üblichen zeilenorientierten Shell-Kommandos wie tail, head, cut bearbeiten.
Apache Arrow DataFusion bietet sogar die Möglichkeit CSV-Dateien mit SQL-Befehlen zu bearbeiten.
- ↑ Vgl. https://www.visidata.org/docs/columns/ - nach decimal separator suchen.