csplit: Bestandlen op basis van bestandsinhoud

Overzicht

csplit verdeelt een invoerbestand in meerdere uitvoerbestanden volgens een opgegeven patroon of regelnummer. Elk uitvoerbestand bevat een opeenvolgend deel van het originele bestand, en de bestandsnamen worden samengesteld uit een opgegeven voorvoegsel en een numerieke achtervoegsel.

Belangrijkste Kenmerken

Splitsen op basis van reguliere expressies of regelnummers
Mogelijkheid om het voorvoegsel en het formaat van het numerieke achtervoegsel van de uitvoerbestandsnaam op te geven
Eenvoudige extractie en beheer van specifieke secties van grote bestanden

Belangrijkste Opties

Bestandscontrole voor uitvoer

Controle van het splitsingsgedrag

Gegenereerde opdracht:

Probeer de opdrachtcombinaties.

Uitleg:

`csplit` Voer het commando uit.

Combineer deze opties en voer de opdracht virtueel uit met de AI.

Gebruiksvoorbeelden

Bestand splitsen op basis van regelnummer

echo -e "$(seq 1 35)" > test.txt
csplit test.txt 10 20 30

Splits het bestand test.txt op basis van de 10e, 20e en 30e regel. (Bijv. xx00: regels 1-9, xx01: regels 10-19, xx02: regels 20-29, xx03: vanaf regel 30 tot het einde)

Bestand splitsen op basis van reguliere expressie

echo -e "Line 1\nLine 2\nERROR: First error\nLine 4\nLine 5\nERROR: Second error\nLine 7" > log.txt
csplit -f part_ log.txt '/^ERROR:/' '{*}'

Splits log.txt op basis van regels die beginnen met '^ERROR:', en specificeer 'part_' als bestandsvoorvoegsel. '{*}' betekent dat de rest van de inhoud in één bestand wordt samengevoegd.

Splitsen met gespecificeerd voorvoegsel en aantal cijfers

echo -e "[Section 1]\nContent A\n[Section 2]\nContent B\n[Section 3]\nContent C" > data.log
csplit -f my_file_ -n 3 data.log '/^\[Section \d+\]/' '{*}'

Splits data.log op basis van het patroon '[Section N]' en genereer bestandsnamen zoals 'my_file_000', 'my_file_001'.

Splitsen met uitsluiting van overeenkomende regels

echo -e "Line 1\nERROR: First error\nLine 3\nERROR: Second error" > log.txt
csplit --suppress-match -f no_error_ log.txt '/^ERROR:/' '{*}'

Splits log.txt op basis van het patroon '^ERROR:', maar sluit regels die beginnen met 'ERROR:' uit van elk gesplitst bestand.

Tips & Aandachtspunten

Het csplit commando is krachtig, maar wees voorzichtig bij het gebruik van reguliere expressies.

Nuttige Tips

Gebruik aanhalingstekens rond reguliere expressies om interpretatie door de shell te voorkomen.
De regel die als splitsingscriterium wordt gebruikt, wordt standaard de eerste regel van het volgende bestand. U kunt de regel uitsluiten met de optie --suppress-match.
'{*}' betekent dat de resterende bestanden allemaal in één bestand moeten worden samengevoegd. Zonder deze optie wordt de inhoud na het laatste splitsingscriterium weggegooid.

Aandachtspunten

Originele bestanden niet gewijzigd: csplit wijzigt het originele bestand niet, maar maakt nieuwe gesplitste bestanden aan.
Foutafhandeling: Er kunnen fouten optreden als reguliere expressies niet overeenkomen of als regelnummers ongeldig zijn. Vooral reguliere expressies moeten nauwkeurig worden geschreven.