ホーム > テキスト処理・検索 > cut

cut: テキストフィールドの抽出

cutコマンドは、ファイルや標準入力からテキストデータの特定のフィールド(列)を抽出するために使用される強力なユーティリティです。主に指定された区切り文字(delimiter)を基準にテキストを分割し、必要な部分を選択的に出力する場合に非常に役立ちます。

概要

cutは、テキストデータを処理する際に特定の列を選択的に抽出することに特化したツールです。ファイル内の各行を指定された区切り文字で分割し、必要なフィールドのみを出力したり、特定の文字位置を基準にテキストを切り取ったりすることができます。

主な特徴

  • 指定された区切り文字でテキストフィールドを分割
  • フィールド番号または文字位置でデータを抽出
  • パイプ(|)を使用して他のコマンドの出力を処理
  • シンプルで高速なテキスト処理

主なオプション

cutコマンドの主な機能は、さまざまなオプションを使用して目的のテキストフィールドを正確に抽出することです。

フィールド/文字の選択

区切り文字と出力

生成されたコマンド:

コマンドを組み合わせてみてください。

説明:

`cut` コマンドを実行します。

これらのオプションを組み合わせて、AIと一緒に仮想的にコマンドを実行してみてください。

使用例

cutコマンドを活用してテキストデータを効果的に処理する様々な例です。

カンマ(,)で区切られたテキストから1番目と3番目のフィールドを抽出

echo "apple,banana,cherry,date" | cut -d',' -f1,3

カンマを区切り文字として使用し、「apple」と「cherry」を抽出します。

コロン(:)で区切られた /etc/passwd ファイルからユーザー名とシェルパスを抽出

cut -d':' -f1,7 /etc/passwd | head -n 3

/etc/passwd ファイルから1番目のフィールド(ユーザー名)と7番目のフィールド(シェルパス)を抽出します。

スペースで区切られたテキストから2番目のフィールドを抽出

echo "Hello World Linux" | cut -d' ' -f2

cutはデフォルトでタブを区切り文字として使用するため、スペースを区切り文字として使用するには -d' ' のように明示的に指定する必要があります。

ファイルから1文字目から5文字目までを抽出

echo "abcdefghijkl" | cut -c1-5

フィールド単位ではなく文字単位でテキストを切り取る場合に -c オプションを使用します。

特定のフィールドを除いて残りのフィールドを出力

echo "one:two:three:four" | cut -d':' -f2 --complement

2番目のフィールドを除いたすべてのフィールドを出力します。

ヒントと注意点

cutコマンドをより効率的に使用するためのヒントと注意点です。

便利なヒント

  • cutは単一文字の区切り文字のみをサポートします。複数の文字の区切り文字を使用する必要がある場合は、`awk`や`sed`を検討してください。
  • デフォルトの区切り文字はタブ(tab)です。スペースを区切り文字として使用するには、`-d' '`のように明示的に指定する必要があります。
  • cutはパイプ(|)と組み合わせて使用することで、他のコマンドの出力を処理するのに非常に効果的です。(例: `ps aux | grep nginx | cut -d' ' -f2`)
  • `-f`オプションを使用する場合、フィールド番号は1から始まります。

関連するコマンド

機能的に類似しているか、よく一緒に使われるコマンドです。


同じカテゴリのコマンド