助け合いフォーラム

LPIC

LPIC Lv1-101(Ver5.0)

問題ID : 3706

問題を開く

journalctlコマンドの出力結果を保存した「system.log」ファイルがあり、全ての行に「hh:mm:ss」形式で時刻が記録されている。17時台の行を抽出できるコマンドは次のうちどれか。(2つ選択)

grep -E '17:[0-9]+:[0-9]+' system.log

grep -E '17:[0-9]?:[0-9]?' system.log

grep -E '17:[0-59]:[0-59]' system.log

grep -E '17:00|59' system.log

grep -E '17:[0-5][0-9]:[0-5][0-9]' system.log

正解

grep -E '17:[0-9]+:[0-9]+' system.log

grep -E '17:[0-5][0-9]:[0-5][0-9]' system.log

解説

ファイルや標準入力から、正規表現のパターンにマッチする文字列を含む行を抽出するにはgrepコマンドを利用します。

grepコマンドの書式は以下のとおりです。拡張正規表現を使用する場合は「-E」オプションを使用します。

grep [オプション] 検索パターン [ファイル名]

以下は主な正規表現とその使用例をまとめたものです。

17時台のログは「17:00:00」から「17:59:59」の範囲の時刻です。
選択肢を1つずつ確認します。

・grep -E '17:[0-9]+:[0-9]+' system.log
[0-9]は0～9のいずれかの数字、「+」は直前の文字の1回以上の繰り返しを表します。この場合に「+」で繰り返されるのは[0-9]のため、「hh:mm:ss」形式のファイルでは'17:[0-9][0-9]:[0-9][0-9]'による抽出と同様です。
この選択肢は「17:00:00」から「17:99:99」の範囲を抽出できます。結果として17時台のログは抽出されるので、正しいコマンドです。

・grep -E '17:[0-9]?:[0-9]?' system.log
「?」は直前の文字の0回もしくは1回の繰り返しなので、「17::」や「17:9:9」のような行が抽出の対象です。17時台のログは抽出されませんので、誤りです。

・grep -E '17:[0-59]:[0-59]' system.log
[0-59]は0～5,9のいずれかの数字を表すので、「17:0:0」や「17:2:4」のような行が抽出の対象です。17時台のログは抽出されませんので、誤りです。

・grep -E '17:00|59' system.log
「17:00|59」は「17:00」か「59」のいずれかの文字列が抽出の対象です。17時台のログは抽出されませんので、誤りです。

・grep -E '17:[0-5][0-9]:[0-5][0-9]' system.log
[0-5]は0～5のいずれかの数字、[0-9]は0～9のいずれかの数字を表すので、「17:00:00」から「17:59:59」の範囲を抽出できます。17時台のログは抽出されるので、正しいコマンドです。

したがって正解は
・grep -E '17:[0-9]+:[0-9]+' system.log
・grep -E '17:[0-5][0-9]:[0-5][0-9]' system.log
です。

以下は実行例です。赤い部分がgrepコマンドにマッチした文字列です。

参考

【正規表現】
正規表現とは、文字列の特定のパターンを認識する為に使用する表現方法です。文字列の検索や置換などを行う際に利用します。正規表現には基本正規表現（BRE: Basic Regular Expression）と拡張正規表現（ERE: Extended Regular Expression）があります。

以下は主な正規表現とその使用例をまとめたものです。

正規表現には次のような基本の概念があります。
・特殊文字
「|」や「\（エスケープ文字）」などのように特殊な意味を持つ文字のことです。

・文字クラス
「[ ]」内の文字集合のことです。

・数量詞
「*」や「+」などのように直前の文字の繰り返し回数を示す文字のことです。

・アンカー
「^」や「$」などのように文字列内での位置を示す文字のことです。

なお、正規表現の「*」と、シェルによって解釈されるメタキャラクタの「*」では意味が異なるので注意してください。シェルは「*」を0文字以上の文字列と解釈します。
正規表現は明示的に「'」（シングルクォーテーション）や「"」（ダブルクォーテーション）の引用符で囲う事ができます。これらの引用符で囲まれた正規表現の記号は、シェルにメタキャラクタとして扱われなくなります。

正規表現を利用する主なコマンドには「sed」「grep」があります。

■sed
ファイルや標準入力の内容を編集して表示するコマンド

例）「test.txt」ファイルの「#」から始まる行を削除して出力する場合
　$ sed '/^#/d' test.txt

■grep
ファイルや標準入力から、検索パターンにマッチする文字列を含む行を抽出するコマンド

例）1から5までのいずれかの文字がある行を「test.txt」ファイルから抽出する場合
　$ grep '[1-5]' test.txt

[基本正規表現と拡張正規表現]
基本正規表現と拡張正規表現の違いに注意してください。

grepコマンドは、-Eオプションを付けない場合は検索パターンを基本正規表現と判断します。
grepコマンドの検索パターンで拡張正規表現を使うには、-Eオプションを指定します（egrepコマンドと同様）。
例）拡張正規表現「+」を使った抽出

なお、拡張正規表現の「?」「+」は、基本正規表現では「\?」「\+」で同様の指定ができます。
例）基本正規表現で「+」を扱う場合

参考URL

JM Project「GREP」

日経 xTECH（クロステック）「【 grep 】文字列を検索する」

上に戻る

17時台のログはどう表現するのでしょうか？

t tsuyumi_s

投稿日 2022/11/28

以下の解説がよくわかりません。

17時台のログは「17:00:00」から「17:59:59」の範囲の時刻です。
・grep -E '17:[0-59]:[0-59]' system.log
[0-59]は0～5,9のいずれかの数字を表すので、「17:0:0」や「17:2:4」のような行を抽出します。17時台のログは抽出されませんので、誤りです。

この解説で

「17:0:0」や「17:2:4」のような行を抽出します。

としていて、これは17時丁度や17時2分4秒と表現しているから17時台のログは抽出されるのではないのでしょうか？

t tnishita2

2022/11/28 19:32

「17:0:0」や「17:2:4」のような行を抽出します。17時台のログは抽出されませんので、誤りです。

をより厳密に詳しく言うと、

「17:0:0」や「17:2:4」のような行を抽出しようとします。しかし17時台の実際のログは「17:00:00」や「17:02:04」であり、抽出されませんので、誤りです。

となります。「解説」の最後に実行例が載っており、先頭の0が省略されていないことを確認できます。

t tsuyumi_s

2022/11/30 09:45

正式な状態の時間が抽出されないから誤り、ということですね！解説ありがとうございました。

この投稿に対して返信しませんか？

助け合いフォーラム