Mitzyuki's Blog :: awk による IPv4 アドレスのマッチ処理

2020/07/22

awk による IPv4 アドレスのマッチ処理

標準入力から入力されるテキストデータから IPv4 アドレスを awk(1) を利用して抽出する。
その際に CIDR 形式でないアドレスに関しては末尾に "/32" を付与して CIDR 形式にして出力する。

  1awk '{
  2    if(match($0, /([[:digit:]]{1,3}\.){3}[[:digit:]]{1,3}(\/[[:digit:]]{1,2})?/))
  3        print match((ip = substr($0, RSTART, RLENGTH)), /\/[[:digit:]]{1,2}/) ? ip : ip "/32";
  4}'

1 行目の match() 関数で入力データから正規表現を利用して IPv4 アドレスを抽出し、 2 行目の substr() 関数を利用してマッチした範囲を切り出して IPv4 アドレスを変数 ip に格納している。 2 行目の match() 関数で変数 ip に格納された IPv4 アドレスにに CIDR 部分があるかを調査し、 CIDR 部がない場合は "/32" を付与して出力している。

IPv4 アドレスは "192.0.2.1" の様に「0 から 9 までの数字 1 桁から 3 桁が "." を挟んで 4 組連続する」形式で、 CIDR は "/24" の様に「"/" に続いて 0 から 9 までの数字 1 桁から 2 桁」なので、正規表現は

[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}(\/[0-9]{1,2})?

となるが、煩雑になるので

([0-9]{1,3}\.){1,3}[0-9]{1,3}(\/[0-9]{1,2})?

とまとめ、更に数字部分を POSIX クラスに置き換えて

([[:digit:]]{1,3}\.){1,3}[[:digit:]]{1,3}(\/[[:digit:]]{1,2})?

とした。

入力データ中の IPv4 アドレスが重複する可能性がある場合は、直接出力せず一度連想配列に格納する事で uniq(1) 相当の処理も可能となる。

  1awk '{
  2    if(match($0, /([[:digit:]]{1,3}\.){3}[[:digit:]]{1,3}(\/[[:digit:]]{1,2})?/))
  3        list[match((ip = substr($0, RSTART, RLENGTH)), /\/[[:digit:]]{1,2}/) ? ip : ip "/32"] = 1;
  4} END {
  5    for(i in liset)
  6        print i;
  7}'

Posted at 09:56 in Computer | コメント/トラックバック(0) | 編集

TopPage

Flicker

bsdhack

Twitter

bsdhack

Profile

Author

Mitzyuki IMAIZUMI

Favorite

Unix Life
FreeBSD
Macintosh
Outdoor
MAZDA CX-5

Page

Categories

Entire Categories (509)
- Bicycle (3)
- Blog (131)
- CX-5 (15)
- Camera (6)
- Computer (92)
- Food (30)
- FreeBSD (14)
- Lisa (35)
- Mac (55)
- Motorcycle (27)
- Music (7)
- Outdoor (79)
- VAIO (15)

Search

Archives

2026 (1)
- 1月 (1)
2025 (12)
- 12月 (1)
- 11月 (2)
- 10月 (1)
- 6月 (1)
- 5月 (3)
- 4月 (1)
- 3月 (1)
- 2月 (2)
2024 (10)
- 12月 (2)
- 11月 (2)
- 6月 (2)
- 4月 (1)
- 3月 (1)
- 2月 (2)
2023 (9)
- 12月 (1)
- 11月 (2)
- 10月 (1)
- 5月 (2)
- 4月 (1)
- 2月 (1)
- 1月 (1)
2022 (17)
- 12月 (2)
- 9月 (2)
- 8月 (1)
- 6月 (1)
- 5月 (1)
- 4月 (2)
- 3月 (4)
- 1月 (4)
2021 (10)
- 12月 (1)
- 11月 (1)
- 10月 (1)
- 9月 (2)
- 5月 (1)
- 4月 (2)
- 2月 (1)
- 1月 (1)
2020 (10)
- 12月 (3)
- 10月 (1)
- 9月 (1)
- 7月 (2)
- 2月 (2)
- 1月 (1)
2019 (14)
- 10月 (2)
- 7月 (1)
- 5月 (2)
- 4月 (2)
- 3月 (3)
- 2月 (2)
- 1月 (2)
2018 (5)
- 12月 (1)
- 11月 (1)
- 10月 (1)
- 7月 (1)
- 4月 (1)
2017 (22)
- 12月 (2)
- 11月 (7)
- 10月 (3)
- 9月 (1)
- 8月 (1)
- 7月 (2)
- 6月 (2)
- 5月 (2)
- 3月 (1)
- 1月 (1)
2016 (23)
- 12月 (1)
- 11月 (9)
- 10月 (1)
- 9月 (3)
- 5月 (1)
- 4月 (1)
- 3月 (7)
2015 (7)
- 10月 (2)
- 9月 (1)
- 8月 (2)
- 6月 (1)
- 5月 (1)
2014 (16)
- 12月 (1)
- 10月 (1)
- 8月 (1)
- 7月 (4)
- 6月 (1)
- 5月 (2)
- 3月 (3)
- 2月 (2)
- 1月 (1)
2013 (17)
- 11月 (2)
- 10月 (2)
- 9月 (1)
- 8月 (1)
- 7月 (4)
- 6月 (1)
- 5月 (1)
- 4月 (1)
- 3月 (1)
- 1月 (3)
2012 (31)
- 12月 (3)
- 11月 (2)
- 10月 (2)
- 8月 (5)
- 7月 (3)
- 6月 (9)
- 5月 (1)
- 4月 (1)
- 2月 (2)
- 1月 (3)
2011 (46)
- 12月 (1)
- 11月 (3)
- 10月 (2)
- 9月 (2)
- 8月 (1)
- 7月 (3)
- 6月 (5)
- 5月 (6)
- 4月 (5)
- 3月 (1)
- 2月 (9)
- 1月 (8)
2010 (69)
- 12月 (10)
- 11月 (1)
- 10月 (5)
- 9月 (5)
- 8月 (8)
- 7月 (5)
- 6月 (3)
- 5月 (6)
- 4月 (4)
- 3月 (7)
- 2月 (9)
- 1月 (6)
2009 (107)
- 12月 (8)
- 11月 (9)
- 10月 (9)
- 9月 (11)
- 8月 (9)
- 7月 (13)
- 6月 (7)
- 5月 (6)
- 4月 (13)
- 3月 (5)
- 2月 (10)
- 1月 (7)
2008 (83)
- 12月 (13)
- 11月 (13)
- 10月 (15)
- 9月 (7)
- 8月 (10)
- 7月 (3)
- 6月 (8)
- 5月 (14)

Comments

武井バーナーパープルストーブ 301A のメンテナンス: アッキー at 05/20 16:22

Trackback

grep -o: grep -o - 上田さんのブログ
grep -o: grep -o - 上田さんのブログ
grep -o: grep -o - 上田さんのブログ
grep -o: grep -o - 上田さんのブログ
grep -o: grep -o - 上田さんのブログ

Syndicate

Syndicate this site

Powered by
blosxom 2.1.2

Copyright © 2008-2020 Mitzyuki IMAIZUMI. All rights reserved.