メインコンテンツにスキップ
正規表現:住所から「郵便番号」と「住所」を切り分けて取得する方法

正規表現を使用して、住所の中の郵便番号と住所を分割取得する方法を説明します。

Yoom 青柳 avatar
対応者:Yoom 青柳
1年以上前に更新

概要

Yoomで取得したデータは、データ変換オペレーションにより 「置換」や 「抽出」 を用いてアウトプットとして取得することが可能です。 今回は正規表現を用いて、住所の中から「郵便番号」と「住所」を切り分けて取得する例を紹介します。

今回は〒101-0054 東京都千代田区神田錦町2-2-1 WeWork内という住所を用いて説明します。

郵便番号の取得方法

最初に郵便番号を取得する方法を説明します。

  • データを操作・変換するオペレーションからデータの抽出(正規表現)を選択します。

  • 抽出対象の文字列に置換したい住所文字列を入力します(アウトプットを使用することも可能です)。

  • 抽出箇所を検索(正規表現指定)に^〒[0-9]{3}-[0-9]{4} を入力します。

  • テスト後変換後の文字列が取得できているかを確認し、アウトプット名を入れ保存します。

101-0051のように〒マークがない場合は^[0-9]{3}-[0-9]{4} と設定します。

※郵便番号にハイフンがない場合は^〒[0-9]{3}[0-9]{4} と設定します。

〒101-0054東京都のように郵便番号と住所間にスペースがない場合は^〒[0-9]{3}-[0-9]{4}のように後半の半角スペースまたは全角スペースを除外します。

住所の取得方法

次に住所を取得する方法を説明します。

  • データを操作・変換するオペレーションからデータの置換(正規表現)を選択します。

  • 置換対象の文字列に置換したい住所文字列を入力します(アウトプットを使用することも可能です)。

  • 置換箇所を検索(正規表現指定)に^〒[0-9]{3}-[0-9]{4} を入力します。

  • 置換後の文字列は記入せず、テストを実施します。

  • 変換後の文字列が取得できているかを確認し、アウトプット名を入れ保存します。

101-0051のように〒マークがない場合は^[0-9]{3}-[0-9]{4} と設定します。

※郵便番号にハイフンがない場合は^〒[0-9]{3}[0-9]{4} と設定します。

〒101-0054東京都のように郵便番号と住所間にスペースがない場合は^〒[0-9]{3}-[0-9]{4}のように後半の半角スペースまたは全角スペースを除外します。

以上が正規表現を使用して、住所の中の郵便番号と住所を分割取得する方法となります🎉

関連記事

こちらの回答で解決しましたか?