2023-05-26

Azure での証跡ログはこれでサクッと解析する！ Activity Log と Synapse Analytics を使った便利な方法

はじめに

こんにちは。

普段は新規開発メインの会社で SRE やデータエンジニアをしているものです。

クラウドプラットフォームとしては AWS や GCP をメインで利用していますが、最近 Azure OpenAI の API が利用可能になったことで Azure も使い始めました。

マルチプラットフォームなアーキテクチャを取っていますが、今後 Azure 内での様々なサービスの利用、リソースの作成が予想されるため、セキュリティや障害対応を考えて証跡ログの調査方法を確立させます。

みなさんがよく利用されている AWS で例えて言うと、CloudTrail の証跡ログを S3 にエクスポートし、そのバケット内のオブジェクトを Athena で分析するイメージです。

Azure の基礎知識

以降で出てくる内容、用語をスムーズに理解するために、まず基礎知識を説明します。
ChatGPT のほうが私よりも賢いので、聞いてみることもおすすめします。

・Azure AD

Microsoft Azureを利用するための管理単位です。
会社単位で作ることをおすすめします。

Microsoft アカウントを使って作成し、Azure AD 内で組織ユーザを作り、その組織ユーザーを使って Azure 内にリソースを作成していきます。
Microsoft アカウントを使ってあれこれすることはおすすめしません。

・サブスクリプション

課金の単位です。
Azure AD 内で言うと最上位概念です。

すべてのリソースは後述するリソースグループに含まれ、そのリソースグループは1つのサブスクリプションと結び付けられている必要があります。
サブスクリプションの IAM で組織ユーザーに権限を付与することで、リソースグループ以降は権限を継承することができます。

サブスクリプションには以降の Activity Log はすべて表示されるため、本記事ではこちらを対象にします。

・リソースグループ

Azure 内でのリソースを管理する単位です。
できることは主に以下です。

・統一管理: リソースグループ内のリソースに対して一元的にアクセス制御、監視、およびアラート設定を行える。
・共通タグ付け
・リソースの展開: Azure Resource Manager テンプレートを使用して、リソースグループ内に複数のリソースを一度に展開できる。
・リソースの移動: リソースを他のリソースグループやサブスクリプションに移動することができる。
・コンプライアンスとポリシー: Azure Policy を使用して、リソースグループ内のリソースに対してポリシーを適用し、コンプライアンスを確保できる。
・リソースの構成管理: リソースグループを使用して、アプリケーションの構成情報や設定を一元管理でる。
・セキュリティ: リソースグループを使用して、関連するリソースに対して共通のセキュリティ設定を適用できる。
・バックアップと復元: リソースグループを使用して、アプリケーションのリソースを定期的にバックアップし、必要に応じて復元できる。
・コスト共通可視化
・リソースの履歴追跡共通化

リソースグループの単位は諸説ありますが、ライフサイクルが共通するリソースを同じリソースグループに含めることがベストのようです。

Activity Log

リソースに対して、どのようなアクションがあったかを記録するログです。
最上位はサブスクリプションで、リソースグループ以降の単位でも参照できます。

本記事で証跡ログと言っているのはこのActivity Logのことです。

証跡ログ調査手順

前提

まず Activity Log を調査する方法はいくつかあります。
その中で、なぜ今回の方法を取ったのかを説明します。

1. Activity Log の検索機能

Activity Log でも検索機能があるので、それを使って解析をすることはできます。
ですが、機能に限界があるのと、デフォルト保持期間は90日間なので、こちらは採用しません。

2. Log Analytics

Activity Log のエクスポートから診断設定を作成して、Log Analyticsへログをエクスポートします。
AWSで例えるなら、CloudWatch Logsで調査するイメージです。

Log Analytics ではKQLを使ってログを解析することができます。

Activity Logの量は膨大で、簡素な方法では Log Analytics へのエクスポートに料金が多くかかるので、こちらも採用しません。

ちなみに保持期間はデフォルトで2年間です。

3. [ Storage Blob 経由 ] Log Analytics

Activity Log のエクスポート設定で Blob コンテナにログを保管する設定をします。
Blob コンテナへのデータエクスポートは料金が安いです。

この Blob コンテナ内のログデータを任意で Data Factory などのサービスを使って Activity Log へデータを移すことができます。
任意の量のデータを Log Analytics で解析できますが、もっと簡素で良い方法をこの後紹介します。

4. [ Storage Blob 経由 ] Synapse Analytics

Synapse Analytics は Azure 上でビッグデータ分析を可能にするサービスです。
T-SQLを使ってデータ分析するサーバーは、サーバーレスを選択しましょう。

このサーバーレス SQL プール上で Blob コンテナ内のデータを参照できます。

参照するやり方は OPENROWSET 関数を使った参照と、外部データを定義するやり方の2種類ありますが、より簡素な前者を選択します。

手順

Synapse Analytics のサーバーレス SQL プール内で OPENROWSET 関数を使って、Blob コンテナに保管されたActivity Log を解析する方法を示します。

前提

もし、Blob コンテナのパブリックアクセスが拒否されている場合は注意点があります。
Synapse Analytics から Blob コンテナを参照するに当たって、実際に SQL を実行する組織ユーザーに対して、IAMで「ストレージ BLOB データ閲覧者」以上の権限が明示的についているかを確認してください。
「所有者」の権限がついていたとしても、ストレージ Blob 専用の権限がついている必要があり、そうでないと Blob を参照できません。

またストレージアカウントのネットワークで「すべてのネットワークから有効」が選択されているかも確認してください。

1. Synapse Analytics ワークスペースを作成

必要な情報を入力して作成しましょう。

その際、Synapse Analytics のログを出力する Data Lake Storage Gen2 を作成しましょう。

2. Synapse Studio にログイン

Synapse Analytics 専用のコンソールです。

概要メニューから、ワークスペースのWeb URL を選択します。

3. OPENROWSET 関数を使って Blob コンテナのデータを参照

Synapse Studio から、Develop メニューを選択し、SQL スクリプトを選択します。

接続は組み込み (サーバーレス SQL プール)、データベースの仕様は master が選択されていることを確認してください。

以下のような、SQLでBlobコンテナ内のActivity Logを検索することができます。

-- 5/18, 5/19のActivity Logを対象として、検索
WITH tmp_target_log
AS
(
    SELECT *
    FROM OPENROWSET(
            BULK (
                'https://xxx.blob.core.windows.net/insights-activity-logs/resourceId=/SUBSCRIPTIONS/AAAAAAA-2222-RRRR-9999-MMMMMMMMMMMM/y=2023/m=05/d=18/**',
                'https://xxx.blob.core.windows.net/insights-activity-logs/resourceId=/SUBSCRIPTIONS/AAAAAAA-2222-RRRR-9999-MMMMMMMMMMMM/y=2023/m=05/d=19/**'
            ),
            FORMAT = 'CSV',
            FIELDTERMINATOR = '\0',
            FIELDQUOTE = '0x0b',
            ROWTERMINATOR = '0x0A'
        ) WITH (doc NVARCHAR(MAX)) AS rows
)
, target_log
AS
(
    SELECT
        -- 操作の名前の一部 操作の種類の詳細内訳 - "Write"/"Delete"/"Action"
        JSON_VALUE(doc, '$.category') as 'category',
        -- ログレベル
        JSON_VALUE(doc, '$.level') as 'level',
        -- イベント発生時間
        JSON_VALUE(doc, '$.time') as 'time',
        -- リソースID
        JSON_VALUE(doc, '$.resourceId') as 'resourceId',
        -- どのサービスに、どんなアクションをしたか
        JSON_VALUE(doc, '$.operationName') as 'operationName',
        -- アクションをした結果ステータス
        JSON_VALUE(doc, '$.resultSignature') as 'resultSignature',
        -- どのIPから呼び出されたか
        JSON_VALUE(doc, '$.callerIpAddress') as 'callerIpAddress',
        -- アクションの具体
        JSON_VALUE(doc, '$.identity.authorization.action') as 'action',
        -- アクションを実行した人の名前
        -- Azureに組織メンバーとして登録されているユーザー名
        JSON_VALUE(doc, '$.identity.claims.name') as 'name'
    FROM tmp_target_log
)
------------------------------------
-- 以下で詳細な条件を絞ることもできます --
------------------------------------
-- , detail_log
-- AS
-- (
--     SELECT
--         *
--     FROM tmp_target_log
--     WHERE name = 'hogetaro'
-- )
------------------------------------
SELECT * FROM target_log;

Activity Log が Blob コンテナに保存されるときは json 形式で保存されます。
以下が json スキーマです。

learn.microsoft.com

以下に、クエリ内の中間テーブルである detail_log 内でのクエリ例を簡単に紹介します。

◇ 特定の誰かに絞る

SELECT
    *
FROM tmp_target_log
WHERE LOWER('name') = LOWER('hogetaro');

◇ 特定のIPからのアクセスに絞る

SELECT
    *
FROM tmp_target_log
WHERE callerIpAddress = 'xxx.xxx.xxx.xxx';

以上で手順は完了です。

まとめ

Azure OpenAI が利用開始されるようになってから、Azure 上でアプリケーションを開発する機会がより増えてくると思います。

少しでも参考になれば幸いです。

2021-12-16

Log4J問題をAWS WAFで防ぐ手順

AWS WAF Java Log4J ALB 脆弱性セキュリティ

はじめに

よくAWSにふれるものです。

2021年12月10日、歴史的な日になるかもしれない、その日にJava ベースのロギングライブラリであるLog4Jの脆弱性が見つかりました。

詳しくは情報処理推進機構のページをご覧ください。

www.ipa.go.jp

簡単に言うと、Log4Jの一部機能を悪用して、任意のコードを実行できてしまいます。

www.jpcert.or.jp

今回はAWS上で動いているJavaアプリケーションでそれを防ぐために、AWS公式が用意したWAFのルールを適用する手順を説明しようと思います。

これでLog4Jの誤作動を引き起こす文字列を含むリクエストを防ぐことができます。

手順

Javaアプリケーションへは、ELBを通ってサーバーに達っする想定で説明します。

なのでWAFはELBに挟みます。

Create web ACLをクリック f:id:xkenshirou:20211215233834p:plain

Nameにルールの名前を適用し、Regionを選択します。

Add AWS resourcesを選択します。 f:id:xkenshirou:20211215234038p:plain

Application Load Balancerを選択、好きなALBを選択してAddします。 f:id:xkenshirou:20211215234408p:plain

Add rulesからAdd managed rule groupsを選択。 f:id:xkenshirou:20211215234548p:plain

AWS managed rule groupsを選択してから、Known bad inputsのAdd to web ACLをONにします。その後、Editをクリック。 f:id:xkenshirou:20211215234703p:plain

f:id:xkenshirou:20211215234814p:plain

Log4JRCEのみcountをOFFにして、save ruleします。その後、Add rulesします。 f:id:xkenshirou:20211215235224p:plain

目的のルールが追加されているか確認します。 f:id:xkenshirou:20211215235338p:plain

もしも他にもルールがある場合は、目的のruleを選択してMove upをクリックすることで、順位が上に来ます。最上位にしましょう。 f:id:xkenshirou:20211215235459p:plain

確認 f:id:xkenshirou:20211215235632p:plain

これでCreate web ACLをすれば完了です！

確認

普段叩けるpingがOKで、悪意のあるリクエストが弾ければOKです。

通常のping

$ curl https://xxx.yyy.com/ping

悪意のあるリクエスト

$ curl -H 'User-Agent: ${jndi:ldap://0.0.0.0:389/1111111}' https://xxx.yyy.com/ping

まとめ

今回の脆弱性に対しては、世界的に温度感が高いので、早急に対応して、思わぬ事故を防ぎましょう。

誰かの助けになれば幸いです。

2021-02-24

アカウント間S3レプリケーションのやり方

AWS S3 Storage

はじめに

よくAWSに触れるものです。

複数AWS環境を持っている方で、S3バケット内のオブジェクトデータを移したいと思うことはよくあるのではないでしょうか。

そんなときに、スタンダードなやり方としては$ aws s3 syncか$ aws s3 cpを使うかと思うのですが、それだといちいちコマンドを打つのがめんどくさいですし、そもそも膨大なオブジェクトデータが存在しているとかなりの時間がかかります。

そんなときはS3のレプリケーション機能を使いましょう。

S3レプリケーション機能はレプリケート元バケットに新しくオブジェクトが追加されると、レプリケート先S3バケットにもオブジェクトが再現されます。

今回はそんな便利なS3のレプリケーション機能について実践します。

導入

まずドキュメントでS3レプリケーションについてのドキュメントを読んだときに、

あれ？レプリケートって言葉はどっち方向の言葉？レプリケート元ってどっち？

てなることがあるかなと思います。

なので、以下のような図を用意したので、そちらを参考にしてください。

f:id:xkenshirou:20210212191505p:plain

手順

それでは早速、実践していきましょう。

1. S3バケットのバージョニングを有効にする

レプリケート元、先バケットのバージョニングを有効にしましょう。

2. レプリケート元バケットでレプリケーションルールを作成

バケットの管理からレプリケーションルールの作成を選択します。

f:id:xkenshirou:20210212191921p:plain

ここでは

適当なルール名を入力
ルールスコープはすべてのオブジェクトを選択
送信先でレプリケート先アカウントを指定 ※ この際、オブジェクト所有者を送信先バケット所有者に変更を選択してください
IAMロールを付与

の用に設定を行います。

IAMロールはここで自動作成しても良いです。

以下のポリシーを持ったロールを作成しましょう。

{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Action": [
                "s3:ListBucket",
                "s3:GetReplicationConfiguration",
                "s3:GetObjectVersionForReplication",
                "s3:GetObjectVersionAcl",
                "s3:GetObjectVersionTagging",
                "s3:GetObjectRetention",
                "s3:GetObjectLegalHold"
            ],
            "Effect": "Allow",
            "Resource": [
                "arn:aws:s3:::<レプリケート先バケット名>",
                "arn:aws:s3:::<レプリケート先バケット名>/*"
            ]
        },
        {
            "Action": [
                "s3:ReplicateObject",
                "s3:ReplicateDelete",
                "s3:ReplicateTags",
                "s3:ObjectOwnerOverrideToBucketOwner"
            ],
            "Effect": "Allow",
            "Resource": [
                "arn:aws:s3:::<レプリケート先バケット名>/*",
                "arn:aws:s3:::<レプリケート先バケット名>/*"
            ]
        }
    ]
}

3. レプリケート先バケットにバケットポリシーを追加する

以下のようなバケットポリシーを追加します。

{
    "Version": "2008-10-17",
    "Id": "",
    "Statement": [
        {
            "Sid": "1",
            "Effect": "Allow",
            "Principal": {
                "AWS": "arn:aws:iam::<account-id>:role/<レプリケーションルールに付与したロール名>"
            },
            "Action": [
                "s3:ReplicateObject",
                "s3:ReplicateDelete"
            ],
            "Resource": "arn:aws:s3:::<このポリシーを追加しているバケット名>/*"
        },
        {
            "Sid": "2",
            "Effect": "Allow",
            "Principal": {
                "AWS": "arn:aws:iam::<account-id>:role/service-role/<レプリケーションルールに付与したロール名>"
            },
            "Action": [
                "s3:GetBucketVersioning",
                "s3:PutBucketVersioning"
            ],
            "Resource": "arn:aws:s3:::<このポリシーを追加しているバケット名>"
        }
        {
            "Sid": "3",
            "Effect": "Allow",
            "Principal": {
                "AWS": "arn:aws:iam::<account-id>:root"
            },
            "Action": "s3:ObjectOwnerOverrideToBucketOwner",
            "Resource": "arn:aws:s3:::<このポリシーを追加しているバケット名>/*"
        }
    ]
}

この際、Sid: 3のポリシーが無いと、オブジェクトの所有権をレプリケート先バケットにすることができないので注意しましょう。

これでレプリケーションの設定は完了なので、実際にレプリケート元バケットにオブジェクトを保存して、レプリケート先バケットに再現されるか試してみましょう。

おわりに

AWSのストアやストレージ系のレプリケーション機能については以前もこちらで紹介しています。

xkenshirou.hatenablog.com

レプリケーション機能は他にもECRにも存在しているので、今度そちらにも触れようと思います。

参考

レプリケーション設定方法
https://docs.aws.amazon.com/ja_jp/AmazonS3/latest/user-guide/enable-replication.html

アカウント間レプリケーションの設定方法
https://docs.aws.amazon.com/ja_jp/AmazonS3/latest/dev/replication-walkthrough-2.html

レプリケーションする際のオブジェクト所有権を移す
https://docs.aws.amazon.com/ja_jp/AmazonS3/latest/dev/replication-change-owner.html

ヘヴィメタル・エンジニアリング

AWS特化型エンジニアのほのぼのヘヴィメタルブログ

Azure での証跡ログはこれでサクッと解析する！ Activity Log と Synapse Analytics を使った便利な方法

はじめに

Azure の基礎知識

・Azure AD

・サブスクリプション

・リソースグループ

Activity Log

証跡ログ調査手順

前提

1. Activity Log の検索機能

2. Log Analytics

3. [ Storage Blob 経由 ] Log Analytics

4. [ Storage Blob 経由 ] Synapse Analytics

手順

前提

1. Synapse Analytics ワークスペースを作成

2. Synapse Studio にログイン

3. OPENROWSET 関数を使って Blob コンテナのデータを参照

まとめ

Log4J問題をAWS WAFで防ぐ手順

はじめに

手順

確認

まとめ

アカウント間S3レプリケーションのやり方

はじめに

導入

手順

1. S3バケットのバージョニングを有効にする

2. レプリケート元バケットでレプリケーションルールを作成

3. レプリケート先バケットにバケットポリシーを追加する

おわりに

参考