Mythos 時代のバグ報奨金プログラム

バグ報奨金プログラムは、30 年の歴史の中で今最も急速に変化しています。AI を活用した調査が増加したことで、「スロップ (AI が生成したゴミデータ)」が多くのプログラムに溢れかえっています。また、最先端のフロンティアモデルが、検証済みで再現性があり、悪用可能な脆弱性をマシンスピードで発見し始めています。この 2 つのトレンドは加速しており、どちらも後戻りすることはありません。

この変化は、バグ報奨金プログラムの目的そのものを再定義するものです。それはもはや、外部の調査結果を受け付けるだけの窓口ではありません。プログラムを運営するすべての組織の足元で形状を変えた脆弱性発見プロセスに、その組織のトリアージ、エンジニアリング、および対応の仕組みが追いついているかどうかを検証するテストなのです。

本記事では、こうした変化をソフォスがどのように捉えているか、バグ報奨金プログラムに何が求められているのか、そしてソフォスのプログラムがどのように進化してきたかを解説します。また、2025 年の実績についても取り上げます。というのも、2025 年は、Netscape が研究者に初期のブラウザベータ版の脆弱性発見を呼びかけた、最初のバグ報奨金プログラムが発足してから 30 年であり、またソフォスが独自の公開プログラムを立ち上げてから 8 年という節目にあたるからです。

AI によってそのあり方が変わりつつあるバグ報奨金プログラム

皆さんが最近よく耳にしているのは、おそらく「スロップ」と呼ばれるものでしょう。AI を活用して手間を省いた報告が急増し、業界全体のトリアージキュー (優先度判定の待ち行列) を詰まらせている状況です。これは現実に起きている面倒な問題です。しかし、それは現在起きていることの一部にすぎません。そうしたノイズの裏側で、AI は検証済みの悪用可能な脆弱性をマシンスピードで検知し始めており、その能力は急速に向上しています。

以下の 2 つは同時に成り立ちます。

スロップの増加 (自動化が進み、報告が増え、トリアージの負担が増す)。
能力の向上 (モデルは、コードベース全体にわたる推論、エクスプロイトの仮説構築、および一見して分からない攻撃チェーンの発見がより得意になる)。

この 2 つのトレンドは加速しており、どちらも後戻りすることはありません。プログラムをどのように進化させるべきかを議論する前に、ソフォスの 8 年間にわたるプログラム運営がどのようなものであったかを説明しておく必要があるでしょう。なぜなら、プログラムが時間をかけて獲得してきた「身体的記憶」こそが、このような変化に対してレジリエンスを発揮できるようになる重要な要素だからです。

ソフォスのプログラムはどのように進化してきたか

他の組織と同様に、ソフォスは Mythos 時代を念頭に置いてバグ報奨金プログラムを設計したわけではありません。しかし、8 年間にわたりプログラムを運営し、調整し、そこから学び続けてきたことで、最近になって設計され、ゼロから開始されるプログラムよりも、これから訪れる変化に対する態勢が整っています。

プログラムの始まり

ソフォスは 2015 年と 2016 年に非公開のバグ報奨金プログラムを運営していましたが、2017 年 12 月 14 日に脆弱性開示ポリシーと併せて、Bugcrowd 上で公開のプログラムを開始しました。

それ以来、本稿執筆時点で、合計 7,091 件の報告のうち 1,343 件の脆弱性に対して報奨金を支払っており、報奨金の総額は 599,695 ドルに達しています。

このプログラムを開始した理由は単純であり、セキュアバイデザインの成果に直結しています。

社内ですべてを網羅することは不可能: 外部の調査にインセンティブを与えることで、社内では完全に再現できない製品、設定、および脅威モデルのカバー率が向上します。
セーフハーバー (法的免責条項) の重要性: 明確なルールのもと、研究者が善意に基づいて報告できる環境があれば、セキュリティはより迅速に向上します。(実務におけるこの枠組みの重要性については、こちらで詳しく説明しています。)
継続的で多様な評価: バグ報奨金プログラムは、一過性の評価ではなく、年間を通じた綿密な検証を可能にします。
学習スピードの向上: 研究者との対話は、エンジニアにとっての一種の実戦的トレーニングです。特に、単発のバグの発見にとどまらず、設計上の問題が明らかになる場合にその効果は高まります。

当初から、このプログラムには次のようなデメリットがあることも分かっていました。

一部の脅威ハンターは、件数が多く、発見しやすい脆弱性に引き寄せられます。その結果、深刻度の低い問題に偏る可能性があります。有用ではあっても、最も排除すべきリスクと一致するとは限りません。
再現性、深刻度、スコープを巡って意見の相違が起こり得ます。これは避けられないことであり、ソフォスが信頼できるサードパーティプラットフォームを通じてプログラムを運営することを選択した理由の一つでもあります。
検証にはコストがかかります。重複、スコープ外の報告、誤検知、および公開済みの脆弱性はすべてフィルタリングする必要があります。有効な報告の比率はかなり低く、これは多くのプログラムに影響を与えてきた問題であり、AI によって劇的に悪化しています。cURL における AI のスロップに対する Daniel Stenberg 氏の不満は、非常に参考になる事例です。2026 年 1 月、同プログラムの金銭的報酬は Stenberg 氏によって終了しました。

「セキュアバイデザイン」の実践: プレッシャー下で得た教訓

ソフォスが学んだ最も重要な教訓の 1 つは、バグ報奨金プログラムを独立した「受信トレイ」としてではなく、システムの一部として扱うことで、最善の成果が得られるということです。以下の 2 つの Pacific Rim 関連の事例は、その理由を如実に示しています。また、AI によって脆弱性調査のペースが変化する中で、こうした取り組みの重要性が今後高まっていくことも示唆しています。

「友人」の事例: コラボレーションが期待通りの成果をもたらす

ソフォスは Pacific Rim について報じた記事で、ソフォスの製品やインフラストラクチャを標的とした攻撃者を追跡しました。この攻撃には、これまで知られていなかった SQLi (CVE-2020-12271) を悪用し、一部のファイアウォール製品で RCE を行った Asnarök攻撃も含まれています。関連資料を公開した直後、ドイツに拠点を置くセキュリティ企業 Code White の研究者から、バグ報奨金プログラムの申請がソフォスに届きました。

Code White からの報告は、理想的な「友人」関係の一例です。研究者が攻撃者の視点で標的にアプローチしつつも、透明性を持って責任ある行動を選択したのです。彼らは当初、レッドチーム評価用の RCE エクスプロイトを作成しようとしていましたが、RCE に悪用可能な別の SQLi (CVE-2020-15504) を発見したため、ソフォスのプログラムを通じて報告してくれました。

情報開示タイムライン (Code White のブログ記事) からは、ソフォスがセキュアバイデザイン実践の一部と捉えている「迅速かつ明確な対応」が実現していることが分かります。

2020 年 5 月 4 日 – 22:48 UTC: Bugcrowd を通じてソフォスに脆弱性を報告
2020 年 5 月 4 日 – 23:56 UTC: ソフォスが報告の受信を確認 (1 時間強)
2020 年 5 月 5 日 – 12:23 UTC: ソフォスが問題を再現し、修正作業を開始
2020 年 5 月 5 日: ソフォスが最初の自動ホットフィックスの配信を開始 (同日)
2020 年 5 月 16 日: 研究者が、ホットフィックスのセキュリティ対策が回避される可能性を報告
2020 年 5 月 21 日: 2 回目のホットフィックスがリリースされ、認証前メールの隔離解除機能を無効化
2020 年 6 月: 修正が組み込まれたファームウェア 18.0 MR1-1 がリリース
2020 年 7 月: 修正が組み込まれたファームウェア 17.5 MR13 がリリース
2020 年 7 月 13 日: ベンダーと連携してブログ記事を公開

最初の報告から再現確認まで 13 時間未満、そして同日中に最初のホットフィックスが提供されました。こうした迅速な対応サイクルこそが、お客様やエコシステムに対するリスクを、迅速かつ目に見える形で低減させるのです。まさにこれが、Mythos 時代において最低限求められるスピードです。

「フレネミー (友人を装った敵)」の事例: エコシステムの複雑化

Pacific Rim はまた、厳しい教訓をもたらしました。Asnarök (2020 年) と Personal Panda (2022 年) の 2 つの事例において、攻撃者はソフォス製品のゼロデイ脆弱性を悪用し、その直後、ソフォスには同じ脆弱性に関する外部からのバグ報奨金報告が寄せられました。

Asnarök の場合、報告された脆弱性は攻撃に使用されたものとは異なっており、当該の研究者は以前からソフォスのプログラムや他のプログラムに貢献していた (また現在も貢献している) ため、攻撃と直接関係している可能性は高くありませんでした。しかし、報告のタイミングは疑わしく (攻撃の 1 日前)、研究者のデバイスの位置情報も疑わしいものでした。その場所は中国の成都で、後にソフォスが Pacific Rim の活動の中心地であると特定した都市です。

Personal Panda (CVE-2022-1040) も経緯は同様です。匿名希望のある研究者が、ソフォスのバグ報奨金プログラムにゼロデイ脆弱性を報告し、2 万ドルの報奨金を受け取りました。この研究者は、日本を拠点にしていると主張していましたが、使用していたデバイスの位置情報は中国でした。事後調査をしたところ、バグ報奨金プログラムの申請よりも前に CVE-2022-1040 が実際に悪用されていたことが明らかになりました。発生件数は限定的であったものの、被害者の特性やタイミングから、中国の外交政策上の目的と一致する標的型攻撃のパターンを示していました。

これらの攻撃を、対応する報告と決定的に結びつける十分な証拠はありません。しかし、タイミング、状況、および特定の指標から、悪質な動機が存在する可能性が浮上しました。つまり、攻撃者が脆弱性を悪用すると同時に、バグ報奨金プログラムで金銭的利益を得ようとしたという可能性です。

重要なのは、これが研究者コミュニティ全体に対するソフォスの見解を変えるものではないということです。報告の圧倒的多数は善意に基づくものであり、また、ソフォスのプログラムは善意の研究者を尊重し続けることによって機能しています。ソフォスは、Sophos Firewall の内部構造に精通する中国在住の研究者から貴重な報告を引き続き受けており、それらの報告のおかげでソフォス製品はより安全になっています。これは、ソフォスのプログラムが掲げる目標そのものです。しかし、Pacific Rim の経験により、セキュアバイデザインの現実が改めて浮き彫りになっています。つまり、バグ報奨金プログラムは、成熟した運用上の安全策 (厳格なトリアージ、検証の規律、そして資金と信頼が関わるシステムであれば攻撃者に悪用される可能性があるという認識) のもとで運営されるべきです。AI によって質の高い報告を提出する攻撃者が増えれば、その規律は重要性を増すばかりであり、決して減ることはありません。

AI の問題に立ち返って: どこに向かい、何が求められているのか

8 年間のプログラムの経緯を踏まえ、AI の問題に立ち返ってみましょう。本記事の冒頭で概説したスロップと能力の問題は、もはや抽象的なものではなく、プログラムを運営するすべての人にとって「報告の待ち行列」のあり方を変貌させつつあります。私たちが目の当たりにしている状況を整理する上で役立つ 3 つの意見があります。

業界はこの見解に収束しつつあります。Cloud Security Alliance が最近発表した Mythos 対応のセキュリティプログラムに関する論文は、Knostic の Gadi Evron 氏が主導し、CSA と SANS の共同執筆者が加わり、筆者を含む 250 名以上の CISO による査読を経た提言書ですが、この変化を率直に次のように捉えています。「脆弱性の発見から悪用までの時間が数時間にまで短縮された一方で、数週間単位のパッチ適用サイクルに基づいて構築されているセキュリティプログラムは、そのスピードに対応できなかった。」バグ報奨金プログラムは、そのプレッシャーの最前線に位置するものです。

Bugcrowd のオペレーション担当シニアバイスプレジデントである Michael Skelton 氏は、この変化の両面を浮き彫りにする、報告キューに関する調査結果を共有してくれました。スロップについては、AIをあまり理解しないまま利用する人々が急増し、質の低い報告がますます増え続けています。これが最も顕著な変化です。しかし、Skelton 氏が指摘するように、これが最も重要な変化というわけではありません。より重要な変化とは、スキルの高い研究者が AI を何に活用しているかという点にあります。Bugcrowd では、認可関連の脆弱性の報告件数が著しく増加しています。多くのプログラムにおいて、ハッカーは認可を回避できる 1 つの攻撃経路を特定し、次に AI を利用して、それを顧客のテナント全体、場合によってはプログラムのスコープ内にある複数の Apex ドメインやサブドメインに拡大しています。以前はプログラムから排除されるまでに数年を要していた認可関連のバグが、現在では数時間から数日で発見されるようになっています。Skelton 氏は、これが攻撃面と防御面の双方において、AI がセキュリティに与える影響を論じる上で最も重要な要素の一つになると予測しています。

以上が短期的な展望ですが、中期的な展望はより鮮明です。ソフォスが脆弱性の洪水に関する記事で論じたように、フロンティアモデルは、一見もっともらしいナンセンスの域を超え、検証済みで悪用可能かつ深刻度の高い脆弱性を大規模に特定する段階へと移行しつつあります。Anthropic の Claude Mythos Preview は、主要なオペレーティングシステムやブラウザにおいて、すでに数千件のゼロデイ脆弱性を発見しています。ソフォスが実施した OpenClaw レッドチーム演習では、社内ネットワークの 1 つで Mythos 以前のモデルを使用することで、数日かかっていた偵察作業を数時間に短縮し、1 つの非特権アカウントから重大な権限昇格経路を特定することに成功しました。

これら 2 つの動向を総合すると、バグ報奨金プログラムへの影響は明白です。ノイズを排除することから、絶え間なく寄せられる本物の脆弱性の報告に対応することへと課題が転換しつつある一方で、ノイズそのものは増え続けているのです。

プログラムの設計への影響

問題は、「AI による報告をどのように阻止あるいは削減するか」ではなく、「優れた調査とノイズの両方がマシンスピードで生み出される世界において、どうすれば信頼と有用な情報を維持できるか」ということです。

以下に、ソフォスのプログラムを含め、各プログラムが進むべき方向性を示します。

デフォルトでの証拠要件の厳格化。明確な PoC (概念実証)、ログ、トレース、影響を受けるバージョン、および再現手順。報告内容を再現できない場合、その報告は対象になりません。
より優れたトリアージ前の選別と自動検証。プラットフォーム側とベンダー側の双方において実施します。レピュテーションシグナルやスロップ検知によってノイズは削減されますが、より効果的なのは評価そのものの自動化です。つまり、影響を受ける製品のクリーンなインスタンスを起動し、提出された PoC を再現して、人間が確認する前に報告の真偽を判断します。これこそが、AI が生成しようとしている大量の報告に応じて拡張可能なインフラストラクチャへの投資となります。
深さを重視したインセンティブ。チェーン攻撃、現実的な悪用可能性、新規の脆弱性クラスなど、注目すべきは「バグの数」ではありません。プログラムは、AI がまだ低コストで処理できない作業に対して報いるものでなければなりません。
敵対的行動を想定したプログラム設計。レート制限、構造化された報告、および疑わしいパターンに対する明確なポリシーが必要です。検討に値する手法の 1 つとして、プログラムに「ハニートークン」脆弱性を仕込むことが挙げられます。これは、一見すると信憑性があるように見えるが調査研究の対象とすべきではない、捏造された問題です。そのパターンに一致する報告は、悪意のある、または AI スロップのパイプラインを発生の段階で特定する上で有用なシグナルとなります。金銭と信頼が関わるシステムは、すべて精査の対象となります。Gadi Evron 氏は当初、このアイデアを冗談めかして提唱していましたが、スロップ時代においては、実現性があるかもしれません。
立証責任のハードルを引き上げ、不都合なトレードオフを受け入れる。従来、バグ報奨金プログラムは研究者に対し、漠然とした証拠を掴んだ時点で調査を中止するよう求めてきました。これは、研究者がインフラストラクチャの深部に踏み込んだり、顧客データにアクセスしたりすることを防ぐためです。しかし、Mythos 時代の到来は、その前提を根本から変えます。報告内容が本当に悪用可能であるならば、それはスロップではありません。さらに踏み込んで実際の影響を証明する能力こそが、「本物の調査」と「自信満々に語られる虚構」を分けます。先日、ソフォスのエンジニアが週末に時間を費やしてまで電話会議を行い、再現と解決を試みた、巧妙な報告がありました。しかし、結局のところ、その報告はすべて捏造されたものであったことが判明しました。証明のハードルが高まるにつれ、各プログラムは参加規約や契約内容を見直す必要が出てきます。つまり、実際の顧客データを危険にさらすことなく、信頼できる研究者に対して制御された経路を提供し、影響をより徹底的に実証できるようにする必要があります。これは難しい課題ですが、コミュニティが協力して解決しなければならない問題です。
プラットフォームとの連携強化。Bugcrowd はすでにこの方向に進み始めており、同社が「スロップティミズム (sloptimism)」と呼ぶもの (AI によって生成され、最低限の検証で提出される大量の報告) に対抗するべく報告ポリシー、レート制御、および検知メカニズムを最近更新するとともに、報告の大量投稿を行うアカウントを永久に利用停止にしました。

また、AI は、多くのセキュリティチームがすでに進めている「統合」作業を加速させるでしょう。つまり、ペネトレーションテスト、スキャナー、内部テスト、およびバグ報奨金プログラムへの報告から得られた知見を、一貫した評価基準と文脈に基づいた 1 つの優先順位付けシステムに統合する取り組みです。しかし、注目すべき変化がもう一つあり、それこそが防御側が絶対に見落としてはならないものです。攻撃者や研究者がバグをより迅速に発見できるようにする AI 能力こそが、クローズドソースソフトウェアのベンダーに圧倒的な優位性をもたらします (もちろん、その優位性を活用する意思があるならばの話ですが)。外部の研究者は、バイナリやブラックボックスの挙動に対して、外側から内側に向かってアプローチしています。一方、ソースコード、ビルドシステム、テストインフラストラクチャへの完全なアクセス権を持つ私たちは、内側から外側に向かってアプローチしています。攻撃者よりも先にバグを検知するために自社のコードに AI を投入することは、Mythos 時代において必要不可欠です。これは防御側が持つ最も強力なアドバンテージの 1 つであり、これに投資するプログラムこそが、常に先手を打つことができるのです。

Mythos 時代を乗り切るためのヒント

脅威ハンターの皆様へ

再現性はボリュームに勝る。明確な手順、証拠、検証がこれまで以上に重要になります。特に、トリアージチームがノイズに忙殺されているときにはなおさらです。
AI を代役としてではなく、副操縦士として利用する。AI は明確化や整理に役立ちますが、報告の検証や仮説のテストは依然として人間が行う必要があります。検証せずに RCE を報告すれば、全員 (特に報告者自身) が不利益を被ることになります。
創造性を発揮する(他の人が右に行くなら、あえて左へ行ってみる)。重複は起こり得ます。斬新な発見は、大抵の場合、型破りなアプローチや見落とされがちな設定、あるいはより深いレベルでの脆弱性の連鎖から生まれます。それは、自動化された報告パイプラインが決して到達できない場所にあります。
研究者を尊重する企業を評価する。研究者の成果を大切にするプログラムこそが、時間を投資する価値のあるプログラムです。

組織の担当者へ

バグ報奨金プログラムを、単なる PR 活動ではなく、セキュアバイデザインの一環として位置付ける。セキュアな開発プラクティス、ペネトレーションテスト、社内評価、およびインシデント対応のワークフローと統合してください。
影響の大きさ、およびその影響の立証に必要な作業に対して報奨金を支給する。報告に信憑性のあるリスクが示されている場合には (たとえ DoS のみが実証されている場合であっても)、悪用可能性が高ければ適切に評価してください。
件数だけでなく、プログラムの「健全性」を測定する。手間のかからない問題は、時間の経過とともに減少していますか？研究者は再び参加してくれていますか？バグは発見が難しい種類へと移行していますか？これらは、製品とプログラムの双方において、適切なアプローチが取られていることを示すサインです。
スコープとインセンティブの調整を継続的に行う。プログラムは、アーキテクチャの変更、製品の成熟度、およびアクティブな脅威の状況に合わせて進化させる必要があります。また、現在では AI を活用した調査の手法も考慮に入れる必要があります。
報告内容に基づいてインシデント対応を強化する。テレメトリから「研究者を特定」し、そのバグを悪用しようとするこれまで知られていなかった試みを識別できるようにする必要があります。
質の低い自動化に対して、明確な防御策を構築する。構造化された報告要件、証拠の基準、およびレピュテーションシグナルを活用することで、善意のハンターに不利益を与えることなく、ノイズへの対応コストを削減できます。
研究者を尊重し、適切に報いる。これは単純なことのように思えますが、非常に重要です。評価されていると感じた研究者は、プログラムに戻ってきます。報告を面倒なものとして扱うプログラムは、それに見合った結果しか得られません。

結論

バグ報奨金プログラムは開始から 30 年が経過しましたが、今後成功を収めるのは進化し続けるプログラムです。外部へのインセンティブ、責任ある情報開示、およびコラボレーションによるセキュリティ強化という中核的な仕組みが有効であることに変わりはありません。変化しているのは、それらを取り巻く規模、ツール、そして脅威環境です。

ソフォスの根本的な考え方は変わりません。バグ報奨金プログラムは、継続的な外部検証、迅速な対応、そして関係者全員の基準を引き上げる長期的な技術的改善を通じて、セキュアバイデザインの成果を実現するための手段の一つなのです。Mythos が到来したからといって、そのミッションは変わりません。むしろ、これを適切に遂行することの重要性はさらに高まりました。

バグ報奨金プログラムには常に課題が伴うため、慎重に管理する必要があります。これは万能薬でもなければ、一度設定すれば放置していいものでもありません。しかし、他のセキュリティ対策と統合され、組織と研究者の双方が誠意をもって協力し合うことで、その成果は豊かなものになるはずです。

著者について

Ross McKerchar

Ross McKerchar is the CISO of Sophos. Ross has a BSc in Computer Science from Edinburgh University and joined Sophos in 2007. During his years at Sophos, Ross established and built Sophos’ cybersecurity program through periods of high company growth, including multiple acquisitions and an IPO on the LSE.

At Sophos, the CISO team runs all aspect of Sophos' own security including Security Architecture, Trust and Compliance, Product Security, Red Teaming and Security Operations. Sitting in the Sophos technology group alongside Sophos Labs and our customer-facing MDR team, we are part of Sophos X-Ops joint task force.

Out of work Ross has a passion for the outdoors and, when he’s not spending time with his young family, loves to travel around the world rock climbing, trail running or surfing.

Ryan Westman

Ryan Westman is a Senior Manager of Threat Research at Sophos. With over a decade of experience in cybersecurity and national security, Ryan specializes in threat intelligence and operations. He has led high-performing teams across government, Big Four consulting, and the MDR space.
Ryan has provided expert commentary to leading media outlets and spoken at major national and international conferences, including DEFCON, RMISC, Sleuthcon, ILTACon, and Evanta CISO events. He holds multiple degrees and industry certifications (GCTI, GCFA, GSLC) and is passionate about protecting organizations from foreign and domestic cyber threats.