CloudflareがKimi K2.5導入後、毎日70億トークンを処理し、安全監査コストを77%削減

動區BlockTempo

CloudflareのWorkers AIプラットフォームは、月之暗面(Moonshot AI)のKimi K2.5を正式に導入し、256Kのコンテキスト、多ターンツール呼び出し、ビジュアル入力をサポートしています。Cloudflare内部のセキュリティ監査エージェントは毎日700億以上のトークンを処理しており、切り替え後のコストは中程度の商用モデルと比べて77%削減されています。

(前提情報:CursorはKimi K2.5を用いてモデルを訓練したが公表せず、開発者のパケットキャプチャや削除、公式の急な方針転換の記録も残っている)

(背景補足:クローラー対策のCloudflareは、「ワンクリック全サイトクローラーAPI」をリリースし、RAGや増分更新、モデル訓練を完璧にサポート)

本文目次

Toggle

  • 1日700億トークンを処理するセキュリティエージェント
  • Cloudflareの3つの改善点
  • 基盤推論エンジン:Infireの採用、既成フレームワークの無理な適用ではない

CloudflareのWorkers AIプラットフォームは、ひっそりと大きな進展を遂げており、公式ブログによると、月之暗面のKimi K2.5をAgents SDKスターターのデフォルトモデルに設定しました。Cloudflareのエンジニアも実際のセキュリティ監査にこれを使っており、多くのコスト削減を実現しています。

Kimi K2.5は、現存のオープンソースの中でも「最先端規格」に対応したモデルの一つで、256Kのコンテキストウィンドウ、多ターンツール呼び出し、ビジュアル入力、構造化出力をサポートしています。長文推論を必要とするエージェントタスクには非常に有用です。

1日700億トークンを処理するセキュリティエージェント

CloudflareのエンジニアはOpenCode環境で、Kimi K2.5をプログラミングエージェントの主要モデルとして直接使用し、「Bonk」という公開コードレビューエージェントも自動化パイプラインに組み込んでいます。

特に注目すべきは内部のセキュリティ監査シナリオです。このエージェントは毎日700億以上のトークンを処理しています。標準的な商用モデルで同じ作業を行った場合、年間約240万ドルのコストがかかるところ、Kimi K2.5に切り替えることでコストは77%削減され、約185万ドルの節約となっています。

この数字は広告ではなく、Cloudflareのエンジニアが公式ブログで公開した実績です。

Cloudflareの3つの改善点

モデルの切り替えだけでは不十分であり、Cloudflareはエージェントの長期対話シナリオにおけるコストと効率の問題に対応するため、プラットフォームレベルで以下の3つの改善を同時に導入しました。

  • プレフィックスキャッシング(Prefix Caching):過去の対話で処理済みの入力トークンは再計算されず、キャッシュヒットしたトークンは割引価格で処理される。長時間のタスクでは大きなコスト削減が期待できる。
  • セッションアフィニティヘッダー:新たにx-session-affinityリクエストヘッダーを追加し、同一セッションを同じモデルにルーティング。キャッシュヒット率を向上させ、OpenCodeやAgents SDKスターターに標準搭載。
  • 非同期バッチ推論API:同期レート制限を超えるリクエストは非同期でキューに入れ、内部テストでは通常5分以内に完了。コードスキャンや研究用途のエージェントに適している。

基盤推論エンジン:Infireの採用、既成フレームワークに頼らない

Cloudflareは既成の推論フレームワークを使わず、自社開発のInfire推論エンジンをコアにカスタマイズしています。データ並列、テンソル並列、エキスパート並列化を採用し、分離型のプレフィックス処理アーキテクチャと組み合わせています。

現在、Kimi K2.5はWorkers AI上での大規模モデル推論の最初の事例であり、CloudflareのAIインフラに対する野心を示しています。ネットワークプラットフォームと連携しながら、コストも非常に安価です。

原文表示
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。
コメント
0/400
コメントなし