AIの「定額使い放題」が終わり始めた——最上位モデルの従量制化が、組織に突きつける問い

2026年6月9日、アンソロピック(Anthropic)社が新しい最上位モデル「クロード・フェイブル5(Claude Fable 5)」を公開しました。セキュリティ攻撃の悪用懸念から一般公開されていない「クロード・ミュトス(Mythos)」と同等の高い性能を持つとの触れ込みです。
今回注目したいのは性能よりも、その提供のされ方です。有料プラン契約者は6月22日までは追加料金なしで利用できますが、23日以降は「使用クレジット」——つまり使った分だけ支払う従量制——が必要になる見込みだと、同社は発表しています。
月額定額が当たり前だったAIサービスに、最上位モデルに限ってとはいえ、使った分だけ払う仕組みが本格的に持ち込まれ始めたわけです。
これは一見、料金プランの細かい話に見えます。でも実は、組織のAI活用のあり方そのものに関わる変化だと考えています。
「使い放題」は、実は最初からなかった
とはいえ、AIをある程度使い込んできた方なら、思い当たる経験があるはずです。
集中して作業していたら、突然「利用上限に達しました。あと3時間ほどお待ちください」と止められる——無料プランでも有料プランでも、ヘビーに使えば必ずぶつかる、あの壁です。
つまり定額制といっても、実際には使い放題ではありませんでした。料金の代わりに「待ち時間」で利用量が調整されていただけで、見えない従量制は、ずっとそこにあったのです。
なぜそんな調整が必要なのか。高性能なモデルほど、一つの答えを出すために多くの計算をします。計算が多ければ、それだけ多くの電力と設備を使う。AIの利用には、実際の資源消費が伴っているのです。従来型のソフトウェア使い放題とは事業のコスト構造が大きく違う。
これまでは、その資源の制約は、事業者側が「待ち時間」という形で吸収してくれていました。あるいは競争の観点で、事業者が呑み込んでいた部分もあったはずです。でも、最上位クラスのモデルになると、その計算量の増加コストはもう吸収しきれない。
つまり今回の従量制化は、これまで待ち時間として隠れていたコストが、追加料金という見える形に「ついに変わった」、ということだと受け止めることができそうです。
(運営会社はなんとか定額制を維持したいとは表明していますが)。
だとすれば今後、「どの仕事にどのモデルを使うか」というコスト感覚——いわばトークン省エネ運転の意識——が、われわれ利用者側に求められるようになる。理屈の上では、確実にそうなります。
ただ、ここには一つ大きな問題があります。
利用者には、モデルの性能差が「実感できない」
家電の省エネ性能なら、カタログスペックや電気代の明細で違いを確かめられます。クルマの運転でアクセルの踏み方を控えめにすれば、燃費が良くなることが実感できます。
ところがAIのモデル間の性能差を、一般の利用者が自分で確かめることは、構造的にほぼ不可能です。
そもそも性能を比べるには「同じ条件で、同じ質問をして、答えを並べる」必要があります。
でも、AIとの対話は一回ごとに文脈が違い、これまでのやりとりの記憶も影響し、同じ質問でも毎回違う答えが返ってくる。厳密な比較実験が、そもそも成立しないのです。
結果として、利用者の体感は「なんとなくこっちのほうが賢い気がする」どまりになります。
料金差を正当化する根拠を、利用者自身は持てません。
「高いモデルのほうがいいに決まっている」も「安いモデルで十分」も、どちらも実感ではなく思い込みかもしれない——そういう前提で考える必要があります。
だから組織は、どこかで「線を引く」ことになる
性能差を一人ひとりが実感できない=適切に使い分けることなど事実上期待できない以上、組織でのAI利用では、誰かがどこかで割り切って「線を引く」しかありません。
全員に最上位モデルを開放すれば、コストは膨らみます。
実際、米紙ウォール・ストリート・ジャーナルは2026年6月、米国の大企業がAI利用の制限に乗り出し始めたと報じました
*「AI利用を制限し始めた米企業 コスト急増で」(全文閲覧には有料会員登録必要)
わずか3ヶ月で年間予算を使い切った企業や、AIに詳しいと見せかけるためにあえて計算量を増やす「トークンマキシング」に走る従業員の例まで紹介されています。
単純な質問や雑談に高価な最上位モデルを使う従業員について、あるCEOは「娘に代数を教えるのに、アインシュタインを雇う必要はない」と例えたそうです。
かといって全員を廉価モデルへと制限すれば(またはAI利用を禁じれば)、今度は現場の不満と、こっそり個人契約のAIを使うシャドーAIのリスクが生まれます。
ベンダー側の最近の答えは「自動振り分け」です。質問の重さをシステムが判定し、適切なモデルに自動で割り当てる。
実際、WSJの記事でも、企業の問い合わせを精査して一部のタスクを安価なモデルに振り分けるシステムの開発が紹介されています。
合理的なアプローチですが、これは裏を返せば「モデル選択の判断を利用者に求めるのは無理だ」と、業界自身が認めつつあるということでもあります。
そして自動化が進むほど、利用者からは「いま何に、どれだけのコストがかかっているか」がますます見えなくなります。
ガソリン代や電気代と違って、明細の解像度が粗いまま、使い続けるしかない構造です。
「対話型利用」と「エージェント型利用」という、もう一つの軸
そしてコストを左右するのは、どのモデルを選ぶかだけではありません。どう使うか、にも大きく影響を受けます。
チャット画面で問いかけて、答えを読んで、また問いかける——対話型の利用では、トークンの消費量は、人間が読み書きできる速度が事実上の上限になります。気をつけることがあるとすれば、せいぜい大量のPDF文書などを読み込ませるかどうかぐらい。
どれだけ熱心に使っても、消費は人間の能力のペースを超えることはありません。
エージェント型での利用は全く違います。
一つの指示をきっかけに、AIが自律的に資料を読み、検索し、試行錯誤を何十回・何百回と繰り返す。人間が席を離れている間も計算は走り続けます。
トークン消費の桁が変わるのは構造上当然のことで、自分でコーディングをされる方や、情報システム部門の方なら「エージェントを本気で働かせるとトークン消費=請求額が跳ね上がる」ことは、すでに常識かもしれません。
先のWSJの記事でも、ウーバー社が自律型AIの年間予算を3月までに使い果たしたことが報じられています。さらに同記事には、AIコーディングツールを使う2000社超のデータで、トークン費用のうち実際に製品コードとして出荷されたのはわずか18%にすぎなかったという推計も紹介されています。
エージェントに任せた仕事のかなりの部分が、やり直しと検証に消えている計算です。
以前、自動化の前に対話型利用が必要だという記事を書きました。
あのときは暗黙知の言語化とリスク管理の観点からの話でしたが、コストの観点から見ても、結論は同じところに着地します。
何を任せるかを言語化できていないままエージェントを走らせることは、行き先を決めないままタクシーを走らせる=メーターを回し続けるようなものだからです。
幸い、ふつうはその手前に来る「対話型の利用」は、従量制の世界でも最も安上がりな段階です。順序を守ることは、安全なだけでなく、コスト管理上も正しい選択なのです。
問題は、料金表のずっと手前にある
ここまで読んで、お気づきかもしれません。
「どのモデルを選ぶか」「料金の線をどこに引くか」——これらの問いに答えるためには、その手前の問いに答えられている必要があります。
自分たちは、何のためにAIを使うのか。
どの仕事はAIに重く投資する価値があり、どの仕事はそうでないのか。
この整理ができていない組織にとって、モデル選択の悩みは答えの出ない悩みです。逆にこの整理ができていれば、料金制度がどう変わろうと、判断の軸はぶれません。
そしてこの「仕事の切り分け」は、料金のためだけの作業ではありません。さきほどの「自動化の前に対話型利用が必要だ」という話も、「外から持ってきたプロンプトは定着しない」という記事も、「研修を発注する前に目的を決めるべきだ」という記事も、すべて同じ一つの幹から出ている話です。
自分たちの業務を言語化し、AIとの分担を自分たちで決める——その力が先に現場にあって、初めてツールやモデルや料金の議論が意味を持つのです。
料金制度の変化は、これまで先送りにできていたこの問いを、高額な請求書という形で組織に突きつけてくるはずです。
外圧をきっかけにするのは、悪いことではありません。問われる前に、社内で話してみてください。トークンの使用量と仕事の成果は比例しない、というのはごくごく当たり前の話のはずです。
私たちの仕事のうち、AIに任せる価値が本当に高いのは、どれでしょうか?
この記事を書いた人
高橋大洋/株式会社ミヤノモリ・ラボラトリー代表。企業・団体向けのAIリテラシー研修を提供しています。ツールやモデルの選定そのものではなく、その手前にある「自分たちの業務の言語化」と「AIとの分担の設計」を支援することが専門です。研修のご相談はこちらからどうぞ。

