4月16日、AnthropicがClaude Opus 4.7を公開しました。
ベンチマークが向上しているのはもちろんのこと、同時にAnthropic Labsから「Claude Design」という別プロダクトもリリースされています。内容を詳しく見ていきます。(参考:GitHub Changelog)
まずはスペック比較。4.6から何が変わったのか
まずはスペックを数字で見ていきましょう。
主要ベンチマークでの4.6 → 4.7の変化を表にまとめました。
| 項目 | Opus 4.6 | Opus 4.7 | 変化 |
|---|---|---|---|
| SWE-bench Verified(コーディング) | 80.8% | 87.6% | +6.8pt |
| SWE-bench Pro(実務系コーディング) | 53.4% | 64.3% | +10.9pt |
| MCP-Atlas(エージェント実行) | 62.7% | 77.3% | +14.6pt |
| CharXiv-R(学術文書理解、ツールなし) | 68.7% | 82.1% | +13.4pt |
| CursorBench(IDE内タスク) | 58% | 70% | +12pt |
| Graphwalks(長文応用推論) | 38.7% | 58.6% | +19.9pt |
| MRCR(長文コンテキスト想起) | 78.3% | 32.2% | -46.1pt(要注意) |
| コンテキスト長 | 100万トークン | 100万トークン | 変化なし |
| 画像理解の最大解像度 | 1568px | 2576px / 3.75MP | 大幅アップ |
| API価格 | 同額 | 同額 | ※トークナイザー変更で実質1.0〜1.35倍のコスト増の可能性 |
14ベンチマーク中12で4.6を上回り、特にコーディング・エージェント系で大きく改善。
(参考:Vellum AI)
Notion社の社内テストでは「Opus 4.6比で14%精度向上、しかも消費トークンが少なく、ツールエラーは1/3」という結果。Rakuten-SWE-Benchでは本番タスクの解決数が3倍になっています。
(参考:VentureBeat)
注意点: MRCRが大きく下がった理由
表で気になるのが、MRCR(Multi-Round Context Recall)が78.3%から32.2%に急落している点。
これは「長い文脈の中から特定の情報を取り出す力」のテストです。長文の細部を覚えておく能力が4.6より大きく落ちているということになります。
Anthropic側の説明
Anthropicのエンジニア Boris Cherny氏がこの件について発言しています。
要約するとこういう内容です。
- MRCRというベンチマークは段階的に廃止する方向。「正解と関係ない情報(distractor)を意図的に積む」ことに点数が偏りすぎていて、実務的な意味合いが薄い
- 代わりにGraphwalksという新しい長文推論ベンチマークを推している
- Graphwalksでは4.6の38.7% → 4.7の58.6%と、+19.9ptの大きな改善が出ている
- MRCRはシステムカードに「科学的誠実さのために残しているだけ」
つまりAnthropic側のスタンスは、「長文タスクは別のベンチマークで見ると改善している。MRCRは古い指標」。
(参考:Latent Space)
実際のレビューの方は厳しい
ただ実際の使用感レビューは、Anthropicの説明とは温度差があります。
開発者コミュニティから出ている報告がこちら。
- 「4.7に800行のワークフロードキュメントを渡した。読んだと言うので生成させたら、内容と全く関係ないものが出てきた」
- 法務文書のレビュー、財務分析、研究文献の統合といった長文の正確な読み取りが本質のタスクでは、実用上の劣化を実感する場面が多い
- 長文Q&A、契約書分析、大規模コードリポジトリのレビューが主業務なら、Opus 4.7は明確なダウングレードになる場合がある
結論としては、用途による使い分けが必要かもしれません。
- 4.7が向く用途: コーディング、エージェント実行、視覚的な推論、ダッシュボード生成、短中尺タスク
- 4.6が向く用途: 長い契約書・法務文書の精読、長大コードベースのレビュー、研究文献の統合
API価格は同じ(実質コストは少し上がる可能性あり)なので、両方を切り替えて使うのが今のところ正解でしょう。(参考:Apiyi Blog)
もう一つの本題: 「Claude Design」というLabs製品
ここからが本題のもう一つの軸です。
Opus 4.7のリリースと同じタイミングで、Anthropic Labsから「Claude Design」という別プロダクトが公開されました。
ちなみにこれは「Opus 4.7の中にデザイン能力が学習で足された」のとは異なります。
- Opus 4.7: モデル本体。コーディング・推論・画像理解などの汎用能力が向上
- Claude Design: そのOpus 4.7を裏側のエンジンとして使った、デザイン特化の独立プロダクト
つまり「ChatGPTに対するDALL-E」みたいな関係に近い。モデルそのものとは別に、用途特化のアプリケーションが立ち上がった、という構図です。
(参考:Anthropic公式)
Claude Designで作れるもの
Claude Designに自然言語でプロンプトを投げると、こういうものが出てきます。
- Webサイト(ランディングページ、料金ページ、企業サイトなど)
- UIプロトタイプ(アプリ画面、管理画面、ダッシュボードなど)
- プレゼン資料(スライドデッキ、社内向け1pager)
- マーケティング素材(バナー、SNS用画像など)
過去と何が違うのか
Claude Designで具体的に何が変わったのか。整理するとこの4つです。
① 出力が「コード」ではなく「デザインファイル」
これが一番大きい変化です。
これまでのClaude Artifactsは「コードを出して、それを見るとデザインっぽく見える」という構図でした。HTML/Reactを書いて、その場でレンダリング。コードを別ツールに持っていきたい時は手動でコピーが必要でした。
Claude Designは違います。最初からPPTX、PDF、Canvaプロジェクト、Figmaファイル、共有URLなどの「実際の業務で使う形式」で出てきます。コードがメインじゃなくて、デザインそのものがメイン。
② 1つのプロンプトから複数のフォーマットに展開できる
同じ内容を、ボタン1つで違う形式にエクスポートできます。
- 「Q1の業績まとめ」を作ったら → スライドにもなる、PDFにもなる、共有URLにもなる、開発者にハンドオフしてWebサイトにもなる
- 過去は「スライド用に1回作る」「Webサイト用にもう1回作る」と別々に依頼が必要だった
「コンテンツは1つ、表現形式は複数」という発想で作られています。
③ デザイン語彙での編集ができる
過去のArtifactsで微調整したい時は「もっと余白を増やして」「色を青に変えて」とチャットでお願いするしかありませんでした。
Claude Designでは、Claudeが自動で「余白」「色温度」「レイアウト密度」などのスライダーを生成してくれます。スライダーを動かすとリアルタイムで反映される。これはコードを書ける人じゃなく、デザイナーや非エンジニアの操作感に寄せた変化です。
加えて、特定の要素にだけインラインコメントで「ここを大きく」と指示することもできます。全体を再生成せずに局所的に直せる。
④ 既存のデザインツール「に入る」設計
過去のClaudeは「Claudeで完結する」発想でした。Claude DesignはFigma・Canva・PowerPoint・Wordという既存のデザイン現場のツールに入り込む設計です。
- Figma: Claude Designで生成したUIをそのままFigmaで編集できるファイルに変換
- Canva: ボタン1つでCanvaエディタに展開
- PowerPoint: PPTXとして書き出し、または Word/PowerPoint内からClaudeを呼び出し
「Claudeで作って終わり」じゃなくて、「Claudeで作って、いつものツールで仕上げる」を前提にしている。これが過去のArtifactsとの一番大きな思想の違いです。
他のAI製品(v0・Bolt・Gammaなど)との違い
「Webサイト生成ならv0、スライドならGamma、フルアプリならLovable」と、これまでは用途別に別ツールが棲み分けていました。
Claude Designはこれらを1つのプロダクトに束ねた形です。
- スライド + Webサイト + UIプロトタイプ + マーケ素材を、同じプロンプト体系で作れる
- 裏側はOpus 4.7(コーディング・デザインともに最強クラスのモデル)
- Claude Codeへ直接ハンドオフして、デザイン → 実装の流れがシームレス
つまり「同じデザイン会話の中で、ジャンルを横断して成果物を出せる」のが、他のツールにはなかった部分です。
使い方の流れ(具体的な手順)
「使い方」をもう少し具体的に整理します。
① アクセス方法
- URL:
claude.ai/designに直接アクセス - 対象プラン: Pro / Max / Team / Enterpriseの有料契約者(無料プランは現時点では使えない)
- 追加料金: なし。既存サブスクリプションに含まれる
- 展開状況: 4月16日から段階rollout中。Pro契約していてもまだ表示されない場合は数日待つ
② 入力できるもの
プロンプト(文章)だけでなく、複数の入力に対応しています。
- テキストプロンプト: 「SaaSの料金ページを作って」のような自然言語
- 画像: 参考デザインや手書きラフをアップロード
- ドキュメント: DOCX、PPTX、XLSXファイルを取り込んで素材化
- コードベース: GitHubリポジトリへの参照
③ プロンプト例
実際にこういう書き方ができます。
- 「Q1の営業実績スライドを6枚で作って。冒頭にサマリ、各部門の達成率、最後に来期の目標」
- 「建設会社向けSaaSのランディングページ。ヒーロー、主要機能3つ、導入事例、料金、CTA」
- 「このDOCXを元にプレゼンテーションを作成。視覚要素を増やしてシンプルに」
④ 出来上がったあとの調整
初回生成のあとは、複数のチャンネルで微修正できます。
- チャットでの追加指示: 「もっとシンプルに」「色をブルー系に」など
- インラインコメント: 特定の要素だけにフォーカスして指示
- テキスト直接編集: 文言は手動で書き換え可能
- カスタムスライダー: Claudeが「余白」「色温度」「レイアウト密度」などのスライダーを動的に生成、リアルタイムで反映される
面白いのは、Claudeが作業の途中経過を「思考しながら実況してくれる」こと。「まず構成を計画」「次に実装」「最後に自分で批評」のステップが、チャットパネルに流れていきます。
⑤ エクスポート
完成したものは、こういう形式で出力できます。
- Canva: そのままCanvaエディタに展開
- PPTX: PowerPoint形式でダウンロード
- PDF: 配布用
- 共有URL: ブラウザでそのまま見られるリンク
- HTML: スタンドアロンのWebページ
- Claude Code連携: 開発に持ち込む場合、Claude Codeに直接ハンドオフ
FigmaへのエクスポートはAnthropicとFigmaの提携で、生成したUIをそのまま編集可能なデザインファイルに変換できます。
(参考:Apiyi Beginner Guide)
Claude Codeから使えるのか?
Claude Codeを毎日使っている開発者として一番気になるのが、これです。
結論:今のところ「Claude CodeのCLIから直接Claude Designを呼ぶ」統合はありません。別プロダクトです。ただし、組み合わせて使う方法はあります。
① Claude Design → Claude Code のハンドオフ
Claude Designで生成したデザインは、エクスポート先の選択肢に「Claude Codeに直接ハンドオフ」が含まれています。
具体的にはこういう流れになります。
- Claude Design(claude.ai/design)でUIプロトタイプを作る
- 「Claude Codeで実装」ボタンでハンドオフ
- Claude Codeのセッションが開いて、デザイン情報を受け取った状態で実装が始まる
「デザインを描く → 開発に渡す」の境目をAnthropicがプロダクト側で繋いだ形です。
② Claude Code 単体でも UI コードは生成できる
もう一つの選択肢として、Claude Code自体がOpus 4.7を使ってフロントエンドコードを生成できます。
「ダッシュボード画面を作って」と頼めば、Reactコンポーネントが返ってくる。これは前からできていたことですが、Opus 4.7になってからダッシュボード・データインターフェースの生成品質が大きく上がっていると言われています。
ただしClaude Code単体だと出力はコード中心。PPTXやFigmaファイルとして出すことはできません。「コードでいいから速く作りたい」ならClaude Code、「デザイナーや非エンジニアと共有するファイルが欲しい」ならClaude Designという棲み分けです。
③ Figma MCPサーバー経由で連携
Claude CodeはMCP(Model Context Protocol)対応なので、Figma MCPサーバーを入れるとFigmaのデザインデータを直接読み書きできます。
- Claude DesignでUIを作る → Figmaにエクスポート
- Claude Codeから Figma MCP経由でそのFigmaファイルを読み込んで、コード化
- 逆方向も可能。Claude Codeで作ったコンポーネントをFigmaに反映
つまりFigmaを「中継地点」にすれば、Claude Design ↔ Claude Codeの双方向の連携が成立します。
結論:使い分けの整理
現状の使い分けはこんな感じです。
- Claude Code単体: コードを書きたい、ターミナルで完結したい時
- Claude Design単体: デザイナー・非エンジニアと共有するファイルが必要な時、PPTX等のフォーマットで欲しい時
- Claude Design → Claude Code: デザインから実装に移る時、ハンドオフボタンで連携
- Claude Code + Figma MCP: 既存のFigmaファイル(Claude Design出力含む)をコード化したい時
「Claude CodeのCLIから直接 `claude design …` で呼べる」みたいな統合は今のところないので、それを期待していた人にとっては少し物足りないかもしれません。
個人的には、ハンドオフかMCP経由の連携で十分実用になると思っています。むしろClaude Codeで全部やろうとせず、「ビジュアルが要るならClaude Design、コードに落とすならClaude Code」と役割を切り分ける方が、結果的に速い気がしています。
Anthropicが向かっている方向
Anthropicはさらに「会話するAI」から「成果物を作るAI」へ
Webサイト、プレゼン、コード、Word文書。どれも最終的に納品物として必要なものばかりです。Claudeに投げれば出てくる、という状態を本気で狙いにきている。
Opus 4.7はすでにClaude CodeとGitHub Copilotの主力モデルとして使われていて、コードはすでに押さえている。今回のClaude Designで、デザインと資料という残りの領域を取りに来た構図です。
正面衝突する相手は誰か
Anthropicのこの動きがぶつかる相手は一気に増えました。
- Figma、Canva、Adobe、Wix: デザイン・Webサイト制作ツール
- Microsoft Copilot: Office統合AIの本家
- Google Gemini + Workspace: SlidesとDocs統合
- OpenAIのGPT-5.4: 汎用AIとしての直接競合
- Gamma、Tome: AIプレゼン生成スタートアップ
これまで棲み分けていた領域が、一気に混戦モードに入った感じです。実際、Claude Design発表でFigmaとAdobeの株価が下がっています。
(参考:VentureBeat)
AI LIFEコミュニティでは、Claude Codeをはじめとした最新AIツールの実践的な使い方について、日々情報交換を行っています。
AI LIFEコミュニティについて詳しく見る