Qwen 2.5-Max「思考（QwQ）」リリース：LLM市場の競争激化

Alex Johnson

Senior Web Scraping Engineer

27-Feb-2025

AIモデルの「継続的戦争」

2025年2月25日午前5時1分、アリババはXプラットフォームで、Qwen2.5-Maxをベースとした深層推論モデルQwQ-Max-Preview（Qwen Chatでは「Thinking (QwQ)」と命名）の発表を行いました。QwQ-MaxとQwen2.5-Maxは完全にオープンソース化されました。さらに、軽量版QwQ-32Bが近日中にローカル展開に対応してリリースされる予定で、iOS/Android向けモバイルアプリも計画中です。

Qwen 2.5-Maxのパフォーマンスは？

私たちのテストでは、このモデルは数学、プログラミング、マルチモーダル生成などのタスクにおいて、GPT-4o、DeepSeek-V3、Llama-3.1-405B、Claude 3.5 Sonnetと競争力のあるパフォーマンスを示しました。

ベンチマークパフォーマンス比較

Arena-Hard（Preference Benchmark）： Qwen2.5-Maxは89.4点を獲得し、DeepSeek V3（85.5）とClaude 3.5 Sonnet（85.2）を上回りました。
MMLU-Pro（知識と推論）： Qwen2.5-Maxは76.1点を獲得し、DeepSeek V3（75.9）をわずかに上回りましたが、Claude 3.5 Sonnet（78.0）とGPT-4o（77.0）にはわずかに及びませんでした。
GPQA-Diamond（常識QA）： Qwen2.5-Maxは60.1点を獲得し、DeepSeek V3（59.1）をわずかに上回りましたが、Claude 3.5 Sonnet（65.0）がトップでした。
LiveCodeBench（コーディング能力）： Qwen2.5-Maxは38.7点を獲得し、DeepSeek V3（37.6）とほぼ同等でしたが、Claude 3.5 Sonnet（38.9）には及びませんでした。
LiveBench（総合能力）： Qwen2.5-Maxは62.2点を獲得し、DeepSeek V3（60.5）とClaude 3.5 Sonnet（60.3）を上回りました。

全体的に、Qwen2.5-Maxは、プリファレンスベースのタスクと一般的なAI能力において優れたパフォーマンスを示し、知識とコーディング能力においても競争力を維持している包括的なAIモデルであることが証明されました。

さらに、Qwen2.5-MaxはArtifacts機能を通じて、コードスニペットの生成、ファイルの解析、画像の理解をサポートします。1回の呼び出しで1時間以上のビデオコンテンツを処理できます。

データの真実

モデルの反復とデータ更新の間の乖離：従来のツールは数日間のデータ更新サイクルを持つのに対し、Qwen2.5-Maxは20兆トークンの事前学習データで動的な知識更新を実現しています。

技術的世代ギャップのリスク：ガートナーは、2025年までにAIモデルのパフォーマンスが3ヶ月ごとに15％向上すると予測しており、遅れているデータインフラストラクチャは競争力の断裂につながります。

普及しているモデルのリアルタイムデータ比較

1. 長文処理速度の比較

モデル	処理速度（秒/千語）
Qwen 2.5-Max	0.5
GPT-4	0.6
DeepSeek-V3	0.575
Llama-3.1-405B	0.600

2. 学習データセットサイズの比較

モデル	学習データセットサイズ（兆語）
Qwen 2.5-Max	2
GPT-4	1.5
DeepSeek-V3	1.8
Llama-3.1-405B	1.7

3. 平均応答時間の比較

モデル	平均応答時間（秒）
Qwen 2.5-Max	0.3
GPT-4	0.5
DeepSeek-V3	0.4
Llama-3.1-405B	0.45

4. 更新頻度の比較

モデル	更新頻度
Qwen 2.5-Max	月1回
GPT-4	四半期に1回
DeepSeek-V3	2ヶ月に1回
Llama-3.1-405B	3ヶ月に1回

データモデルの開発に直接影響を与える側面は？

AI競争において、データインフラストラクチャの質はモデルの上限を直接決定します。リアルタイムデータ抽出ツールは、3つのコア機能を通じてAIツールの開発に影響を与えます。

データカバレッジの広さ

Qwen2.5-Maxは29言語をサポートしていますが、オープンソース版は依然として公開コーパスに依存しているため、データカバレッジは限定的です。そのため、多数のデータインターフェースとデータソースを統合した情報抽出ツールが必要であり、モデルのデータの包括性と正確性を確保する必要があります。

情報更新の速度

AIモデルのパフォーマンスは3ヶ月ごとに反復されますが、従来のクローラーは、アンチクロール機構（CAPTCHAや動的ローディングなど）によって制限され、データ更新サイクルは数日間に及びます。明らかに、情報抽出ツールのデータ取得と反復能力は、データのタイムリー性を確保するために継続的に更新される必要があります。

マルチモーダルサポート

AIモデルによるマルチモーダルデータへの需要が高まっていますが、従来のクローラーはPDF表の解析で40％のエラー率があり、ビデオ字幕の抽出に10分以上かかります。強力なAIモデルは、構造化データ抽出技術を統合し、PDF表、ビデオ字幕、画像メタデータなどを自動的に解析し、精度を確保する必要があります。

Scrapeless Deep SerpApi：LLM開発に有利なツール

Qwen 2.5-MaxがAIの継続的な開発を促すのであれば、Scrapeless Deep SerpApiはその変化を推進する重要な武器です。

Deep SerpApiは、大規模言語モデル（LLM）とAIエージェント用に設計された専用の検索エンジンです。リアルタイムで正確かつ公平な情報を提供し、AIアプリケーションが効果的にデータを取得して処理できるようにします。

✅ 20以上のGoogle Search APIシナリオインターフェースを内蔵し、主要な検索エンジンのデータに接続しています。

✅ 検索結果、ニュース、ビデオ、画像など、20種類以上のデータタイプを網羅しています。

✅ 過去24時間以内の履歴データ更新をサポートしています。

将来の製品計画では、AI開発者のニーズを十分に考慮します。動的なWeb情報をAI駆動型ソリューションに統合するプロセスを簡素化し、最終的にはワンクリックでWebデータの検索と抽出を可能にするALL-in-One APIを実現します。さらに、この分野で長期間にわたって最低価格（1Kクエリあたり0.1〜0.3ドル）を維持します。

最も重要なイベント！🔔 開発者サポートプログラムが開始されました。

ScrapelessをAIツール、アプリケーション、または作業中のプロジェクトに統合できます。Dify（Langchain、Langflow、FlowiseAIなど、多くのフレームワークをサポートしており、さらに多くのフレームワークが近日中に追加される予定です！)。プロジェクトに合った他の方法でもScrapelessを統合できます。

統合が完了したら、GitHubまたはソーシャルメディアを通じて作業を共有し、統合の証拠を提供してください。お返しに、製品のメリットを最大限に活用できるよう、1ヶ月間500Kの無料クエリを提供します。

コミュニティに参加して、管理者Emily Fannから詳細を入手してください！

Scrapelessでは、適用される法律、規制、およびWebサイトのプライバシーポリシーを厳密に遵守しながら、公開されているデータのみにアクセスします。このブログのコンテンツは、デモンストレーションのみを目的としており、違法または侵害の活動は含まれません。このブログまたはサードパーティのリンクからの情報の使用に対するすべての責任を保証せず、放棄します。スクレイピング活動に従事する前に、法律顧問に相談し、ターゲットウェブサイトの利用規約を確認するか、必要な許可を取得してください。