{"result":{"sources":{"https://livebench.ai":{"overall_top_10":[{"rank":1,"model":"GPT-5.5 Thinking xHigh Effort","score":"80.71","provider":"OpenAI"},{"rank":2,"model":"GPT-5.4 Thinking xHigh Effort","score":"80.28","provider":"OpenAI"},{"rank":3,"model":"Claude 4.8 Opus Thinking xHigh Effort","score":"78.79","provider":"Anthropic"},{"rank":4,"model":"Claude Fable 5 Thinking xHigh Effort","score":"78.31","provider":"Anthropic"},{"rank":5,"model":"Claude 4.7 Opus Thinking xHigh Effort","score":"76.91","provider":"Anthropic"}],"price_performance_section":[]},"https://llm-stats.com":{"overall_top_10":[{"rank":1,"model":"Claude Mythos Preview","score":"64.8","provider":"Anthropic"},{"rank":2,"model":"GPT-5.2 Pro","score":"63.1","provider":"OpenAI"},{"rank":3,"model":"Claude Opus 4.8","score":"59.6","provider":"Anthropic"},{"rank":4,"model":"GLM-5.2","score":"59.0","provider":"Zhipu AI"},{"rank":5,"model":"Claude Fable 5","score":"58.1","provider":"Anthropic"}],"price_performance_section":[{"rank":1,"model":"Qwen3.7 Max","metric":"$1.25/M tok"},{"rank":2,"model":"GLM-5.2","metric":"$1.18/M tok"},{"rank":3,"model":"Seed 2.0 Pro","metric":"$0.78/M tok"}]},"https://beta.lmarena.ai/leaderboard":{"overall_top_10":[],"price_performance_section":[]},"https://aider.chat/docs/leaderboards":{"overall_top_10":[{"rank":1,"model":"gpt-5 (high)","score":"88.0%","provider":"OpenAI"},{"rank":2,"model":"gpt-5 (medium)","score":"86.7%","provider":"OpenAI"},{"rank":3,"model":"o3-pro (high)","score":"84.9%","provider":"OpenAI"},{"rank":4,"model":"gemini-2.5-pro-preview-06-05 (32k think)","score":"83.1%","provider":"Google"},{"rank":5,"model":"gpt-5 (low)","score":"81.3%","provider":"OpenAI"}],"price_performance_section":[{"rank":1,"model":"gpt-5 (low)","metric":"$10.37 total"},{"rank":2,"model":"gpt-5 (medium)","metric":"$17.69 total"},{"rank":3,"model":"o3 (high)","metric":"$21.23 total"}]},"https://artificialanalysis.ai/leaderboards/models":{"overall_top_10":[{"rank":1,"model":"Claude Fable 5 (with fallback)","score":"60","provider":"Anthropic"},{"rank":2,"model":"Claude Opus 4.8 (max)","score":"56","provider":"Anthropic"},{"rank":3,"model":"GPT-5.5 (xhigh)","score":"55","provider":"OpenAI"},{"rank":4,"model":"Claude Opus 4.7 (max)","score":"54","provider":"Anthropic"},{"rank":5,"model":"GPT-5.5 (high)","score":"53","provider":"OpenAI"}],"price_performance_section":[{"rank":1,"model":"Qwen3.5 0.8B","metric":"$0.01/M tok"},{"rank":2,"model":"Qwen3.5 0.8B (reasoning)","metric":"$0.01/M tok"},{"rank":3,"model":"Gemma 3n E4B","metric":"$0.02/M tok"}]}},"_metadata":{"strategy":"scraped","has_errors":false,"model_name":"o4-mini","scraped_urls":["https://livebench.ai","https://artificialanalysis.ai/leaderboards/models","https://llm-stats.com","https://aider.chat/docs/leaderboards","https://beta.lmarena.ai/leaderboard"],"success_rate":1,"timeout_used":90000,"model_provider":"openai","urls_requested":5,"scraping_errors":{},"urls_successful":5,"strategy_version":"1.2.0","collected_formats":{"html":0,"text":0,"links":0,"markdown":5,"metadata":0},"page_options_used":{},"requested_formats":["markdown"],"process_started_at":"2026-06-28T06:01:03.501Z","multi_format_analysis_enabled":true},"_strategy":"scraped","best-llms":{"price-performance":{"provider":"Zhipu AI","arguments":{"de":["Bietet mit Score 59.0 auf LLM Stats exzellentes Preis-/Leistungsverhältnis","Ist das führende Open-Weights-Modell mit hohem Benchmark-Score (51) zu sehr niedrigem Preis","Kombiniert solide Reasoning-Performance und 1.0M Token-Kontextfenster bei geringen Kosten"],"en":["Delivers an excellent performance-to-cost ratio with a 59.0 score on LLM Stats for $1.18/M tok","Leads open-weights models with a high score (51) at a very low price","Combines solid reasoning performance and a large context window at minimal cost"]},"rationale":{"de":"GLM-5.2 bietet als führendes Open-Weights-Modell hohe Intelligenz zu äußerst geringem Preis.","en":"GLM-5.2 delivers top open-weights intelligence at minimal cost."},"model_name":"GLM-5.2","supporting_evidence":{"https://llm-stats.com":"Platz 4 gesamt mit Score 59.0 bei $1.18/M tok","https://artificialanalysis.ai/leaderboards/models":"Intelligence Index 51 zum Preis von $0.90/M tok"},"price_performance_score":9.2},"total-performance":{"provider":"OpenAI","arguments":{"de":["Erzielt den höchsten Global Average (80.71) auf LiveBench, was seine Vielseitigkeit demonstriert","Ist in LLM Stats und Artificial Analysis konstant unter den Top 5 geführt","Zeigt starke Leistung in Reasoning, Coding und Language über mehrere Benchmarks"],"en":["Achieves the highest global average (80.71) on LiveBench, demonstrating broad capability","Consistently ranks in the top 5 across LLM Stats and Artificial Analysis","Exhibits strong performance in reasoning, coding, and language tasks across benchmarks"]},"rationale":{"de":"GPT-5.5 Thinking xHigh Effort überzeugt durch überlegene Durchschnittswerte und Konstanz über verschiedene Benchmarks.","en":"GPT-5.5 Thinking xHigh Effort stands out for its superior averages and consistency across multiple benchmarks."},"model_name":"GPT-5.5 Thinking xHigh Effort","total_score":9.5,"supporting_evidence":{"https://livebench.ai":"Global average 80.71, top of LiveBench-2026-01-08","https://artificialanalysis.ai/leaderboards/models":"Ranked #3 Intelligence Index 55 on Artificial Analysis"}}}},"updatedAt":"2026-06-28T06:01:03.801561+00:00","error":null}