"Humanity's Last Exam" bringt KI an ihre Grenzen

Moderne KI-Modelle verblüffen regelmäßig mit ihrer Leistungsfähigkeit: Sie lösen komplexe mathematische Aufgaben, analysieren wissenschaftliche Texte und schreiben sogar Gedichte – sachlich präzise und sprachlich elegant, was vor wenigen Jahren noch unmöglich schien. Doch ein neuer Test, "Humanity's Last Exam", zeigt die Grenzen dieser Technologie auf. Selbst Spitzenmodelle wie GPT-4 und Google Gemini scheitern in vielen Bereichen kläglich. Ihre Erfolgsquote liegt unter zehn Prozent.

Werbung

LANCOM Systems zum neunten Mal in Folge VPN-Champion

LANCOM Systems zum neunten Mal in Folge VPN-Champion

Der deutsche Netzwerk- und Security-Hersteller LANCOM Systems hat im „Professional User Rating: Security Solutions 2025“ (PUR-S) des Analystenhauses techconsult zum neunten Mal in Folge seine Spitzenposition im Bereich Virtual Private Network (VPN) bestätigt. [...]

digital_Marketing_Media
Die wichtigsten täglichen Meldungen zu Digital Marketing

Neu auf Amazon Prime Video im Februar 2025: Diese Filme und Serien erscheinen

Der Beitrag Neu auf Amazon Prime Video im Februar 2025: Diese Filme und Serien erscheinen von Beatrice Bode erschien zuerst auf BASIC thinking. Über unseren Newsletter bleibst du immer aktuell. Fast täglich erscheinen neue Serien und Filme auf Amazon Prime. Das gilt sowohl für Eigenproduktionen als auch für Lizenzprodukte. Wir verraten, welche

Datenschutz: DeepSeek scheint es an „ziemlich allem zu fehlen“

Der Beitrag Datenschutz: DeepSeek scheint es an „ziemlich allem zu fehlen“ von Fabian Peters erschien zuerst auf BASIC thinking. Über unseren Newsletter bleibst du immer aktuell. DeepSeek hat die KI-Branche in Aufruhr versetzt. Denn die China-KI soll mit ChatGPT mithalten können, gleichzeitig aber deutlich günstiger und energieeffizi

Endlich ChatGPT Screensharing und Custom Instructions Update in Deutschland

OpenAI bringt Video-Calls, Screensharing und individuell anpassbare Einstellungen in mehr Regionen. Auch Nutzer:innen hierzulande können jetzt nicht nur schreiben, sondern direkt zeigen, woran sie arbeiten – und ChatGPT reagiert in Echtzeit. Auch Grok AI sorgt mit neuen Updates für Gesprächsstoff.

Tap statt Hold: Instagram Reels endlich mit nur einem Tippen pausieren

Um ein Reel zu pausieren, musst du es gedrückt halten – das ist in bestimmten Situationen äußerst unpraktisch. Nun testet Instagram endlich eine Option, mit der die Kurzvideos per einmaligem Tippen pausiert werden können.

Nach DeepSeek: Jetzt bringt auch Alibaba neue Super-KI

Effizienter, kostengünstiger – und angeblich besser: Mit Qwen 2.5 fordert Alibaba die Tech-Elite heraus. Doch hat Chinas jüngstes KI-Modell wirklich das Potenzial, OpenAI, Google und Co. unter Druck zu setzen?

Kennzeichnung im Play Store: Dieses Symbol zeigt künftig die Sicherheit einiger Handy-Apps

Ob eine dubiose App aus dem Google Play Store insgeheim Daten ausspioniert, ist manchmal schwer einzuschätzen. Zumindest bei VPN-Apps führt Google nun aber eine weitere Sicherheitsstufe ein: Eine neue Kennzeichnung zeigt, dass die App offiziell geprüft wurde.

Twitter: Elon Musk von Geschäftszahlen enttäuscht– leugnet es aber

Der Beitrag Twitter: Elon Musk von Geschäftszahlen enttäuscht– leugnet es aber von Maria Gramsch erschien zuerst auf BASIC thinking. Über unseren Newsletter bleibst du immer aktuell. Elon Musk ist laut einer internen E-Mail unzufrieden mit den Geschäftszahlen von X (ehemals Twitter). Doch obwohl mehrere Quellen die Echtheit der Nachricht best

Zalando ist schon bei TikTok Shop – in England

Wird TikTok Shop das neue Zalando? Das ist eine der Fragen, die wir in den kommenden Exchanges (#368) stellen. Die Vorbereitungen für den Deutschland-Start laufen (wieder) und damit natürlich auch die PR-Aktivitäten. Heute freut sich TikTok Shop schon mal über... Weiterlesen ›

Werbung bricht nicht das Gesetz: TikTok beruhigt US Advertiser

TikTok Ads bleiben laut der Plattform in den USA legal – aber sind sie noch wirtschaftlich sinnvoll? Während das Betreiben der App weiterhin eigentlich gesetzlich verboten ist, setzt die Konkurrenz schon jetzt auf neue Werbeangebote, um Marken und Creator abzuwerben.

Instagram Updates Januar 2025: Profil-Ansicht, Reels & DMs

Der erste Monat des Jahres ist noch gar nicht um und die Social-Media-Plattform Instagram hat sich bereits einem Facelift unterzogen: Neue Features, ein neuer Look und neue Möglichkeiten für Creators stehen jetzt zur Verfügung. Weitere Funktionen und Interaktionsmöglichkeiten werden aktuell noch getestet. Damit Du bei den ganzen Neuerungen nich

Sichtbarkeitsverluste erreichen Deutschland: Google-Regeln schocken Affiliates und Co.

Heftige Traffic-Einbußen erreichen deutsche Seiten, da Google Manual Actions im Rahmen der Site Reputation Abuse-Richtlinie jetzt auch in Deutschland umsetzt. Einige Affiliates und große Websites sind betroffen und User müssen bei Gutscheinen und Co. woanders fündig werden.

Muster-Prompts: 3 Beispiele, wie du KI in deinem Unternehmen nutzen kannst

Der Beitrag Muster-Prompts: 3 Beispiele, wie du KI in deinem Unternehmen nutzen kannst von Carsten Lexa erschien zuerst auf BASIC thinking. Über unseren Newsletter bleibst du immer aktuell. Der Einsatz von Künstlicher Intelligenz kann in bestimmten Bereichen durchaus sinnvoll sein. Wir zeigen dir anhand von drei Beispielen, wie dir KI mit entspre

TikTok Commerce könnte in Q2 in Deutschland loslegen

So wie es aussieht, könnte TikTok Shop im 2. Quartal in Deutschland starten. Für den Standort München sind jetzt wieder etliche Stellen ausgeschrieben. An den Ambitionen hat sich seit dem ersten Anlauf im vergangenen Jahr nichts geändert: „With millions of... Weiterlesen ›

Vegan, Swiftie, Gen Z? Meta AI schneidet jetzt Antworten auf Instagram- und Facebook-Daten zu

Die Meta AI liefert Usern auf WhatsApp, Instagram, Facebook und im Messenger jetzt Antworten und Empfehlungen, die auf mit dem Konzern geteilten Informationen basieren. Das personalisiert die Assistenz, birgt aber auch Risiken.

DeepSeek Hype: Perplexity bietet Modell schon an

Die KI von DeepSeek sorgt in der Szene für Furore. Das leistungsfähige Modell R1 bietet die AI Answering Machine Perplexity bereits an und verweist auf lokale Datenspeicherung.

facebook twitter linkedin email