26. Juli 2024

AlphaProof und AlphaGeometry 2 lösen IMO-Matheprobleme

AlphaProof und AlphaGeometry 2 lösen IMO-Matheprobleme

Einleitung

Künstliche Intelligenz (KI) entwickelt sich ständig weiter und erreicht neue Meilensteine. Ein bemerkenswertes Beispiel dafür ist die jüngste Veröffentlichung von Google DeepMind. Die neuen KI-Modelle AlphaProof und AlphaGeometry 2 haben komplexe mathematische Probleme auf dem Niveau der Internationalen Mathematik-Olympiade (IMO) gelöst und dabei eine Leistung erbracht, die der eines Silbermedaillengewinners entspricht. Diese Errungenschaft zeigt das immense Potenzial von Künstlicher Allgemeiner Intelligenz (AGI) in der Wissenschaft und Technologie.

Der Hintergrund der Internationalen Mathematik-Olympiade

Die IMO ist seit 1959 der älteste und renommierteste Wettbewerb für junge Mathematiker. Jedes Jahr nehmen hochbegabte Schüler aus der ganzen Welt daran teil und versuchen, sechs äußerst schwierige Probleme in den Bereichen Algebra, Kombinatorik, Geometrie und Zahlentheorie zu lösen. Viele spätere Preisträger der Fields-Medaille haben in ihrer Jugend an der IMO teilgenommen.

In den letzten Jahren hat sich die IMO auch als bedeutende Herausforderung im Bereich des maschinellen Lernens etabliert. Sie dient als Maßstab für die fortgeschrittenen mathematischen Fähigkeiten von KI-Systemen.

Die Innovationen: AlphaProof und AlphaGeometry 2

AlphaProof: Ein formaler Ansatz zur Beweisführung

AlphaProof ist ein neues System, das auf Reinforcement Learning basiert und mathematische Aussagen in der formalen Sprache Lean beweisen kann. Es kombiniert ein vortrainiertes Sprachmodell mit dem AlphaZero-Algorithmus, der zuvor Schach, Shogi und Go meisterte. Der Vorteil formaler Sprachen liegt darin, dass Beweise formal verifiziert werden können. Allerdings war ihre Anwendung im maschinellen Lernen bisher durch die begrenzte Menge an menschlich geschriebenen Daten eingeschränkt.

AlphaProof überbrückt diese Lücke, indem es natürliche Sprachprobleme in formale Aussagen übersetzt und eine umfangreiche Bibliothek formaler Probleme erstellt. Das System generiert Lösungskandidaten und beweist oder widerlegt diese durch die Suche nach möglichen Beweisschritten in Lean. Während des Trainings für die IMO hat AlphaProof Millionen von Problemen bewiesen oder widerlegt, um seine Fähigkeiten zu verbessern.

AlphaGeometry 2: Ein wettbewerbsfähigerer Ansatz

AlphaGeometry 2 ist eine verbesserte Version des ursprünglichen AlphaGeometry-Systems. Es handelt sich um ein neuro-symbolisches Hybridsystem, das auf dem Gemini-Modell basiert und mit einer viel größeren Menge synthetischer Daten trainiert wurde. Diese Verbesserungen ermöglichen es dem Modell, anspruchsvollere Geometrieprobleme zu lösen.

AlphaGeometry 2 verwendet eine symbolische Engine, die erheblich schneller ist als ihr Vorgänger. Das System löste eines der IMO 2024 Probleme innerhalb von nur 19 Sekunden nach Erhalt der Formalisierung.

Problem 4 der IMO

Illustration von Problem 4, bei dem zu beweisen ist, dass die Summe von ∠KIL und ∠XPY gleich 180° ist. AlphaGeometry 2 schlug vor, E zu konstruieren, einen Punkt auf der Linie BI, so dass ∠AEB = 90°. Der Punkt E trägt dazu bei, den Mittelpunkt L von AB zu bestimmen, wodurch viele Paare ähnlicher Dreiecke wie ABE ~ YBI und ALE ~ IPC entstehen, die für den Beweis der Schlussfolgerung erforderlich sind.

Leistungsbewertung und Ergebnisse

In diesem Jahr wurden AlphaProof und AlphaGeometry 2 auf die IMO-Probleme angewendet. Die Lösungen wurden von prominenten Mathematikern wie Prof Sir Timothy Gowers und Dr Joseph Myers bewertet. AlphaProof löste zwei Algebra-Probleme und ein Zahlentheorie-Problem und bewies, dass die Antworten korrekt waren. AlphaGeometry 2 bewies das Geometrie-Problem, während die beiden Kombinatorik-Probleme ungelöst blieben.

Insgesamt erzielte das kombinierte KI-System 28 von 42 möglichen Punkten, was der oberen Grenze der Silbermedaillen-Kategorie entspricht. Damit erreichte das System fast die Goldmedaillen-Schwelle, die bei 29 Punkten beginnt.

Neue Horizonte in der mathematischen Forschung

Die Entwicklungen von AlphaProof und AlphaGeometry 2 eröffnen neue Möglichkeiten für die Zusammenarbeit zwischen Mathematikern und KI-Systemen. Zukünftig könnten Mathematiker mit KI-Tools Hypothesen erkunden, neue Ansätze zur Lösung langjähriger Probleme ausprobieren und zeitaufwändige Beweisschritte schneller abschließen.

DeepMind plant, weitere technische Details zu AlphaProof zu veröffentlichen und erforscht weiterhin verschiedene KI-Ansätze zur Förderung mathematischer Beweisführungen.

Fazit

Die Fortschritte von Google DeepMind bei der Entwicklung von AlphaProof und AlphaGeometry 2 markieren einen bedeutenden Schritt in der KI-Forschung. Diese Systeme haben gezeigt, dass KI in der Lage ist, hochkomplexe mathematische Probleme auf einem Niveau zu lösen, das mit menschlichen Spitzenleistungen vergleichbar ist. Dies könnte weitreichende Auswirkungen auf die wissenschaftliche Forschung und die Anwendung von KI in verschiedenen Bereichen haben.

  • Tobias Jonas

    Tobias Jonas, M.Sc. ist Mitgründer und Co-CEO der innFactory AI Consulting GmbH. Er ist ein führender Innovator im Bereich Künstliche Intelligenz und Cloud Computing. Als Co-Founder der innFactory GmbH hat er hunderte KI- und Cloud-Projekte erfolgreich geleitet und das Unternehmen als wichtigen Akteur im deutschen IT-Sektor etabliert. Neben seinen Geschäftsführerrollen engagiert sich Tobias Jonas in verschiedenen Fach- und Wirtschaftsverbänden, darunter der KI Bundesverband und der Digitalausschuss der IHK München und Oberbayern, und leitet praxisorientierte KI- und Cloudprojekte an der Technischen Hochschule Rosenheim. Als Keynote Speaker teilt er seine Expertise zu KI und vermittelt komplexe technologische Konzepte verständlich.

    Tobias Jonas

Weitere Artikel

  • 23. Juni 2025Tech
    Generative Engine Optimization (GEO): Der perfekte Content für KI-Assistenten
  • 8. Juni 2025Tech
    Wie Sie mit KI-Workflows in n8n Unternehmensprozesse digitalisieren

Werde jetzt Teil unserer KI-Community.

Der Newsletter „Quo vadis KI?“ ist die Quelle für aktuelle Trends und Entwicklungen in der Künstlichen Intelligenz.