Während die meisten von uns noch damit beschäftigt sind, ihren Staubsaugerroboter davon abzuhalten, den Vorhang zu verschlingen, hat Google DeepMind bereits den nächsten Sprung in die Zukunft der Robotik gemacht. Und nein, es geht nicht um einen Roboter, der endlich den perfekten Espresso zubereitet – obwohl das auch schön wäre.
Google hat zwei neue KI-Modelle aus dem Hut gezaubert: Gemini Robotics und Gemini Robotics-ER. Diese sollen Robotern nicht nur ein besseres Verständnis der Welt um sie herum verleihen, sondern auch ihre räumlichen und manipulativen Fähigkeiten auf ein ganz neues Level heben. Stellen Sie sich vor, Ihr Roboter könnte nicht nur den Tisch abräumen, sondern auch das Geschirr so stapeln, dass es wie ein Kunstwerk aussieht – das ist so ungefähr das Ziel.
Mit Gemini Robotics können Roboter nun auf Anweisungen in natürlicher Sprache hören und darauf reagieren, als ob sie ein besonders aufmerksamer, aber nicht übermäßig gesprächiger Butler wären. Und mit Gemini Robotics-ER können sie Objekte nicht nur sehen, sondern auch verstehen, wo sie sich im Raum befinden, und wie man sie am besten greift, ohne die Sicherheit zu kompromittieren. Das ist, als würde man einem Teenager beibringen, das Geschirr zu spülen, ohne das gute Porzellan zu zerbrechen.
Die Möglichkeiten sind schier endlos: Ob in der Industrie, im Haushalt oder – für die besonders Ambitionierten – auf fernen Planeten, diese KI-Modelle könnten die Art und Weise revolutionieren, wie wir mit Maschinen interagieren. Und wer weiß, vielleicht kommt der Tag, an dem wir unseren Roboter um eine zweite Meinung bei einem kniffligen Sudoku bitten. Bis dahin bleibt uns nur, uns auf die humorvolle Vorstellung zu freuen, dass unsere Roboter eines Tages nicht nur klüger, sondern auch ein bisschen charmanter sind – vielleicht sogar mit einem Hauch ironischen Humors.