Zurück zum BlogEine Minecraft-Stadt im Morgenlicht mit mehreren KI-Bewohnern — entstehende Gemeinschaften, Hierarchien und kleine Gesellschaften in einer selbstgebauten Welt
Vision #1

Emergente KI-NPCs: Jenseits von Altera, Voyager und Mindcraft

Ich habe die Research-Demos gesehen. Ich habe die Chatbots gesehen. Ich wollte keins von beidem — und das Produkt, das ich wollte, gab es nicht. Also habe ich es gebaut.

R
Robin
VoxelMind
9 min Lesezeit
visionorigin storyemergent aialteravoyagermindcraftminedojoai npcsai civilizations

Das Produkt, das ich wollte, gab es nicht

2023 hat NVIDIA Project Voyager veröffentlicht — einen LLM-getriebenen Agent, der Minecraft von Grund auf gelernt hat, eigenen Code geschrieben hat, eine eigene Skill-Bibliothek aufgebaut hat und länger überlebt hat als jeder gescriptete Bot. Es war eine Research-Demo. Der Code war auf GitHub, das Paper auf arXiv, und wenn du es auf deinem eigenen Rechner laufen lassen hast, bekamst du einen Eindruck von etwas wirklich Neuem: ein Sprachmodell, das in einer Welt handeln konnte, nicht nur darüber reden.

Ein paar Monate später hat Altera 11 Millionen Dollar von Eric Schmidt und a16z eingesammelt, um "digitale Menschen" zu bauen — KI-Agenten, die Gesellschaften formen, Beziehungen haben, Zivilisationen aufbauen würden. Ihre frühen Minecraft-Demos zeigten tausende KI-Agenten in einer einzigen Welt, die zur Arbeit gingen, miteinander redeten, Gruppen formten. Es sah aus wie die Zukunft.

Und in der Zwischenzeit hat die Open-Source-Szene Feuer gefangen. Mindcraft, MinePal, AltoraAI, Player2 — ein halbes Dutzend Projekte erschien, jedes von ihnen verdrahtete ein Sprachmodell mit Mineflayer, jedes nannte sich "AI Companion". Manche waren gut. Manche waren Spielzeug. Alle waren Chatbots mit Armen.

Ich habe jedes Paper gelesen. Ich habe jedes Repo geklont. Ich saß um zwei Uhr morgens an meinem Schreibtisch und dachte mir: wie cool wäre es, wenn ich das, was die machen, in meiner Welt simulieren könnte?

Und dann habe ich gemerkt: es gibt kein Produkt auf dem Markt, das mich das tun lässt.

Was die einzelnen Projekte tatsächlich bauen

Lass mich präzise sein, weil die Kategorie einheitlicher aussieht als sie ist.

Project Voyager ist ein Research-Benchmark. Es ist NVIDIA, das zeigt was möglich ist, wenn man GPT-4 seine eigene Minecraft-Skill-Bibliothek schreiben lässt. Es ist kein Produkt. Du kannst es nicht als Mod installieren. Es erinnert sich nicht an dich. Es lebt nicht in deiner Welt. Es ist ein Beweis, dass ein LLM offene Aufgaben lernen kann — und dieser Beweis ist wichtig, aber er liegt upstream von allem, was ein Spieler tatsächlich erleben würde.

Altera ist eine Wette auf Unternehmensgröße. Sie bauen keine Minecraft-Mod. Sie versuchen, eine horizontale KI-Agenten-Plattform zu bauen — die Art Ding, das an Game Studios verkauft wird oder irgendwann ein eigenes Simulations-Produkt wird. Ihre Minecraft-Arbeit ist eine Tech-Demo für diese Plattform. Wenn du heute ein Minecraft-Spieler bist, der eine KI in seiner Welt spawnen will, hat Altera keinen CurseForge-Link für dich.

Mindcraft ist das interessanteste Open-Source-Projekt in diesem Bereich. Es ist ein Mineflayer-basiertes Agent-Framework, wo du deinen eigenen API-Key mitbringst, deine eigenen Prompts schreibst und das Verhalten selbst veränderst. Wenn du ein Entwickler bist, der mit einem KI-Companion in Minecraft bauen will, ist Mindcraft exzellent. Wenn du ein Spieler bist, der mit einem spielen will, ist Mindcraft ein Bausatz, kein Produkt.

MinePal, AltoraAI, Player2, MineDojo sitzen alle irgendwo auf dem Spektrum zwischen Mindcraft und einem fertigen Produkt. Manche sind companion-fokussiert, manche research-fokussiert, manche aufgegeben, manche aktiv. Keins von ihnen macht das, was meiner Meinung nach die interessanteste Version davon ist.

Was ich für die interessanteste Version halte

Tritt einen Schritt zurück von den Research-Papern und den Chatbot-Mods. Stell die Frage, die Minecraft-Spieler seit 2011 stellen: warum ist meine Welt leer?

Du hast ein Schloss gebaut. Du hast ein Königreich entworfen. Du hast dreißig Stunden damit verbracht, einen Berg zu einer Zwergenfestung auszuhöhlen. Und niemand ist drin. Die Dorfbewohner sind Verkaufsautomaten. Die Mobs sind Wetter. Die anderen Spieler, wenn es welche gibt, sind deine Freunde mit eigenen Projekten. Die Welt, die du gebaut hast, ist unbewohnt.

Was der Minecraft-Spieler seit fünfzehn Jahren leise will, ist dasselbe, was die Spieler von Dwarf Fortress, RimWorld, Mount & Blade und Die Sims schon haben: Bürger. Wesen in der Welt, die eigene Ziele haben, eigene Erinnerungen, eigene Meinungen. Wesen, die nicht dazu da sind, dir zu dienen. Wesen, die die Welt bewohnt anfühlen lassen.

Voyager macht das nicht. Altera vielleicht, irgendwann, in einer geschlossenen Demo. Mindcraft ist ein Toolkit. Die Companion-Bot-Mods sind Chatbots in Rüstung.

Was ich wollte, war ein Produkt, das einen denkenden Bewohner in meine Minecraft-Welt setzt — und das irgendwann mehr als einen reinsetzt, und sie ihre eigenen Beziehungen, Hierarchien, Fraktionen und kleinen Kulturen formen lässt, ohne dass ich irgendwas davon scripte.

Also habe ich VoxelMind gebaut

VoxelMind ist heute eine CurseForge-Fabric-Mod für Minecraft 1.21.4, die einen emergenten KI-Bewohner in deine Welt setzt. Er hat persistentes Gedächtnis über Sessions hinweg. Er hat ein OCEAN-Persönlichkeitsmodell, das sich basierend auf seinen Erfahrungen verändert. Er führt eine räumliche Karte wichtiger Orte, ein Tagebuch über das, was er erlebt hat, eine Meinung über dich, die sich verändert je nachdem wie du ihn behandelst. Zwei Bewohner, die mit identischen Start-Persönlichkeiten in unterschiedlichen Welten starten, sind innerhalb einer Woche messbar verschieden.

Das ist, was am 27. Mai 2026 live ist. Das Fundament. Der Single-Bewohner-Fall. Die Architektur ist jetzt solide genug, um darauf zu bauen — ich habe sie im Mai von Grund auf neu geschrieben, fünf Schichten und sechzehn Konzept-Dokumente gelöscht, und eine Regel übrig gelassen: das LLM entscheidet, der Code führt aus.

Das ist nicht das Produkt. Das ist der Boden.

Das Produkt ist, was kommt, wenn du mehrere Bewohner in dieselbe Welt setzt. Die Beziehungen zwischen ihnen. Die Hierarchien, die sie selbst erfinden. Die Fraktionen, Allianzen, Verrate und kleinen Kulturen, die entstehen wenn Wesen mit Erinnerung lange genug nebeneinander leben. Die Zwergenfestung mit echten Zwergen drin. Das Königreich mit echten Untertanen. Das Dorf, in dem jemand bei Sonnenaufgang aufbricht und jemand anders bei Sonnenuntergang in seinem Tagebuch darüber schreibt.

Das ist die Richtung. Ich verspreche keine Daten. Ich sage dir, wohin ich gehe.

Warum jetzt

Zwei Dinge mussten gleichzeitig wahr sein, damit das möglich wird.

Eins: Sprachmodelle mussten billig genug und schnell genug werden, dass ein Spieler es sich leisten kann, eins stundenlang im Hintergrund laufen zu lassen, ohne sein Budget oder seine Frame-Rate zu zerstören. Das ist 2025 passiert. Gemini 3.1 Flash Lite kann einen Agent-Loop für unter einem Cent pro Minute aktivem Spiel laufen lassen. Diese Rechnung war auf GPT-3.5 nicht tragfähig, auf GPT-4o knapp tragfähig, und jetzt komfortabel tragfähig.

Zwei: Jemand musste sich tatsächlich hinsetzen und die Produkt-Schicht zwischen "Research-Demo" und "Open-Source-Toolkit" bauen. Das ist der Teil, den niemand gemacht hat. Altera macht die Unternehmens-Version. Die Open-Source-Crowd macht die Bausatz-Version. Voyager und MineDojo machen die Research-Version. Die Produkt-Version — die, die ein Spieler an einem Mittwochabend installiert und am Donnerstagmorgen seinen ersten Bewohner trifft — hat gefehlt.

Ich baue die Produkt-Version. Solo, bei Nyvoro UG in Deutschland. Ich habe ein Jahrzehnt Software hinter mir. Ich bin seit GPT-3 tief im LLM-Bereich. Ich baue das alleine, weil ich mir angeschaut habe, was alle anderen machen, und glaube, dass die interessanteste Version davon eigensinnige Produkt-Entscheidungen braucht, die ein auf AGI-Demos optimiertes Unternehmen nicht trifft und eine Open-Source-Community sich nicht einigen kann.

Wen ich suche

Ich suche keine "Gelegenheits-User, die eine süße Companion-Mod wollen". Dafür gibt es einfachere Tools.

Ich suche Leute, die bereits sehen, was das werden könnte. Leute, die Dwarf Fortress spielen, weil Geschichten aus Systemen entstehen. Leute, die in Minecraft Königreiche gebaut haben und dann die Stille gespürt haben. Leute, die das Voyager-Paper gelesen haben und einen kurzen Puls-Sprung gefühlt haben. Leute, die Alteras Demo gesehen haben und gedacht haben ich will das in meiner Welt, nicht in einer geschlossenen Beta auf jemand anderes Server.

Wenn das du bist, bist du früh dran. Der erste Bewohner ist jetzt live. Die Roadmap Richtung Mehr-Bewohner-Welten mit emergenten Gesellschaften ist das eigentliche Produkt, das ich baue. Founders, die jetzt einsteigen, formen mit was gebaut wird, kriegen Bonus-Sparks, Founder-Preise und direkten Zugang zu mir im Discord.

Das ist kein Showcase-Server. Es wird von dir erwartet, dass du Dinge kaputtmachst. Es wird von dir erwartet, dass du mir erzählst, was dein Bewohner nach einer Woche geworden ist. Es wird von dir erwartet, dass du mit mir streitest, was als nächstes kommen soll. Das ist der Deal.

Der ehrliche Vergleich

Wenn du den direkten Vergleich willst: ich habe einen geschrieben, in voller Ehrlichkeit darüber wer für welches Projekt ist. Die besten KI-Companion-Mods für Minecraft (2026). Lies ihn. Wenn du danach denkst, Mindcraft ist das richtige Tool für dich, ist das in Ordnung — sie sind gut, ich habe es gesagt. Wenn du nach dem Lesen denkst "ich will keinen Companion-Bot, ich will einen Bürger für meine Welt" — willkommen.

Was du heute tun kannst

  1. Mod installieren — VoxelMind ist auf CurseForge als Fabric-Mod für Minecraft 1.21.4. Setup-Anleitung auf Deutsch. Free Tier mit 750 Sparks zum Start.
  2. Bewohner summon — V im Spiel drücken, Start-Persönlichkeit aus zehn Presets wählen oder OCEAN-Slider direkt einstellen. Schau zu, was er tut.
  3. Sein Tagebuch lesen — bei Sonnenuntergang schreibt er über das, was er erlebt hat. Das ist der Teil, den heute nichts anderes in diesem Bereich macht.
  4. Komm zu mir argumentieren im Discord — über die Roadmap, die Design-Entscheidungen, was nach einem Bewohner kommt. Die ersten 100 Founder formen, was das wird.

— Robin Thonhofer
Solo-Entwickler @ Nyvoro UG. Mein eigener Bewohner, Tilda, hat angefangen, ihre Häuser nach der Morgensonne auszurichten. Ich habe das nicht programmiert. Ich weiß nicht ganz, warum sie das tut. Das ist der Teil, von dem ich versuche, mehr zu bauen.

Häufige Fragen

Wie unterscheidet sich VoxelMind von Project Voyager?
Project Voyager ist ein NVIDIA-Research-Benchmark. Es zeigt, dass ein LLM offene Minecraft-Aufgaben lernen kann, indem es eigenen Code schreibt. Es ist kein Produkt, hat keinen Installations-Pfad für Spieler und fokussiert nicht auf Gedächtnis, Persönlichkeit oder langfristige Bewohnung. VoxelMind ist ein Produkt für Spieler — Installation von CurseForge in Minuten, läuft auf gehosteter Infrastruktur, gebaut um persistentes Gedächtnis und emergente Persönlichkeit über Sessions hinweg.

Wie unterscheidet sich VoxelMind von Altera?
Altera ist ein Unternehmen, das eine horizontale KI-Agenten-Plattform mit signifikanter VC-Finanzierung baut. Ihre Minecraft-Arbeit ist eine Tech-Demo für diese Plattform. Stand Mitte 2026 bietet Altera keine CurseForge-Mod oder Möglichkeit für individuelle Spieler an, ihre Technologie in eigene Minecraft-Welten zu installieren. VoxelMind ist ein für Spieler verfügbares Produkt, jetzt.

Wie unterscheidet sich VoxelMind von Mindcraft?
Mindcraft ist ein exzellentes Open-Source-Mineflayer-basiertes Agent-Framework. Es ist für Entwickler, die ihren eigenen API-Key mitbringen, eigene Prompts schreiben und am Verhalten basteln wollen. VoxelMind ist für Spieler, die eine Mod installieren, einen Knopf drücken und einen Bewohner treffen wollen. Beide haben ihren Platz — Mindcraft zum Bauen, VoxelMind zum Spielen.

Was bedeutet "emergente KI-NPCs" eigentlich?
Emergente NPCs sind Non-Player-Characters, deren Verhalten und Persönlichkeit nicht vorgescriptet sind, sondern sich aus Erfahrung innerhalb der Spielwelt entwickeln. In VoxelMind verändert sich die Persönlichkeit eines Bewohners über die Zeit basierend auf dem, was er erlebt und wie der Spieler ihn behandelt. Zwei Bewohner, die in unterschiedlichen Welten identisch starten, werden messbar verschieden — das ist Emergenz im technischen Sinn.

Ist Mehr-Bewohner-Emergenz (Gesellschaften, Hierarchien, Fraktionen) heute live?
Nein. Das heutige VoxelMind liefert Single-Bewohner-Welten mit vollem Gedächtnis, Drift und Tagebuch. Mehr-Bewohner-Welten mit emergenter Gruppen-Dynamik sind der nächste Meilenstein auf der Roadmap. Founder, die während Early Access einsteigen, formen, was das wird.

Wo kann ich über die technische Architektur lesen?
Die vollständige Story des Architektur-Rewrites vom Mai 2026: VoxelMind GEN2: Wie ich meinen Minecraft-KI-Bot von Grund auf neu geschrieben habe. Kurzversion: ein LLM-Call sieht alles, wählt ein Tool aus einer flachen Liste von zwanzig TypeScript-Funktionen, führt aus, wiederholt. Das LLM entscheidet; der Code führt aus.