Das Problem: Blinde Flecken im Testdesign
Jedes UX-Team kennt das: Du investierst Wochen in ein Testkonzept, rekrutierst Teilnehmer, führst Sessions durch, und merkst erst dann, dass die Aufgaben unklar formuliert waren, der Prototyp an einer kritischen Stelle hakt, oder die Hypothese gar nicht überprüfbar ist.
Das kostet nicht nur Budget. Es kostet Vertrauen ins Research-Team.
Klassisches User Testing folgt einem linearen Ablauf: Konzept erstellen, Tester rekrutieren, Test durchführen, Ergebnisse auswerten. Feedback zum Testkonzept selbst bekommst du erst, wenn der Test vorbei ist.
Typische Probleme, die erst während der Sessions auffallen:
- Aufgaben sind mehrdeutig formuliert
- Der Prototyp hat technische Sackgassen
- Die Navigation ist so verwirrend, dass Tester die eigentliche Aufgabe nie erreichen
- Die Preisseite ist schwer zu finden oder nicht verständlich
All das ließe sich vorher erkennen, wenn man die richtigen Werkzeuge hat.
KI-Agenten durchlaufen dein Testkonzept und deine Website, bevor du echte Nutzer einlädst. So erkennst du Schwachstellen in Minuten statt Wochen.
So funktioniert der Pre-Test
Der Pre-Test kombiniert drei Analyseschichten, die aufeinander aufbauen:
Phase 1: Erkundung
Eine kleine Gruppe von KI-Agenten navigiert deine echte Website, sie klicken, scrollen, suchen. Jeder Agent hat ein eigenes Verhaltensprofil: manche sind ungeduldig und geben nach wenigen Klicks auf, andere lesen jedes Detail. So entsteht ein realistisches Bild davon, wie unterschiedliche Menschen deine Seite erleben.
Phase 2: Schwarm-Feedback
Basierend auf den Erkenntnissen der Erkundungs-Agenten geben Dutzende bis Hunderte weitere Agenten ihr Feedback, zu jeder Aufgabe, jeder Frage, jeder Interaktion. Das Ergebnis: statistisch belastbare Aussagen statt Einzelmeinungen.
Phase 3: Heuristik-Check
Parallel prüft ein spezialisierter Agent deine Website gegen die 10 anerkannten Usability-Heuristiken nach Nielsen. Das Ergebnis: ein strukturierter Audit mit Score pro Heuristik und konkreten Verbesserungsvorschlägen.
Realistische Persönlichkeiten, nicht generische Bots
Was den Pre-Test von simplen automatisierten Checks unterscheidet: Jeder Agent hat ein differenziertes Verhaltensprofil, das auf etablierter UX-Forschung basiert.
- Leseverhalten. Manche lesen jeden Text, andere überfliegen nur Überschriften
- Navigationsverhalten. Suche zuerst oder Menü-Browsing?
- Fehlertoleranz. Versuchen sie es nochmal, gehen sie zurück, oder geben sie auf?
- Geduld-Budget. Wie viele Klicks, bevor die Frustration überwiegt?
Diese Verhaltensprofile werden über Zeit immer präziser: Jede echte Test-Session, die über testr läuft, reichert das Wissen über die Zielgruppe an. Die KI-Agenten lernen aus echten Nutzern und werden mit jedem Test besser.
Eine Persona, hunderte Perspektiven. Jeder Agent hat einzigartige Big-Five-Persönlichkeitsmerkmale für diverse, realistische Ergebnisse. Das ist kein A/B-Test mit zwei Varianten, das ist ein Stresstest mit der Diversität deiner echten Nutzerschaft.
Der Heuristik-Check: Strukturierte Qualitätsprüfung
Neben der Verhaltens-Simulation liefert der Pre-Test einen vollständigen Heuristik-Audit. Jede Seite wird gegen zehn bewährte Usability-Prinzipien geprüft, von "Sichtbarkeit des Systemstatus" bis "Hilfe und Dokumentation".
Der Audit zeigt dir auf einen Blick, wo deine Stärken liegen und wo Handlungsbedarf besteht. Jedes Finding kommt mit Schweregrad und konkreter Empfehlung.
Warum das für UX-Teams relevant ist
- Weniger verschwendete Sessions. Erkenne Probleme im Testkonzept, bevor echte Tester daran scheitern
- Schnellere Iteration. Ergebnisse in Minuten statt Tagen, direkt im Dashboard
- Bessere Hypothesen. Der Pre-Test zeigt, ob deine Hypothese mit dem Testdesign überhaupt überprüfbar ist
- Stakeholder-Kommunikation. Zeige vorab, welche Ergebnisse wahrscheinlich sind, bevor du Budget für echte Tests beantragst
Pre-Test ersetzt keine echten Nutzer
Das ist wichtig: Der Pre-Test ist kein Ersatz für echtes User Research. Er ist eine Qualitätssicherung für dein Testdesign. Er hilft dir, besser vorbereitet in echte Sessions zu gehen, und das Maximum aus jeder einzelnen herauszuholen.
Pre-Test → Testkonzept optimieren → Echte Nutzer testen → Ergebnisse fließen zurück in die AI → Nächster Pre-Test ist noch präziser. Ein Flywheel, das mit jeder Runde besser wird.
Bereit, dein Testkonzept vor dem Launch zu validieren?
50 Credits kostenlos bei Anmeldung. Ein Quick Pulse Pre-Test kostet 1 Credit, in 30 Sekunden hast du erste Ergebnisse.
Über den Autor
testr Research Team
Wir sind ein DACH-fokussiertes Team aus UX-Researcher:innen und Engineers mit Erfahrung in B2B-Research-Ops. Dieser Beitrag basiert auf unserer Arbeit mit Pilotkunden seit 2025 sowie öffentlich dokumentierten Quellen, alle externen Aussagen sind verlinkt.
Alle KI-Agenten laufen auf Schweizer Infrastruktur (Infomaniak). Keine US-Cloud. DSGVO by Design. Server in Deutschland und der Schweiz.