Grundlagen

Wie werden Produkttests bewertet — Methodik und Notensystem

2026-06-13 · 782 Wörter

Wer ein Testergebnis liest und sich fragt, warum ein Produkt trotz guter Einzelwerte am Ende nur „ausreichend" bekommt — oder umgekehrt, warum ein technisch schwächeres Gerät auf „gut" kommt —, stößt schnell auf ein zentrales Thema: die Bewertungsmethodik. Testorganisationen vergeben Noten nicht willkürlich, sondern nach festgelegten Verfahren mit Gewichtungen, Mindestanforderungen und Ausschlusskriterien. Diese Mechanismen zu verstehen hilft, Testergebnisse richtig einzuordnen.

Wie Stiftung Warentest und Öko-Test ihre Noten berechnen

Die Stiftung Warentest, eine gemeinnützige Einrichtung mit Bundesbeteiligung, veröffentlicht ihre Methodik grundsätzlich transparent. Jeder Produkttest gliedert sich in mehrere Prüfbereiche — zum Beispiel „Handhabung", „Haltbarkeit", „Schadstoffe" oder „Energieverbrauch" — die jeweils mit einem prozentualen Gewicht in die Gesamtnote einfließen. Ein Bereich, der mit 40 Prozent gewichtet ist, beeinflusst das Ergebnis also stärker als einer mit 10 Prozent. Die Noten selbst folgen dem deutschen Schulnotensystem von 1,0 (sehr gut) bis 5,5 (mangelhaft). Zwischenwerte wie 2,4 oder 3,7 sind dabei üblich.

Ein zentrales Prinzip bei der Stiftung Warentest ist das sogenannte Auf-Abwertungs-Verfahren: Erhält ein Produkt in einer als besonders sicherheitsrelevant eingestuften Teilkategorie — etwa bei Schadstoffen oder elektrischer Sicherheit — die Note „mangelhaft" (ab 4,5), kann die Gesamtnote nicht besser ausfallen als „mangelhaft", unabhängig davon, wie gut alle anderen Bereiche abschneiden. Dieses Prinzip stellt sicher, dass schwerwiegende Mängel nicht durch starke Leistung in anderen Kategorien ausgeglichen werden. Die Stiftung Warentest bezeichnet solche Prüfbereiche als „K.O.-Kriterien".

Öko-Test verfolgt einen anderen Schwerpunkt: Im Mittelpunkt stehen Inhaltsstoffe, Schadstoffe und ökologische Aspekte. Das Notensystem reicht von „sehr gut" bis „ungenügend" — also sechs Stufen. Auch hier können bestimmte Befunde, etwa der Nachweis krebserzeugender Substanzen über festgelegten Grenzwerten, direkt zur schlechtesten Note führen, selbst wenn das Produkt in anderen Bereichen unauffällig ist. Öko-Test veröffentlicht seine Bewertungskriterien und Grenzwerte ebenfalls, wenngleich die konkrete Gewichtungsformel je nach Produktgruppe variiert.

Internationale Verbraucherorganisationen: ICRT und das Which?-Netzwerk

Der International Consumer Research & Testing-Verbund (ICRT) koordiniert Produkttests zwischen nationalen Verbraucherorganisationen aus über 40 Ländern — darunter Which? (Großbritannien), Consumentenbond (Niederlande), UFC-Que Choisir (Frankreich) und andere. Durch geteilte Testinfrastruktur und gemeinsam entwickelte Prüfprotokolle können Ergebnisse länderübergreifend verglichen werden, auch wenn die finale Darstellung und Gewichtung je nach nationaler Organisation leicht abweicht.

Das methodische Prinzip ist vergleichbar: Produkte werden in standardisierten Laborbedingungen geprüft, Teilbereiche werden mit Prozentwerten gewichtet, und es gibt produktgruppenspezifische Mindestanforderungen. Which? etwa nutzt ein Prozentwert-System (0–100 Punkte) statt Schulnoten, wobei ein Produkt erst ab einem festgelegten Schwellenwert als „Best Buy" empfohlen wird. Ein Produkt kann dabei in der Gesamtpunktzahl gut abschneiden, aber dennoch kein „Best Buy"-Label erhalten, wenn es in einer definierten Kerneigenschaft unterhalb der Mindestanforderung liegt. Dieses Prinzip entspricht funktional dem K.O.-Kriterium der Stiftung Warentest.

Wichtig für den Verbraucher: Die Vergleichbarkeit zwischen verschiedenen Testorganisationen ist begrenzt. Ein „gut" bei Stiftung Warentest und ein „gut" bei einer anderen Organisation können auf unterschiedlichen Gewichtungsmodellen basieren. Wer Testergebnisse aus verschiedenen Quellen nebeneinanderstellt, sollte die jeweilige Methodik kennen.

Warum Gewichtungen das Ergebnis entscheidend beeinflussen

Das Gewichtungsmodell ist der entscheidende Hebel in jedem Testverfahren. Ein Beispiel zur Veranschaulichung: Wird die Kategorie „Reinigungsleistung" bei einem Staubsauger-Test mit 50 Prozent gewichtet, während „Geräuschentwicklung" nur 10 Prozent ausmacht, dann hat ein Produkt mit schwacher Reinigungsleistung kaum eine Chance auf ein gutes Gesamtergebnis — selbst wenn es in allen anderen Bereichen überzeugt. Umgekehrt kann ein lautes, aber stark reinigendes Gerät trotzdem eine gute Note erzielen.

Die Testorganisationen begründen ihre Gewichtungen in der Regel damit, dass sie das typische Nutzungsverhalten widerspiegeln sollen. Die Stiftung Warentest legt die Gewichte für jede neue Testserie in einem internen Verfahren fest und veröffentlicht sie im jeweiligen Testbericht. Verbraucher können diese Gewichtungen nachlesen und selbst beurteilen, ob sie für ihr persönliches Nutzungsprofil sinnvoll sind. Wer beispielsweise besonders leise Geräte benötigt, sollte die Einzelnote für Geräuschentwicklung stärker gewichten als die Gesamtnote es abbildet.

Ein weiterer Aspekt ist die Fortschreibung von Prüfnormen. Technische Tests basieren häufig auf DIN-, EN- oder ISO-Normen, die regelmäßig aktualisiert werden. Ein Testergebnis aus dem Jahr 2019 ist damit nicht zwingend mit einem Test aus dem Jahr 2024 vergleichbar, selbst wenn dieselbe Produktkategorie geprüft wurde.

Transparenz als Voraussetzung für Einordnung

Testberichte sind dann am nützlichsten, wenn Verbraucher nicht nur die Gesamtnote, sondern auch die Teilnoten und deren Gewichtung berücksichtigen. Eine Gesamtnote „gut" kann eine Teilnote „ausreichend" in einem für den Einzelnen wichtigen Bereich verdecken. Wer zum Beispiel ein Waschmittel für empfindliche Haut sucht, sollte gezielt die Teilbewertung zu Inhaltsstoffen oder Hautverträglichkeit prüfen — unabhängig davon, ob die Waschleistung als Hauptkategorie sehr gut bewertet wurde.

Testberichte ersetzen keine individuelle Beratung, insbesondere wenn es um spezifische Anforderungen oder gesundheitliche Aspekte geht. Im Zweifel empfiehlt es sich, die Verbraucherzentrale oder — bei rechtlichen Fragen rund um Produktmängel und Gewährleistung, etwa nach § 437 BGB — einen Rechtsanwalt einzubinden. Die Methodikdokumente der genannten Organisationen sind in der Regel öffentlich zugänglich und bieten eine gute Grundlage für eine fundierte Einordnung von Testergebnissen.

Weiter in Grundlagen