BVerwG Beschluss v. - 1 WB 27/09

Auswahlentscheidung; Leistungsvergleich anhand dienstlicher Beurteilungen

Leitsatz

Soweit im Rahmen der Auswahlentscheidung für die Besetzung eines militärischen Dienstpostens ein Leistungsvergleich anhand dienstlicher Beurteilungen vorgenommen wird, ist zur Ermittlung des Leistungsstands konkurrierender Bewerber in erster Linie auf die zum Zeitpunkt der Auswahlentscheidung jeweils aktuellsten Beurteilungen abzustellen. Frühere - vorletzte und vorvorletzte - dienstliche Beurteilungen sind nicht im Hinblick auf die (überholte) Feststellung eines in der Vergangenheit gegebenen Leistungsstands von Bedeutung; sie können herangezogen werden, um - mit Blick auf den aktuellen Leistungsvergleich - die Kontinuität des Leistungsbilds der Bewerber einzuschätzen oder Rückschlüsse auf den aktuellen Leistungsstand und dessen künftige Entwicklung zu ziehen (Klarstellung der Senatsrechtsprechung).

Gesetze: Art 33 Abs 2 GG, § 3 Abs 1 SG

Tatbestand

Die Antragstellerin ist Berufssoldatin und als Ärztin im Dienstgrad eines Oberfeldarztes (Besoldungsgruppe A 15) im Sanitätsdienst der Bundeswehr verwendet. Zusammen mit zwei anderen Soldatinnen (Dipl.-Med. A. und Dr. B.), ebenfalls Oberfeldärzte, wurde sie für die Besetzung eines nach Besoldungsgruppe A 16 bewerteten Dienstpostens bei einer Einrichtung des Sanitätsdienstes betrachtet. Aufgrund eines Leistungsvergleichs in Form einer "Gesamtbetrachtung der letzten drei planmäßigen Beurteilungen" der Bewerberinnen entschied der zuständige Abteilungsleiter im Bundesministerium der Verteidigung, den Dienstposten mit Dr. B. zu besetzen.

Mit dem gegen diese Auswahlentscheidung gerichteten Antrag auf gerichtliche Entscheidung machte die Antragstellerin geltend, dass sie zwar in früheren dienstlichen Beurteilungen schlechter, in ihrer aktuellen Beurteilung jedoch eindeutig besser bewertet worden sei als Dr. B. Das Bundesverwaltungsgericht hat die Auswahlentscheidung aufgehoben und den Bundesminister der Verteidigung verpflichtet, über die Besetzung des Dienstpostens unter Beachtung der Rechtsauffassung des Gerichts neu zu entscheiden.

Gründe

...

2. Die auf eine "Gesamtbetrachtung der letzten drei planmäßigen Beurteilungen" gestützte Auswahlentscheidung zugunsten von Dr. B. ist rechtswidrig, weil der Vergleich zwischen den Bewerberinnen - in der durchgeführten Form - gegen den aus Art. 33 Abs. 2 GG und § 3 Abs. 1 SG folgenden Leistungsgrundsatz bzw. Grundsatz der Bestenauslese verstößt.

25Wenn, wie im vorliegenden Fall, mehrere Bewerber allen Anforderungskriterien gerecht werden, haben - in der Regel durch dienstliche Beurteilungen ausgewiesene - Abstufungen der Qualifikation Bedeutung ( BVerwG 1 WB 31.06 - BVerwGE 128, 329 <338> = Buchholz 449 § 3 SG Nr. 41; für das Beamtenrecht BVerwG 2 A 3.00 - BVerwGE 115, 58 <61> = Buchholz 232 § 8 BBG Nr. 54). Zur Ermittlung des Leistungsstandes konkurrierender Bewerber ist dabei in erster Linie auf die zum Zeitpunkt der Auswahlentscheidung aktuellsten Beurteilungen abzustellen, weshalb der letzten dienstlichen Beurteilung regelmäßig eine ausschlaggebende Bedeutung zukommt; zur abgerundeten Bewertung des Leistungs-, Eignungs- und Befähigungsbildes und seiner Kontinuität ist es darüber hinaus zulässig, in die Auswahlentscheidung auch frühere Beurteilungen bis zu den beiden letzten planmäßigen Beurteilungen vor der aktuellen Beurteilung mit einzubeziehen (vgl. Beschlüsse vom - BVerwG 1 WB 6.07 - Buchholz 449.2 § 2 SLV 2002 Nr. 9 m.w.N. und vom - BVerwG 1 WB 39.07 - BVerwGE 133, 1 <7> = Buchholz 449 § 3 SG Nr. 49).

26Nach diesen Maßstäben ist der im vorliegenden Fall vorgenommene Leistungsvergleich rechtswidrig. Der Leistungsstand nach den jeweils letzten Beurteilungen rechtfertigt nicht die Auswahl von Dr. B. Auch die Art und Weise, in der frühere Beurteilungen in den Vergleich einbezogen wurden, ist fehlerhaft und nicht geeignet, einen Leistungsvorsprung von Dr. B. gegenüber der Antragstellerin zu begründen.

27a) In der zum Zeitpunkt der Auswahlentscheidung aktuellen planmäßigen Beurteilung, die für alle drei Bewerberinnen zum Termin erstellt wurden, wurde die Aufgabenerfüllung auf dem Dienstposten (auf einer neunstufigen Skala mit dem höchsten Wert 9) bei der Antragstellerin mit einem Durchschnittswert von 5,3, bei der Mitbewerberin Dipl.-Med. A. mit 5,7 und bei der ausgewählten Bewerberin Dr. B. mit 4,6 bewertet. Die ausgewählte Bewerberin erzielte damit in der aktuellen Beurteilung, der regelmäßig eine ausschlaggebende Bedeutung zukommt, einen eindeutig geringeren Durchschnittswert als die Mitbewerberinnen und weist keinen Leistungsvorsprung, sondern einen nicht bloß unwesentlichen Rückstand gegenüber der Antragstellerin (und erst recht gegenüber der Mitbewerberin Dipl.-Med. A.) auf. Das Leistungsbild der aktuellen Beurteilungen rechtfertigt deshalb nicht die Auswahl von Dr. B.

28Deren Rückstand lässt sich auch nicht mit der vom Bundesminister der Verteidigung angeführten Erwägung relativieren, Dr. B. sei 2007 vom Erstbeurteiler besonders streng beurteilt worden. Zum einen ist die dienstliche Beurteilung von Dr. B. - wie auch die der Mitbewerberinnen - unanfechtbar geworden und deshalb mit dem Inhalt, mit dem sie in Bestandskraft erwachsen ist, der Auswahlentscheidung zugrundezulegen (vgl. hierzu ausführlich BVerwG 1 WB 36.09 - <zur Veröffentlichung in BVerwGE und Buchholz vorgesehen>). Unabhängig davon ist dem Aspekt der "besonders strengen" Beurteilung bereits innerhalb der Beurteilung 2007 dadurch Rechnung getragen worden, dass der nächsthöhere Vorgesetzte für Dr. B. im Abschnitt "Verwendung" die Bewertung im Punkt "Führungsverwendungen" auf "gut geeignet" und die Bewertung im Punkt "Fachverwendungen" auf "besonders gut geeignet" angehoben hat; im Übrigen hat der nächsthöhere Vorgesetzte der Beurteilung von Dr. B. im Abschnitt "Aufgabenerfüllung" ausdrücklich zugestimmt sowie die im Abschnitt "Persönlichkeitsprofil" getroffene Darstellung in allen Punkten uneingeschränkt mitgetragen und als maßgeblich bei einer Betrachtung für weitere Verwendungsentscheidungen bezeichnet. Nicht zuletzt ist darauf hinzuweisen, dass Dr. B. und die Antragstellerin zum Termin von denselben Vorgesetzten beurteilt wurden; beurteilender, nächsthöherer und weiterer höherer Vorgesetzter sind jeweils identisch. Unabhängig von absoluten Zahlenwerten ist deshalb festzustellen, dass alle beteiligten Vorgesetzten in der Relation zwischen den beiden Bewerberinnen den Vorrang bei der Antragstellerin und nicht bei Dr. B. gesehen haben.

29b) Die Auswahlentscheidung zugunsten von Dr. B. ist auch nicht durch die Berücksichtigung früherer Beurteilungen gerechtfertigt.

30aa) Nach dem oben Gesagten können zur abgerundeten Bewertung des Leistungs-, Eignungs- und Befähigungsbildes und seiner Kontinuität auch die jeweils vorletzten und vorvorletzten planmäßigen Beurteilungen der betrachteten Bewerberinnen einbezogen werden. Dabei darf allerdings nicht aus dem Blick geraten, dass für die Auswahlentscheidung der aktuelle und nicht ein in der Vergangenheit liegender Leistungsstand maßgeblich ist. Die vorletzten und vorvorletzten Beurteilungen sind deshalb nicht isoliert, sondern in Bezug auf das durch die letzte Beurteilung dokumentierte aktuelle Leistungsbild zu sehen. Dementsprechend hat der Senat hinsichtlich der früheren Beurteilungen stets betont, dass es sich hierbei um Erkenntnisse handelt, die bei einem Bewerbervergleich bedeutsame Rückschlüsse und Prognosen über die künftige Bewährung ermöglichen; das kommt namentlich dann in Betracht, wenn frühere Beurteilungen positive oder negative Aussagen über Charaktereigenschaften, Kenntnisse, Fähigkeiten, Verwendungen und Leistungen sowie deren voraussichtliche weitere Entwicklung enthalten (vgl. insb. Beschluss vom a.a.O. Rn. 23 m.w.N.).

31Mit dieser Funktion und Legitimation des Einbezugs früherer Beurteilungen, nämlich aus diesen ggf. ergänzende Rückschlüsse für den aktuellen Leistungsstand der Bewerber und dessen künftige Entwicklung zu ziehen, steht das vom Bundesminister der Verteidigung angewandte "Rechenmodell" nicht in Einklang. Der Bundesminister der Verteidigung hat für die letzte, vorletzte und vorvorletzte Bewertung jeweils die "Leistungsdifferenz" zwischen der Antragstellerin und Dr. B. (Differenz der jeweiligen Durchschnittswerte) ermittelt und diese miteinander verrechnet, wobei sich trotz besserer aktueller Beurteilung der Antragstellerin wegen der besseren früheren Beurteilungen von Dr. B. in der rechnerischen Gesamtbilanz ein Leistungsvorsprung von Dr. B. ergab (zu Problemen der Vergleichbarkeit der Beurteilungen noch nachfolgend bb und cc). Ungeachtet der Tatsache, dass der Bundesminister der Verteidigung dabei eine degressive Gewichtung vorgenommen hat (Multiplikation des Durchschnittswerts in der letzten Beurteilung mit dem Faktor 3, in der vorletzten Beurteilung mit dem Faktor 2 und in der vorvorletzten Beurteilung mit dem Faktor 1), wird auf diese Weise mit einer rein rechnerischen Operation das aktuelle Leistungsverhältnis zwischen den Bewerberinnen überspielt und in sein Gegenteil verkehrt. Dabei wird in keiner Weise begründet oder erkennbar, warum der in der Vergangenheit bestehende Leistungsvorsprung von Dr. B. den - maßgeblichen - aktuellen Leistungsvorsprung der Antragstellerin in Frage stellen sollte bzw. worin die aus den früheren Beurteilungen entnommenen Erkenntnisse bestehen, die - entgegen dem Leistungsbild der aktuellen Beurteilung - erwarten lassen, dass sich Dr. B. auf dem strittigen Dienstposten besser bewähren und entwickeln wird als die Antragstellerin. Die früheren Beurteilungen werden also nicht etwa hinsichtlich ihrer Aussagekraft für den aktuellen Leistungsstand oder für das Potenzial und die Entwicklungsprognose ausgewertet; vielmehr wird dem relativ größeren Leistungsvorsprung der ausgewählten Kandidatin in der Vergangenheit die entscheidende Bedeutung im aktuellen Leistungsvergleich zugemessen. Dies widerspricht dem Grundsatz, dass der letzten dienstlichen Beurteilung regelmäßig eine ausschlaggebende Bedeutung für die Auswahlentscheidung zukommt.

32bb) Der Leistungsvergleich ist ferner auch deshalb fehlerhaft, weil zum Teil Beurteilungen aus unterschiedlichen Beurteilungszeiträumen zueinander in Beziehung gesetzt wurden.

33Die Funktion einer planmäßigen Beurteilung in einer Auswahlentscheidung als Instrument der "Klärung einer Wettbewerbssituation" erfordert die Gewährleistung einer Vergleichbarkeit der Beurteilungen. Deshalb muss schon im Beurteilungsverfahren soweit wie möglich gleichmäßig verfahren werden; die Beurteilungsmaßstäbe müssen gleich sein und gleich angewendet werden. Insbesondere der gemeinsame Beurteilungsstichtag und der jeweils gleiche Beurteilungszeitraum garantieren eine höchstmögliche Vergleichbarkeit (vgl. Beschluss vom a.a.O. Rn. 24 m.w.N., BVerwG 2 C 16.02 - Buchholz 237.6 § 8 NdsLBG Nr. 10). Für das Auswahlverfahren folgt hieraus, dass zur Wahrung der Chancengleichheit der Bewerber ein inhaltlicher Vergleich von planmäßigen Beurteilungen nur zulässig ist, wenn er sich im Wesentlichen auf die gleichen Beurteilungszeiträume und die gleichen Beurteilungsstichtage erstreckt.

34Ausweislich der tabellarischen Übersicht über die drei Bewerberinnen wurden für die ausgewählte Bewerberin Dr. B. planmäßige Beurteilungen aus den Jahren 2007, 2005, 2003 und 2001 berücksichtigt, für die Antragstellerin und die Mitbewerberin Dipl.-Med. A. dagegen nur Beurteilungen aus den Jahren 2007, 2003 und 2001, nicht aber aus 2005. Anders als Dr. B. waren die Antragstellerin und Dipl.-Med. A. gemäß Nr. 203 Buchst. a ZDv 20/6 in der damals gültigen Fassung nur alle vier Jahre zu beurteilen und haben deshalb im Jahre 2005 keine planmäßige Beurteilung erhalten. Der Bundesminister der Verteidigung hat in dem Leistungsvergleich als vorletzte Beurteilung für Dr. B. diejenige aus dem Jahre 2005, für die Antragstellerin dagegen diejenige aus dem Jahre 2003 eingestellt; entsprechend wurde als vorvorletzte Beurteilung für Dr. B. diejenige aus dem Jahre 2003, für die Antragstellerin dagegen diejenige aus dem Jahre 2001 herangezogen. Ein solcher "Quervergleich" über unterschiedliche Beurteilungszeiträume ist nicht zulässig. Er verstößt gegen den Grundsatz, dass ein Vergleich eine gemeinsame - hier zeitliche - Vergleichsgrundlage voraussetzt, und führt zu einer Verzerrung des Leistungsbildes der Bewerberinnen.

35cc) Nicht statthaft ist schließlich die von dem Bundesminister der Verteidigung vorgenommene "Transformation", indem die Bewertungen aus den vorletzten und vorvorletzten Beurteilungen bzw. die entsprechenden "Leistungsdifferenzen" zwischen den Bewerberinnen mit dem Faktor 9/7 multipliziert wurden. Zwar erfolgte vor den zum Termin erstellten Beurteilungen die Umstellung des Bewertungsmaßstabs von einer zuvor sieben- auf eine dann neunstufige Skala (Nr. 609 Buchst. b mit Anlage 4 der ZDv 20/6 i.d.F. vom ). Eine "Umrechnung" der Durchschnittswerte bzw. "Leistungsdifferenzen" setzt jedoch voraus, dass außer der Streckung des Bewertungsmaßstabs von sieben auf neun Stufen das Beurteilungssystem im Übrigen unverändert geblieben ist. Die Beurteilungsbestimmungen vom haben indes insbesondere durch die Einführung von Richtwertvorgaben sowie durch Regelungen zur Vergleichsgruppenbildung und zu Abstimmungsgesprächen zu einer gegenüber der vorherigen Konzeption grundlegenden Umgestaltung des Beurteilungssystems geführt (vgl. im Einzelnen BVerwG 1 WB 48.07 - BVerwGE 134, 59 = Buchholz 449.2 § 2 SLV 2002 Nr. 14). Die vorletzten und vorvorletzten Beurteilungen einerseits und die aktuellen Beurteilungen zum Termin andererseits wurden deshalb unter völlig unterschiedlichen Bedingungen erstellt, so dass eine einfache, allein an der Skalenerweiterung (von sieben auf neun Stufen) orientierte "Umrechnung" der Leistungsbewertungen nicht in Betracht kommt.

Fundstelle(n):
YAAAH-96110