BGH Urteil v. - X ZR 73/21

Instanzenzug: Az: 4 Ni 4/21 (EP) Urteil

Tatbestand

1Die Beklagte ist Inhaberin des mit Wirkung für die Bundesrepublik Deutschland erteilten europäischen Patents 2 447 942 (Streitpatents), das am unter Inanspruchnahme einer japanischen Priorität vom angemeldet worden ist und eine Spracherkennungsvorrichtung betrifft.

2Patentanspruch 1, auf den ein weiterer Anspruch zurückbezogen ist, lautet in der Verfahrenssprache:

A speech recognition apparatus, comprising

recognition unit (114) for carrying out a speech recognition process of recognizing the spoken words of a user,

instruction means (109) for receiving speech recognition start instructions from the user, and instructing the recognition means (114) to start the speech recognition process,

display means (110) for displaying at least one of recognizable speech words of the recognition unit (114),

wherein a set-up period of time is necessary from the time when the recognition means (114) receives instructions of start of the speech recognition process from the instruction means (109) to the time when the recognition means (114) is ready to carry out the speech recognition process,

wherein the speech recognition apparatus further comprises control means (112),

the control means (112), during the set-up period of time, controls the display means (110) for displaying a prohibition character (3) indicative of prohibition of speech and the at least one of recognizable speech words and, after a lapse of the set-up period of time, controls the display means (110) for displaying a permission character indicative of permission of speech to be displayed, in a position where the prohibition character was displayed.

3Die Klägerin hat das Streitpatent wegen fehlender Patentfähigkeit angegriffen. Die Beklagte hat das Streitpatent wie erteilt und hilfsweise im Umfang von Patentanspruch 2 verteidigt.

4Das Patentgericht hat die Klage abgewiesen. Dagegen richtet sich die Berufung der Klägerin, mit der sie weiterhin die vollständige Nichtigerklärung des Streitpatents begehrt. Die Beklagte tritt dem Rechtsmittel entgegen.

Gründe

5Die Berufung ist zulässig, bleibt jedoch in der Sache ohne Erfolg.

6I. Das Streitpatent betrifft eine Spracherkennungsvorrichtung.

71. Nach der Beschreibung des Streitpatents kann eine Spracherkennungsvorrichtung, wie sie etwa in Navigationssystemen verwendet wird, einen Sprachtext analysieren, erkennen und auf dieser Grundlage eine Vielzahl von Prozessen durchführen (Abs. 2). Einige dieser Vorrichtungen wiesen ein Display auf, auf dem eine Liste möglicher Spracheingaben angezeigt werde (Abs. 4). Solche Spracherkennungsvorrichtungen reagierten teilweise nicht zu jeder Zeit auf eine Spracheingabe, sondern müssten zunächst aktiviert werden (Abs. 5).

8Zum Teil verstreiche zwischen der Aktivierung der Spracherkennungsvorrichtung, die etwa durch Drücken eines Schalters erfolge, und der Bereitschaft der Vorrichtung, eine Spracheingabe zu erkennen, eine gewisse Zeit. Herkömmlich sei der Nutzer darauf hingewiesen worden, dass die Spracheingabe erst ab einem bestimmten Zeitpunkt erfolgen könne. Diese Information werde dem Nutzer im Stand der Technik etwa durch eine Ansage vermittelt (Abs. 7). Aus der japanischen Offenlegungsschrift Hei-2003-177789 (NK9) sei ferner bekannt, ein sich bewegendes Bild anzuzeigen, das den Nutzer "intuitiv" darüber informiere, wann eine Spracheingabe möglich sei (Abs. 8).

9Nachteilig hieran sei, dass insbesondere Nutzer, die mit der Vorrichtung nicht vertraut seien, sich auf die angezeigte Liste möglicher Spracheingaben konzentrierten und dadurch nicht auf ein etwa angezeigtes bewegtes Bild achteten, das sie auf den Zeitpunkt hinweise, ab dem sie einen Sprachbefehl eingeben könnten (Abs. 10).

102. Vor diesem Hintergrund kann das technische Problem dahin beschrieben werden, eine Spracherkennungsvorrichtung bereitzustellen, bei der eine Fehleingabe des Nutzers möglichst unterbleibt und zugleich unnötige Verzögerungen vermieden werden.

113. Das Streitpatent schlägt hierzu in Patentanspruch 1 eine Vorrichtung vor, deren Merkmale sich wie folgt gliedern lassen (abweichende Gliederung des Patentgerichts in eckigen Klammern).

134. Einige Merkmale bedürfen der Erläuterung:

14a) Ausgangspunkt für die Einleitung des Spracherkennungsprozesses ist nach Merkmal 1.2 eine Start-Anweisung des Nutzers. Hierzu verfügt die Vorrichtung über ein Anweisungsmittel zum Empfangen einer solchen Anweisung, etwa vermittelt durch einen vom Nutzer zu betätigenden Sprachknopf.

15b) Der Empfang der Start-Anweisung in der Erkennungseinheit markiert den Beginn des notwendigen Einstellungszeitraums gemäß Merkmal 2. Es beginnt eine zeitliche Phase, in der eine Spracherkennung technisch bedingt noch nicht möglich ist, obwohl der entsprechende Nutzerwunsch schon durch den Empfang der Start-Anweisungen in der Erkennungseinheit vorliegt. Hier besteht die Gefahr, dass der Nutzer entsprechend seinem Wunsch bereits Spracheingaben tätigt, die aber noch nicht erkannt werden können (Abs. 6). Der Einstellungszeitraum endet demgemäß, wenn die notwendige Einstellzeit abgelaufen ist und die Erkennungseinheit infolge dessen technisch bereit zur Ausführung des Spracherkennungsprozesses ist. Inwieweit und nach Maßgabe welcher weiteren Ablaufvorgaben der Spracherkennungsprozess anschließend tatsächlich umgesetzt wird, ist nicht mehr Gegenstand von Merkmal 2.

16c) Patentanspruch 1 enthält keine ausdrückliche Angabe zur Dauer des Einstellungszeitraums. Wie das Oberlandesgericht Karlsruhe in der als Anlage B3 vorgelegten Entscheidung im Verletzungsrechtsstreit (Urteil vom , S. 24) und das Patentgericht zutreffend angenommen haben, legt das Streitpatent zugrunde, dass der Einstellungszeitraum jedenfalls so lange währt, dass die Anzeigen nach Merkmalsgruppe 3 vom Nutzer wahrgenommen werden können.

17d) Entgegen der Auffassung der Berufung entnimmt das Patentgericht dem Anspruch nicht, dass die Spracherkennungsvorrichtung vor dem Beginn des Einstellungszeitraums inaktiv sein müsse.

18Das Patentgericht hat zutreffend darauf hingewiesen, dass es um eine Spracherkennungsvorrichtung geht, die nicht ständig einsatzbereit ist. Es ist danach nicht ausgeschlossen, dass die Vorrichtung zunächst aktiv ist, dann aber die Bereitschaft zur Spracherkennung endet, so dass sie, sofern eine neue Eingabe gewünscht wird oder erforderlich ist, erneut aktiviert werden muss.

19Patentanspruch 1 setzt insofern nur voraus, dass es bei dem Betrieb der Vorrichtung einen Zeitraum gibt, der mit einer Spracherkennungs-Start-Anweisung beginnt und bis zu dem Zeitpunkt reicht, in dem die Spracherkennungsvorrichtung technisch bereit ist, den Spracherkennungsprozess - erneut - auszuführen. Eine Spracherkennungs-Start-Anweisung des Nutzers kann, wie das Ausführungsbeispiel nach Figur 3 und dessen Erläuterung in Absatz 60 der Beschreibung verdeutlichen, auch in einer Spracheingabe des Nutzers bestehen, sofern diese das Erfordernis einer weiteren Spracheingabe mit sich bringt.

20e) Nach Merkmalsgruppe 3 ist das Steuerungsmittel so eingerichtet, dass es während des Einstellungszeitraums die Anzeige zweier Elemente steuert: Die Anzeige eines Verbotszeichens (prohibition character, Merkmal 3.1) und die Anzeige einer Liste von erkennbaren Wörtern (Merkmal 3.2).

21Zur Anordnung und Größe von Verbotszeichen einerseits und der aufgelisteten erkennbaren Wörter andererseits macht Anspruch 1 keine Vorgaben.

22Die Auffassung der Berufung, das Patentgericht habe die Aufgabe und damit auch die Lösung unzutreffend bestimmt, trifft nicht zu. Maßgeblich für die Bestimmung der objektiven Aufgabe ist, was die Erfindung tatsächlich leistet. Die Lehre des Streitpatents geht dahin, dass dem Nutzer während des Einstellungszeitraums gleichzeitig die erkennbaren Wörter und ein Verbotszeichen angezeigt werden. Dies erlaubt es, dass der Nutzer schon zu einer Zeit, während der die Spracherkennung noch nicht bereit ist, sieht, welche Eingabe er demnächst machen kann; zugleich wird der Gefahr entgegengewirkt, dass er eine Eingabe macht, bevor die Spracherkennungsvorrichtung hierfür bereit ist. Dies gewährleistet eine möglichst rasche und zugleich fehlerfreie Nutzung der Spracherkennungsvorrichtung.

23Das Patent legt zugrunde, dass eine in der Beschreibung angesprochene gleichzeitige Anzeige eines erkennbaren Sprachtextes und eines sich bewegenden Bildes in einer Ecke des Bildschirms - als Hinweis auf den noch laufenden Einstellungszeitraum - dieser Gefahr nicht ausreichend entgegenwirkt und schlägt deshalb die Anzeige eines Verbotszeichens vor. Auch ohne konkrete Vorgaben zur Anordnung und Größe von Verbotszeichen und erkennbarem Wort ergibt eine funktionale Auslegung des Anspruchs, dass eine Gestaltung gefordert ist, die hinreichend sicherstellt, dass beide Anzeigen deutlich wahrgenommen werden.

24f) Die Auffassung der Berufung, der Anspruch lasse offen, ob das Verbotszeichen und die Liste der erkennbaren Wörter auch schon vor dem Beginn des Einstellungszeitraums angezeigt werden, teilt der Senat nicht. Jedenfalls für das Verbotszeichen ist eine Anzeige erst ab dem Zeitpunkt sinnvoll, in dem der Nutzer die Spracherkennungs-Start-Anweisung gegeben hat und darauf wartet, mit der Spracheingabe beginnen zu können. Für diese Deutung spricht zudem die Parallele zu Merkmalsgruppe 4. Danach sind Merkmalsgruppen 3 und 4 dahin zu verstehen, dass die Anzeige des Verbotszeichens und der Liste erkennbarer Wörter erst während des Einrichtungszeitraums erfolgt und die Anzeige des Erlaubniszeichens erst erfolgt, nachdem dieser abgelaufen ist. Dem entspricht es, dass nach den Figuren 3 und 5 die Anzeige der Liste erkennbarer Wörter und des Verbotszeichens (Schritt 3) jeweils nach dem Beginn des Einstellungszeitraums (Schritt 2) vorgesehen ist.

25Patentanspruch 1 kann dagegen nicht entnommen werden, dass die Anzeige des Verbotszeichens und der Liste erkennbarer Wörter bereits unmittelbar nach dem Empfang der Spracherkennungs-Start-Anweisung erfolgt. Für die Ausführungsbeispiele ist dies zwar in der Beschreibung so vorgesehen (Abs. 19, 20, 71), doch hat dies im Anspruch keinen Niederschlag gefunden.

26g) Merkmalsgruppe 4 gibt als Zeitpunkt für die von der Steuerung zu veranlassende Anzeige des Erlaubniszeichens den Ablauf des Einstellungszeitraums an.

27Aus der Vorgabe, dass das Erlaubniszeichen an der Stelle anzuzeigen ist, an der das Verbotszeichen (im vorhergehenden Einstellungszeitraum) angezeigt wurde, folgt in zeitlicher Hinsicht, dass das Verbotszeichen im Einstellungszeitraum und das Erlaubniszeichen nach Ablauf dieses Zeitraums angezeigt wird.

28h) Unter einem Verbotszeichen (prohibition character) und einem Erlaubniszeichen (permission character) im Sinne der Merkmale 3.1 und 4.1 ist jeweils ein Text aus alphanumerischen Zeichen zu verstehen, also ein einzelnes Zeichen oder eine Abfolge von Zeichen, bei denen es sich lediglich um Buchstaben oder die Ziffern 0 bis 9 handelt. Dagegen fallen Symbole oder Bilder - entgegen der Auffassung des Patentgerichts - nicht unter den Begriff des Verbots- bzw. Erlaubniszeichens im Sinne von Patentanspruch 1.

29Der Wortlaut des Anspruchs ist insoweit nicht eindeutig. In den Ausführungsbeispielen und in der Beschreibung ist als "prohibition character" jeweils eine Abfolge von Wörtern ("You cannot make a speech yet") vorgesehen, die auch als "speech prohibition message" bezeichnet wird. Dies entspricht dem allgemeinen Sprachgebrauch, der im Zusammenhang mit elektronischer Datenverarbeitung unter "character" Schriftzeichen und damit Zahlen oder Buchstaben versteht.

30In Einklang damit spricht die Beschreibung davon, dass die "character" gelesen werden (Abs. 23). Ferner ist erwähnt, dass die "speech prohibition message" in einer anderen Sprache als die erkennbaren Wörter wiedergegeben wird (Abs. 34). Beides ist nur in Bezug auf einen Text, nicht aber in Bezug auf ein Symbol oder Bild sinnvoll.

31Entscheidend kommt hinzu, dass die Beschreibung, insbesondere in Absatz 20, die "prohibition speech message", als Beispiel für einen "prohibition character" bezeichnet und ihr eine "prohibition mark" als Beispiel für ein "prohibition image" gegenüberstellt. Diese Unterscheidung zwischen "message" und "character" auf der einen Seite und "mark" und "image" auf der anderen Seite zieht sich durch die gesamte Beschreibung (s. Abs. 23 und 24, Abs. 56, 58, 61, 71, 80).

32Entsprechend handelt es sich bei dem Erlaubniszeichen im Sinne von Merkmal 4.1 um ein Schriftzeichen oder eine Folge solcher Zeichen.

33II. Das Patentgericht hat seine Entscheidung im Wesentlichen wie folgt begründet:

34Der Gegenstand von Patentanspruch 1 werde durch die US-amerikanische Patentanmeldung 2003/0095212 (NK5) nicht vollständig vorweggenommen. Ob der Fachmann dieser Entgegenhaltung entnehme, dass eine Liste mit erkennbaren Wörtern angezeigt werde, könne offenbleiben, denn jedenfalls erfolge eine solche Anzeige nicht während des Einstellungszeitraums. Zudem fehle es an der Anzeige eines Verbotszeichens während des Einstellungszeitraums.

35Auch das US-amerikanische Patent 5 864 815 (NK6) sei nicht neuheitsschädlich. NK6 offenbare keinen Einstellungszeitraum, in dem ein Verbotszeichen und erkennbare Wörter und nach dessen Ablauf ein Erlaubniszeichen angezeigt würden. Selbst wenn man annehme, dass das Umschalten einen Zeitraum benötige, werde in diesem keine Liste erkennbarer Wörter angezeigt. Diese könne nur durch einen Sprachbefehl aufgerufen werden, also erst zu einer Zeit, in der die Spracheingabe bereits möglich sei.

36NK9 (in deutscher Übersetzung als NK9a) nehme den Gegenstand von Patentanspruch 1 ebenfalls nicht vollständig vorweg. Zwar seien dort mit den sich vergrößernden Figuren Verbotszeichen und Erlaubniszeichen offenbart. Nicht offenbart sei jedoch die Anzeige mindestens eines erkennbaren Wortes während des Einstellungszeitraums.

37Der Neuheit des Gegenstands von Patentanspruch 1 stehe auch die japanische Patentanmeldung Hei-2002-108390 (NK10, in deutscher Übersetzung als NK10b) nicht entgegen. Dort fehle es jedenfalls an der Offenbarung der Anzeige eines Erlaubniszeichens nach dem Verstreichen des Einstellungszeitraums und an der Anzeige mindestens eines erkennbaren Wortes.

38Der Gegenstand des Streitpatents beruhe auf erfinderischer Tätigkeit. Entgegen der Auffassung der Klägerin handele es sich bei der Anweisung, während des Einstellungszeitraums mindestens ein erkennbares Wort anzuzeigen, um ein technisches Merkmal. Ausgehend von der NK9 gebe der Stand der Technik keinen Hinweis darauf, eine Liste der erkennbaren Wörter bereits während des Einstellungszeitraums anzuzeigen. Eine andere Beurteilung sei auch dann nicht angezeigt, wenn NK10 als Ausgangspunkt angesehen werde.

39III. Diese Beurteilung hält der Überprüfung im Berufungsrechtszug stand.

401. Zu Recht hat das Patentgericht den Gegenstand von Patentanspruch 1 gegenüber NK6 als neu angesehen.

41a) Nach der Beschreibung der NK6 sind Spracherkennungsvorrichtungen bereits bekannt. Schwierigkeiten könne bereiten, dass im Rahmen der Nutzung der Spracherkennung Rückmeldungen an den Nutzer erforderlich seien. Würden solche Rückmeldungen auf dem Bildschirm in einem Fenster angezeigt, könne dies dazu führen, dass sie einen erheblichen Teil der Fläche des Bildschirms beanspruchten.

42NK6 schlägt vor diesem Hintergrund vor, die Rückmeldung an den Nutzer so zu gestalten, dass sie wenig Fläche benötigt. Dafür ist ein bestimmter Benachrichtigungsbereich (designated notification area) vorgesehen. In diesem Bereich soll eine Benachrichtigung über einen von mindestens zwei unterschiedlichen Zuständen der Spracherkennungsvorrichtung angezeigt werden.

43NK6 erläutert dies anhand eines Ausführungsbeispiels, das in den Figuren 2 bis 4 und 7 bis 12 dargestellt wird.

44Danach wird durch ein kleines Icon in der rechten unteren Ecke des Bildschirms angezeigt, in welchem von drei möglichen Zuständen - listening, not listening oder stand-by - sich die Spracherkennung aktuell befindet. Wird die Maus auf das Icon geführt, wird ein Tooltipp ("Microsoft Voice") angezeigt, der darüber informiert, dass sich das Icon auf die Spracherkennung bezieht. Der Nutzer kann einen Wechsel des Zustands herbeiführen, indem er auf das Icon klickt. Dadurch öffnet sich ein Menü, in dem er den Punkt "Listening Mode" anklicken und dann in einem Untermenü einen der drei möglichen Zustände wählen kann. Der so gewählte Zustand wird durch eine entsprechende Änderung des Icons angezeigt. Wird die Maus nun über das jeweilige Icon geführt, wird dem Nutzer ein Tooltipp angezeigt, mit dem er in Textform über den Zustand informiert wird.

45Erfolgt während des Zustands "listening" eine Spracheingabe, wird anstelle des Icons, das den Zustand anzeigt, ein anderes Icon dargestellt, das die Verarbeitung der Audio-Eingabe symbolisiert. Im Ausführungsbeispiel ist das eine Sanduhr. Zugleich wird ein Tooltipp eingeblendet, der eine Rückmeldung darüber anzeigt, ob die Vorrichtung die Spracheingabe erkennen konnte oder nicht. Im Ausführungsbeispiel reagiert die Vorrichtung auf die erfolgreiche Eingabe der Frage "What can I say?" mit der Anzeige einer Liste möglicher Sprachbefehle.

46b) Zu Recht hat das Patentgericht entschieden, dass die Entgegenhaltung nicht sämtliche Merkmale von Patentanspruch 1 offenbart.

47aa) Es fehlt bereits an einer unmittelbaren und eindeutigen Offenbarung eines Einstellungszeitraums im Sinne des Streitpatents.

48NK6 ist nicht zu entnehmen, dass ab dem vom Nutzer veranlassten Wechsel der Spracherkennung vom Zustand "not listening" in den Zustand "listening" durch Anklicken des entsprechenden Menüpunktes bis zu dem Zeitpunkt, in dem die Vorrichtung zur Spracherkennung bereit ist, ein Zeitraum im Sinne von Merkmal 2 verstreicht. Entgegen der Darstellung der Berufung hat das Patentgericht nicht bestätigt, dass NK6 einen Einstellungszeitraum offenbart.

49NK6 ist insbesondere nicht das Vorliegen einer relevanten "technisch bedingten" Verzögerung bei einem Zustandswechsel zu entnehmen. Selbst wenn der Vortrag der Berufung zutreffen sollte, dass stets eine technisch bedingte Verzögerung auftritt, ist weder aus NK6 noch sonst ersichtlich, dass diese so lange andauert, dass ein Verbotszeichen oder ein erkennbares Wort in für den Nutzer wahrnehmbarer Weise angezeigt werden können.

50bb) Auch Merkmal 3.1 ist nicht offenbart.

51(1) Das Icon, das den Status "not listening" anzeigt, stellt ein Symbol dar und ist damit kein Verbotszeichen im Sinne von Merkmal 3.1.

52NK6 sieht zwar auch die Möglichkeit vor, dass anstelle eines Icons ein entsprechender Text den aktuellen Status kennzeichnet. Die Anzeige eines solchen Textes ("not listening") erfolgt aber nur unter der zusätzlichen Voraussetzung, dass der Nutzer mit der Maus auf das Icon geht. Patentanspruch 1 erfordert jedoch, dass die Anzeige eines Verbotszeichens durch das Steuerungsmittel nur voraussetzt, dass der Einstellungszeitraum begonnen hat.

53(2) Unabhängig davon hat das Patentgericht zutreffend angenommen, dass NK6 nicht unmittelbar und eindeutig offenbart, ob das für den Status "not listening" stehende Icon auch bei Auslösen des Statuswechsels noch für eine gewisse Zeit angezeigt wird oder ob unmittelbar das Icon angezeigt wird, das für "listening" steht.

54Soweit die Berufung in diesem Zusammenhang darauf verweist, dass nach NK6 stets der aktuelle Status ("current state", Sp. 4 Z. 13) angezeigt werde, rechtfertigte dies nur dann eine andere Beurteilung, wenn NK6 unmittelbar und eindeutig zu entnehmen wäre, dass sich der Status nicht unmittelbar mit dem Anklicken eines anderen Modus ändert. Diese Voraussetzung trifft jedoch, wie bereits ausgeführt wurde, schon mangels Offenbarung eines relevanten Einstellzeitraums nicht zu.

55cc) Schließlich ist NK6 auch Merkmal 3.2 nicht zu entnehmen.

56Ob das von der Berufung angeführte Szenario zutrifft - der Nutzer wählt zunächst "listening", gibt sodann "What can I say?" ein, woraufhin ihm eine Liste erkennbarer Wörter angezeigt wird, dann schaltet er auf "not listening" um, so dass ihm das Icon für "not listening", aber weiterhin die Liste erkennbarer Wörter angezeigt werden - kann insoweit offenbleiben. Ein solches Szenario ergibt sich jedenfalls nur aufgrund eigenständiger fachlicher Überlegungen und ist damit durch NK6 nicht unmittelbar und eindeutig offenbart.

57Mit der von der Berufung angesprochenen Möglichkeit, die Liste erkennbarer Wörter in dem in Figur 7 gezeigten Menü (62) anzuklicken, ist ebenfalls nicht unmittelbar und eindeutig eine Anzeige im Zusammenhang mit einem relevanten Einstellungszeitraum offenbart.

582. Zu Recht und von der Berufung unbeanstandet hat das Patentgericht NK5 nicht als neuheitsschädlich angesehen.

59a) NK5 befasst sich mit der Fernsteuerung von elektrischen Geräten im Haushalt. Da die Zahl solcher Geräte und die Möglichkeiten der Bedienung vielfältig seien, könne die Bedienbarkeit durch eine Fernbedienung verbessert werden, die sowohl die Betätigung von Tasten wie Spracheingaben ermöglicht. Dabei sei es wünschenswert, dass bei einer Spracheingabe eine optische Rückmeldung über ein GUI (graphic user interface) erfolge (Abs. 23).

60NK5 erläutert ein Ausführungsbeispiel anhand der nachstehend wiedergegebenen Figur 1:

61Danach ist eine Fernbedienung (10) vorgesehen, die sowohl über Tasten (1) wie über ein Mikrofon (5) verfügt, über das Sprache (V) eingegeben werden kann. Drückt der Nutzer eine Sprechtaste (8), wird ihm auf dem Bildschirm (28A) durch Text (TX) und Bild (IM) angezeigt, dass eine Spracheingabe möglich ist. Eine Spracheingabe wird nur verarbeitet, solange die Sprechtaste gedrückt ist.

62b) NK5 nimmt zwar die Merkmalsgruppe 1 vorweg. Die weiteren Merkmale sind jedoch in NK5 nicht offenbart.

63aa) Es fehlt auch hier an einer unmittelbaren und eindeutigen Offenbarung eines Einstellungszeitraums im Sinne von Merkmal 2.

64NK5 ist nicht zu entnehmen, dass ab dem Drücken der Sprechtaste bis zu dem Zeitpunkt, in dem auf dem Bildschirm die Anzeige erscheint, dass eine Spracheingabe möglich ist, ein Zeitraum im Sinne von Merkmal 2 verstreicht.

65In Tabelle 4 ist als möglicher Fehler auch der Fall aufgeführt, dass eine Spracheingabe nicht erkannt wird ("not ready to receive voices"). In einer solchen Situation wird dem Nutzer als Rückmeldung der Text 12 nach Tabelle 2 angezeigt ("Please speak again"). Danach erfolgt diese Meldung nicht in einer Situation, in der die Vorrichtung nicht bereit ist, den Spracherkennungsprozess auszuführen. Es handelt sich vielmehr um eine Rückmeldung auf eine unzureichende Spracheingabe (Abs. 181-183).

66bb) Dem entspricht es, dass NK5 keine Anzeige einer Folge alphanumerischer Zeichen vorsieht, die eine Spracheingabe verbietet. Eine solche ist insbesondere in Tabelle 2 nicht aufgeführt. Der Entgegenhaltung ist lediglich zu entnehmen, dass nach dem Drücken der Sprechtaste auf die Möglichkeit hingewiesen wird, eine Spracheingabe vorzunehmen. Damit ist auch Merkmal 3.1 nicht offenbart.

67cc) Auch Merkmal 3.2 ist NK5 nicht zu entnehmen.

68Zwar ist in der Beschreibung die Möglichkeit angedeutet, dass dem Nutzer neben einer Liste der von der Spracherkennungsvorrichtung erkannten Wörter auch eine Liste von "Kandidaten" angezeigt wird (Abs. 199, s. auch Abs. 55). Da es an einem Einstellungszeitraum fehlt, ist jedoch eine Anzeige einer solchen Liste während des Einstellungszeitraums nicht offenbart.

69dd) Entsprechend fehlt es auch an einer Vorwegnahme der Merkmalsgruppe 4.

703. Auch NK9 steht der Neuheit des Gegenstands von Patentanspruch 1 nicht entgegen.

71a) Nach NK9 entstehen bei den bekannten Spracherkennungsvorrichtungen Verzögerungen zwischen dem Zeitpunkt, zu dem die Spracheingabe durch Drücken eines Schalters gestartet wird, bis zu ihrem tatsächlichen Start. Dies könne dazu führen, dass der Nutzer schon zu dem Zeitpunkt, zu dem er den Schalter betätige, zu sprechen beginne und das Anfangssegment der eingegebenen Sprache nicht aufgezeichnet werde (Abs. 2).

72Bislang sei es insoweit bekannt gewesen, den Zeitpunkt, in dem die Vorrichtung zur Spracheingabe bereit sei, durch ein akustisches Signal oder die Anzeige eines Bildes kenntlich zu machen. Auf diese Weise werde dem Nutzer der Zeitpunkt, ab dem eine Spracheingabe verarbeitet werden könne, nicht hinreichend deutlich gemacht (Abs. 3, 4).

73NK9 schlägt vor, ab dem Zeitpunkt, in dem die Vorrichtung eingeschaltet werde, bis zu dem Zeitpunkt, in dem sie zur Verarbeitung einer Spracheingabe bereit sei, auf einer Anzeigeeinheit eine sich bewegende Figur anzuzeigen (Abs. 5). Dadurch könne der Nutzer den Status der Spracherkennungsvorrichtung über den Zeitraum vom Betätigen des Schalters bis zum tatsächlichen Start der Spracherkennung visuell verfolgen. So werde vermieden, dass er zu früh zu sprechen beginne (Abs. 17).

74b) Damit sind Merkmalsgruppe 1 und Merkmal 2 vorweggenommen.

75aa) Dagegen ist Merkmalsgruppe 3 nicht offenbart.

76Merkmal 3.1 ist nicht verwirklicht, weil dem Nutzer keine Folge alphanumerischer Zeichen und damit kein Verbotszeichen im Sinne des Streitpatents angezeigt wird, sondern ein Symbol.

77NK9 offenbart auch keine Anzeige mindestens eines von der Spracherkennungsvorrichtung erkennbaren Wortes (Merkmal 3.2).

78bb) Auch Merkmalsgruppe 4 ist nicht vorweggenommen.

79Zwar dürfte NK9 zu entnehmen sein, dass das Symbol, das sich während des Einstellungszeitraums bewegt hat, weiterhin angezeigt wird, nun aber ohne Bewegung. Da es sich jedoch nicht um eine Folge alphanumerischer Zeichen handelt, offenbart NK9 kein Erlaubniszeichen im Sinne von Merkmal 4.1.

804. NK10 trifft das Streitpatent ebenfalls nicht neuheitsschädlich.

81a) NK10 beschäftigt sich mit einer Spracherkennungsvorrichtung, bei der die Spracherkennung nur während eines Zeitraums erfolgt, in dem der Nutzer den Schalter gedrückt hält, oder nur für eine festgelegte Zeitdauer nach Betätigen eines Schalters. Auch bei einer solchen Vorrichtung könne eine vollständige Erfassung der Spracheingabe misslingen, wenn etwa der Nutzer erst kurze Zeit nach Sprechbeginn den Schalter drückt oder diesen kurz vor dem Ende des Sprechens loslasse (Abs. 7). NK10 setzt sich zum Ziel, die hierdurch auftretenden Fehler bei einfacher Bedienbarkeit zu minimieren (Abs. 10).

82Die Entgegenhaltung schlägt hierzu vor, die Vorrichtung so auszulegen, dass die Spracheingabeeinheit beim Wechsel des Schalters von AUS auf EIN sofort über den Start der Sprachsignalerfassung informiert wird, dem Benutzer dagegen erst nach Ablauf einer festgelegten Einstellzeit angezeigt wird, dass die Spracheingabe nun möglich ist (Abs. 15). Diese Information des Nutzers kann etwa dadurch vermittelt werden, dass ihm zunächst ein liegendes Mikrofon und nach Ablauf der Einstellzeit ein vertikal angeordnetes Mikrofon angezeigt wird (Abs. 41 mit Figur 4). Die Einstellzeit liegt nach NK10 vorzugsweise bei ein paar hundert Millisekunden (Abs. 39).

83Dagegen wird beim Schalten von EIN auf AUS die Spracheingabeeinheit erst mit einer festgelegten Verzögerungszeit über das Ende der Sprachsignalerfassung informiert.

84b) Damit ist Merkmalsgruppe 1 offenbart.

85c) Es fehlt jedoch, anders als die Berufung meint, an einer Offenbarung von Merkmal 2.

86NK10 geht ausdrücklich davon aus, dass die Spracheingabeeinheit "sofort" bei Betätigen des Schalters einsatzbereit ist. Wenn dem Nutzer durch entsprechende Anzeige erst mit einer kurzen Verzögerung signalisiert wird, dass die Spracheingabe möglich ist, geschieht dies nicht deshalb, weil das Spracherkennungsmittel noch nicht bereit ist, den Spracherkennungsprozess durchzuführen, sondern nur, um zu verhindern, dass der Nutzer bereits vor der Betätigung des Schalters spricht.

87d) Damit fehlt es auch an einer Vorwegnahme von Merkmalsgruppen 3 und 4.

88NK10 sieht nicht vor, dass die fehlende Bereitschaft zur Spracheingabe durch ein Verbotszeichen im Sinne des Streitpatents vermittelt wird, sondern verwendet dafür ein Icon.

89Auch die Anzeige mindestens eines erkennbaren Wortes ist durch NK10 nicht offenbart.

905. Schließlich steht die europäische Patentanmeldung 1 028 410 (NK14) der Neuheit des Gegenstands von Patentanspruch 1 nicht entgegen.

91a) Diese erstmals in der Berufungsinstanz vorgelegte Entgegenhaltung ist gemäß § 117 PatG und § 531 Abs. 2 Satz 1 ZPO zu berücksichtigen, weil die Klägerin keinen Anlass hatte, sie bereits in erster Instanz vorzulegen.

92Die Klägerin durfte aufgrund des nach § 83 Abs. 1 PatG erteilten, ihr günstigen Hinweises davon ausgehen, dass ihre Nichtigkeitsklage Erfolg haben würde. Bei dieser Ausgangslage hatte sie keinen Anlass, weitere Entgegenhaltungen vorzulegen. Der Hinweis gemäß § 83 Abs. 1 PatG dient dazu, den Streitstoff möglichst zu konzentrieren. Dieser Zielsetzung stünde es entgegen, wenn eine Partei gehalten wäre, zu einem Gesichtspunkt ergänzend vorzutragen, hinsichtlich dessen der Hinweis eine ihr günstige Entscheidung erwarten lässt. Schon aufgrund des notwendigerweise vorläufigen Charakters des Hinweises konnte die Klägerin zwar nicht sicher davon ausgehen, dass das Patentgericht an seiner Einschätzung festhalten würde. Sie durfte aber darauf vertrauen, dass sie Gelegenheit zur Ergänzung ihres Vorbringens erhält, wenn das Patentgericht im weiteren Verlauf des Rechtsstreits zu einer anderen Bewertung gelangt.

93Entgegen der Auffassung der Beklagten konnte der Umstand, dass sie den Ausführungen des Patentgerichts im qualifizierten Hinweis entgegengetreten ist, einen solchen Hinweis nicht ersetzen. Die Beklagte war gehalten, auf den erteilten Hinweis zu reagieren, soweit sie an ihrem von der Auffassung des Patentgerichts abweichenden Standpunkt festhalten wollte. Aus ihrem Vorbringen ergaben sich im Streitfall aber keine neuen Gesichtspunkte, die es als offensichtlich erscheinen ließen, dass das Patentgericht von seiner vorläufigen Bewertung abrücken würde (, GRUR 2022, 975 Rn. 78 ff. - Windturbinenschaufelmontage).

94b) Auch diese Entgegenhaltung nimmt jedoch den Gegenstand von Patentanspruch 1 nicht vollständig vorweg.

95aa) NK14 betrifft eine Spracherkennungsvorrichtung.

96Nach der Beschreibung müssen Nutzer einer solchen Vorrichtung ein Übungsprogramm (enrolment) absolvieren, damit die Spracherkennung möglichst gut arbeiten könne. Dies erfordere bestimmte, festgelegte Spracheingaben, damit sich das System besser auf die Eigenheiten der Sprache des konkreten Nutzers einstellen könne.

97Ein solches Übungsprogramm sei unproblematisch, wenn der Nutzer einen vorgegebenen Text flüssig lesen und nachsprechen könne. Es bestehe jedoch Bedarf, eine solche Vorrichtung auch für Nutzer bereitzustellen, die einen solchen Text nicht flüssig lesen können, etwa weil sie generell Schwierigkeiten mit dem Lesen haben oder weil der Text für sie eine Fremdsprache darstellt.

98NK14 schlägt dazu vor, dass solchen Nutzern der für die Übung erforderliche Text vorgesprochen wird und sie dann aufgefordert werden, ihn nachzusprechen. Dazu wird eine TTS-Vorrichtung (text to speech) genutzt.

99Ein Ausführungsbeispiel wird anhand der nachstehend wiedergegebenen Figuren erläutert.

100Figur 2 zeigt im linken oberen Eck eines Feldes (104), in dem ein Text eingeblendet wird, den der Nutzer nachsprechen soll, das Symbol einer Sanduhr. Damit wird angezeigt, dass das System sich darauf vorbereitet, den ersten Satz vorzuspielen (Abs. 42). Ein auf die Sanduhr weisender Pfeil wird gelb dargestellt. Die TTS-Vorrichtung kann dann etwa den Satz ausgeben: "When the arrow on the hourglass icon changes from yellow to green, read the green words".

101Das nächste Stadium zeigt die Figur 3:

102Nun wird dem Nutzer das erste Wort des Textes vorgelesen und, um dies kenntlich zu machen, grün unterlegt. Der auf die Sanduhr weisende Pfeil bleibt gelb, weil der Nutzer noch nicht sprechen soll.

103Figur 4 zeigt eine Phase, in der der erste Satzteil vorgelesen wurde und grün unterlegt ist. Der Pfeil an der Sanduhr ist weiterhin gelb.

104In Figur 5 ist der Pfeil dann grün und anstelle einer Sanduhr wird ein Mikrofon angezeigt. Dies soll dem Nutzer anzeigen, dass er nunmehr das Vorgespielte nachsprechen soll.

105Die einzelnen Schritte des Verfahrens werden beginnend mit dem Start (12) der Registrierung und Initiierung (14) einer Sprache-Nutzer-Schnittstelle (voice user interface, VUI) und einer grafischen Nutzer-Schnittstelle (graphical user interface, GUI) durch die nachfolgenden Ablaufdiagramme gemäß den Figuren 1A und 1B veranschaulicht.

106bb) Es fehlt an einer Offenbarung von Merkmal 2.

107Ein Einstellungszeitraum im Sinne von Merkmal 2 ist, wie oben ausgeführt wurde, ein Zeitraum, in welchem die Spracherkennungsvorrichtung nach Empfang der Start-Anweisung technisch noch nicht bereit ist, eine Spracheingabe zu verarbeiten.

108NK14 ist nicht unmittelbar und eindeutig zu entnehmen, dass es auch bei der dort beschriebenen Vorrichtung einen solchen Zeitraum gibt.

109Nach den einleitenden Schritten 12 und 14 werden dem Nutzer allgemeine Instruktionen zum Ablauf des Registrierungsprozesses vorgespielt (16). Ferner wird er darauf hingewiesen, dass er jeweils still sein möge, während ihm die einzelnen Sätze vorgespielt werden, und jeden Satz, nachdem er ihm vorgespielt worden sei, nachsprechen solle. Damit gibt es nach NK14 Phasen, in denen eine Spracheingabe des Nutzers nicht erwünscht ist, weil es sich um Zeiträume handelt, während der ihm die TTS-Vorrichtung einen Text vorspricht, den er anschließend nachsprechen soll.

110Wie aus dem Ablaufdiagramm nach Figur 1B ersichtlich ist, wird die Spracherkennung mit den Schritten 28, 34, 40 und 44 durchgeführt, in denen festgestellt wird, ob der Benutzer gesprochen hat, besondere Anweisungen vorliegen (Go Back oder Repeat) und die Sprachqualität ausreichend ist (Spoken Quality OK?). Zuvor wurde im Schritt 26 die aktuelle Phrase des Textblocks abgespielt. Sodann heißt es in NK14, es werde erwartet, dass der Benutzer die soeben abgespielte Phrase spricht (Abs. 30 a.E.: "After the current phrase is played, the user is expected to speak the phrase just played.").

111Damit sind für den Registrierungsprozess im Zusammenwirken mit dem Benutzer zwar Schritte vorgesehen, die zeitlich vor den Spracherkennungsschritten liegen. Daraus folgt jedoch nicht unmittelbar und eindeutig, dass die Spracherkennungsmittel nicht schon zuvor technisch bereit sind, einen Spracherkennungsprozess durchzuführen. Ab welchem Zeitpunkt nach dem einleitenden Startschritt (12) und der Initiierung der Sprachnutzerschnittstelle (VUI) und der grafischen Nutzerschnittstelle (GUI) (Schritt 14) die technische Bereitschaft zur Spracherkennung vorliegt, lässt sich NK14 nicht entnehmen.

112cc) Mangels Bestimmbarkeit eines Einstellungszeitraums fehlt es auch an einer Offenbarung einer Steuerung des Anzeigemittels während des Einstellungszeitraums zur Anzeige im Sinne der Merkmalsgruppe 3.

113Darüber hinaus handelt es sich bei der angezeigten Sanduhr nicht um ein Verbotszeichen im Sinne von Merkmal 3.1, denn es wird keine Folge von Buchstaben oder Zahlen angezeigt, sondern ein Symbol.

114dd) Aus den gleichen Gründen ist NK14 kein Erlaubniszeichen zu entnehmen. Auch bei dem Mikrofon in Figur 5 handelt es sich um ein Symbol und nicht, wie von Merkmal 4.1 gefordert, um eine Folge von Buchstaben oder Zahlen.

1156. Im Ergebnis zu Recht hat das Patentgericht entschieden, dass der Gegenstand von Patentanspruch 1 durch den Stand der Technik nicht nahegelegt war.

116a) Bei der Prüfung auf erfinderische Tätigkeit ist - entgegen der Auffassung der Berufung - auch das Merkmal 3.2 zu berücksichtigen.

117Ob die Beschreibung des Streitpatents den Stand der Technik zutreffend dahin wiedergibt, dass die Anzeige mindestens eines erkennbaren Wortes während des Einstellungszeitraums im Stand der Technik bekannt war, bedarf an dieser Stelle keiner Entscheidung. Bei der Prüfung einer technischen Lehre auf erfinderische Tätigkeit sind nur diejenigen Anweisungen auszuscheiden, die nicht die Lösung des technischen Problems mit technischen Mitteln bestimmen oder zumindest beeinflussen. Dagegen ist es unerheblich, ob ein Merkmal für sich genommen im Stand der Technik bereits bekannt war.

118Die Wiedergabe von Informationen ist als solche dem Patentschutz nicht zugänglich (Art. 52 Abs. 2 Buchst. d, Abs. 3 EPÜ). Deshalb haben bei der Prüfung der Patentfähigkeit solche Anweisungen als nicht technisch außer Betracht zu bleiben, die gerade die Vermittlung bestimmter Inhalte betreffen und damit darauf abziehen, auf die menschliche Vorstellung oder Verstandesfähigkeit einzuwirken.

119Dagegen dienen Anweisungen, die zwar die (visuelle) Informationswiedergabe betreffen, bei denen aber nicht die Vermittlung bestimmter Inhalte oder deren Vermittlung in besonderer Aufmachung im Blickpunkt steht, sondern die Präsentation von Bildinhalten in einer Weise, die auf die physischen Gegebenheiten der menschlichen Wahrnehmung und Aufnahme von Informationen Rücksicht nimmt und dabei darauf gerichtet ist, die Wahrnehmung der gezeigten Information durch den Menschen in bestimmter Weise erst zu ermöglichen, zu verbessern oder zweckmäßig zu gestalten, der Lösung eines technischen Problems mit technischen Mitteln und sind bei der Prüfung auf erfinderische Tätigkeit zu berücksichtigen. Zu berücksichtigen ist ein auf die Wiedergabe von Informationen bezogenes Merkmal ferner, wenn und soweit es ein Mittel darstellt, um eine bestimmte technische Wirkung zu erzielen (, GRUR 2020, 599 Rn. 26 - Rotierendes Menü).

120Die zuletzt genannten Voraussetzungen sind bei Merkmal 3.2 erfüllt. Die Anzeige mindestens eines erkennbaren Wortes während des Einstellungszeitraums hat die Funktion, den Nutzer schon während dieses Zeitraums darüber zu informieren, welche Spracheingaben er nach Verstreichen dieses Zeitraums tätigen kann. Das Merkmal zielt mithin nicht auf die Vermittlung bestimmter Inhalte, sondern dient der effizienteren Nutzung der Spracherkennungsvorrichtung.

121b) Der Gegenstand von Patentanspruch 1 lag ausgehend von NK9 durch den Stand der Technik zum Prioritätszeitpunkt nicht nahe.

122Wie oben ausgeführt wurde, nimmt NK9 die Merkmalsgruppe 1 und Merkmal 2, nicht jedoch die Merkmalsgruppen 3 und 4 vorweg.

123Weder aus NK9 selbst noch aus dem sonstigen Stand der Technik ergab sich ein Hinweis darauf, die dort beschriebene Vorrichtung dahin zu ändern, dass während des Einstellungszeitraums eine Liste erkennbarer Wörter angezeigt wird.

124Soweit eine solche Liste in einem Ausführungsbeispiel der NK6 gezeigt wird, geschieht dies dort in einer Situation, in der die Spracherkennungsvorrichtung bereits einsatzbereit ist, als Reaktion auf eine bestimmte Frage des Nutzers ("What can I say?"). Hieraus ergab sich keine Anregung, eine Liste erkennbarer Wörter unabhängig von einer Eingabe des Nutzers bereits während des Einstellungszeitraums anzuzeigen.

125NK5 erwähnt zwar die Möglichkeit der Anzeige von "Kandidaten für Spracherkennungsobjekte" (Abs. 55 und 199). Auch aus dieser Entgegenhaltung ergibt sich jedoch kein Hinweis, eine entsprechende Liste bereits vor dem Zeitpunkt anzuzeigen, in dem die Vorrichtung zur Spracherkennung bereit ist. Entsprechendes gilt für NK14.

126Entgegen der Ansicht der Berufung ergab sich schließlich keine Anregung zur Anzeige einer Liste erkennbarer Wörter während des Einstellungszeitraums unter dem Gesichtspunkt, die Fehleranfälligkeit der Spracherkennungseinrichtung nach NK9 zu reduzieren. Das Patentgericht hat insoweit mit Recht darauf abgestellt, dass NK9 mit dem Ansatz, durch die Anzeige eines bewegten Bildes den Nutzer von einer verfrühten Spracheingabe während dieses Zeitraums abzuhalten, hierfür weder Anlass noch Anregung bietet.

127c) Eine andere Beurteilung ergibt sich auch dann nicht, wenn NK10 als Ausgangspunkt angesehen wird.

128NK10 liegt weiter ab, weil sie, wie oben ausgeführt wurde, keinen Einstellungszeitraum offenbart. Unabhängig davon fehlt es auch insoweit an einer Anregung, bereits vor der Einsatzbereitschaft der Spracherkennungsvorrichtung eine Liste erkennbarer Wörter anzuzeigen.

129d) Der Hinweis der Berufung auf NK14 als möglichen Ausgangspunkt der Bemühungen des Fachmanns führt ebenfalls nicht weiter.

130NK14 offenbart zwar die Anzeige einer Folge von Wörtern, die bei einer nachfolgenden Spracheingabe erkannt wird. Dass diese Anzeige während eines Einstellungszeitraums und nicht zu einer Zeit, in der die Vorrichtung für eine Spracheingabe technisch bereit ist, erfolgt, lässt sich, wie oben dargelegt wurde, NK14 nicht entnehmen. Eine Veranlassung, diese Wortfolge schon in einem Einstellungszeitraum anzuzeigen, ergibt sich damit nicht.

131IV. Die Kostenentscheidung beruht auf § 121 Abs. 2 PatG und § 97 Abs. 1 ZPO.

ECLI Nummer:
ECLI:DE:BGH:2024:110124UXZR73.21.0

Fundstelle(n):
YAAAJ-64274