Sprecherunabhängige Spracherkennung funktioniert ja algorithmisch mittlerweile recht gut, die größte Hürde sind aber die Sprachmodelle, die aus einer Menge gesprochenem Text erstellt werden müssen (Voxforge gibt 140 Stunden Aufnahmedauer als Minimum an).
Meine Idee ist, das Barcamp zu nutzen um ein bisschen frischen Wind in das Projekt zu bringen. Die Samples können direkt auf der Website im Browser (Java-Applet) aufgenommen und hochgeladen werden.
Es müssten also nur genügend Leute ein Headset mitbringen und man könnte ab- und zu einen "Recording-Mob" machen, d.h. 10 Leute stellen sich in eine Ecke (oder auseinander, muss man sehen wie das Sprechen von den anderen die Aufnahme stört) und nehmen für 10-15 Minuten Samples auf.
Auf Voxforge.org kann man auch einen Benutzernamen angeben, so dass ein Wettbewerb darüber abgehalten werden kann, wer man meisten zum Projekt beiträgt (in Minuten). Könnte man also am Sonntag einen Speech-Gewinner nominieren
Die Umsetzung ist vielleicht nicht ideal, weil man besser alleine eine Aufnahme macht, dafür sorgt es aber dafür das mehr Leute mitmachen- und wenn sich diese Idee vielleicht noch auf ein paar anderen Barcamps durchsetzt sollten die 140 Stunden doch innerhalb von ein zwei Jahren zu schaffen sein.
Schreibt doch mal, wenn euch dazu irgendwas einfällt (wie mans umsetzen könnte, etc.)
Werde es auf dem Barcamp nochmal ansprechen. Vielleicht schaffe gelingts mir ja auch einen kleinen Preis für den Meistsprechenden zur organisieren
P.S.
Der Threadtitel sollte natürlich VOXFORGE und nicht voxVorge lauten, aber ich kanns nicht mehr editieren.
Beitrag wurde am 15.03.2009 vom Verfasser bearbeitet



