Thorsten ist toll, er entwickelt eigene Tools und Stimm-modelle, für TTS also Sprachausgabe aus Text.

Leider gibt es soweit ich weiß davon noch keine verbreiteten Implementierungen, TTS-Engine für Android oder Linux, oder Screenreader.

Das Thema ist nicht nur für Fahrrad/Autonavigation wichtig, sondern essentiell für Blinde Menschen.

Momentan ist hier Apple leider vorne, Standardisierung und Priorisierung (spricht auch jede Error-Nachricht und das Boot-Menü?) sind große Probleme.

  • gitamar@feddit.de
    link
    fedilink
    Deutsch
    arrow-up
    4
    ·
    8 months ago

    Super cooles Projekt. Ich finde sein hochdeutsches Modell auch ziemlich gut. Damit mehr Leute (auch mit Dialekt) mitmachen, hier auch noch Mal Werbung für Mozilla Common voice. Die sammeln möglichst diverse Stimmen für ein gutes, freies Datenset für TTS und STT.

    https://commonvoice.mozilla.org/de

  • rbn@feddit.ch
    link
    fedilink
    Deutsch
    arrow-up
    3
    ·
    edit-2
    8 months ago

    Die Stimme habe ich letztens mit Piper getestet als Text2Speech für einen OpenSource-Sprachassistenten und war wirklich begeistert. Die Stimme klingt deutlich besser als Alexa und auf einem 8 Jahre alten Laptop lief es auch ziemlich flott und ohne nennenswerte Verzögerungen. Der Raspberry Pi 3B, mit dem ich es zuvor getestet hatte, war allerdings relativ langsam und für eine möglichst Echtzeitsprachsteuerung nicht brauchbar.