Open Source Sprachsteuerung

daho86

Active member
Original poster
15 Mai 2025
84
Hallo Zusammen,

nutzt jemand von euch eine Sprachsteuerung um z.b. während dem Fahren jemanden anzurufen oder sowas?

Da ich noch nicht so richtig in die OpenSource Welt gekommen bin, und ich gerne den Weg einschlagen möchte, dachte ich mir, ich frage mal hier nach :)

Danke und Gruß
 
Moin. Ich nutze Futo Voice Input weil Dicio etwas ungenauer ist. Du brauchst aber Dicio, weil er der Assistent ist der Apps öffnet oder Anrufe startet. In Dicio kannst du dann Futo Voice Input einstellen. Die beiden in Kombination sind ein guter Sprachassistent. Leider hab ich noch nichts besseres gefunden. Beides ist FOSS und offline.
Was nicht so gut klappt ist das mit dem wake Word. "Hey Dicio" wird sehr selten erkannt.
Grüße
 
Zuletzt bearbeitet:
  • Like
Reaktionen: daho86 und danielp
Moin. Ich nutze Futo Voice Input weil Dicio etwas ungenauer ist. Du brauchst aber Dicio, weil er der Assistent ist der Apps öffnet oder Anrufe startet. In Dicio kannst du dann Futo Voice Input einstellen. Die beiden in Kombination sind ein guter Sprachassistent. Leider hab ich noch nichts besseres gefunden. Beides ist FOSS und offline.
Was nicht so gut klappt ist das mit dem wake Word. "Hey Dicio" wird sehr selten erkannt.
Grüße
Auch Danke für den Tipp. Wie binde ich Futo ein? Auf Git kann ich nur eine Zip runterladen? Gibt es auch die Möglichkeit meine Stimme anzulernen, dass es mich besser versteht und auch nur auf meine Stimme reagiert?
 
https://play.google.com/store/apps/details?id=org.futo.voiceinput
Diese App im Aurora store runterladen und installieren.
Languages hab ich auf deutsch.
Bei Model hab ich das 244er.
Jetzt noch Dicio installieren und soweit alles einrichten. Unter Einstellung/Eingabemethode wählst du externes Sprache zu Text Popup.
Wenn du jetzt Dicio benutzt fragt er dich welchen Voice Input du nehmen willst. Dort wählst du Futo Voice Input.
Jetzt sollte Dicio immer Futo V. I. Öffnen für die Spracheingabe.

Das mit dem Anlernen klappt soweit ich weis nicht, außer du würdest ein komplett eigenes Sprachpaket erstellen/anlernen.
Ich weis nicht ob man ein bestehendes Voice Model erweitern kann.
Dass übersteigt mein Horizont.
 
  • Like
Reaktionen: daho86
Running ShiftOS L on a ShiftPhone 8.1

STT: Futo keyboard on own FDroid repository https://keyboard.futo.org/#download.
Works fine with several languages

TTS: SherpaTTS
1 Fdroid https://f-droid.org/packages/org.woheller69.ttsengine/,
2 Github https://k2-fsa.github.io/sherpa/onnx/android/prebuilt-apk.html

2 works for me fine on ShiftOS L with Dutch voice.

Works on OsmAnd for navigation.
Even Librera can read out loud any ebook.

So the ShiftPhone 8 makes any epub an audiobook with just privacy friendly open-source software.
Need better voices, but it's absolutely usable.
 
  • Like
Reaktionen: daho86
SherpaTTS benutze ich auch.
Leider kann ich in der App nicht die Einstellungen öffnen. Die App stürtz dabei ab.
Im Shift-OS L kann ich Einstellung/System/Sprachen/Sprachausgabe nicht öffnen. SystemApp stützt ab.
Selbst Dicio kann nur schriftlich antworten.
Ist diese Funktion noch nicht implementiert?
 
Ich kann im OS-L die Einstellungen öffnen und von dort aus mit dem Zahnrad in die Einstellungen von SherpaTTS kommen. Dicio scheint auch zu funktionieren und spricht mit mir.
 
  • Like
Reaktionen: Osrik
Moin, habe es jetzt auch hinbekommen.
SherpaTTS deinstalliert, Sherpa neu installiert.
Danach bin ich direkt in die Einstellungen vom phone und hab dort Sherpa ausgewählt.
Sherpa öffnet sich und will das Sprachmodell laden. Jetzt gehts, aber alle anderen Wege haben immer zum Absturz der App geführt.
Endlich talkt mein Phone mit mir. 😁
 
Ich habe Sherpa TTS ebenfalls beim Wechsel auf ShiftOS - L getestet ,da mir eine Open Source Lösung sehr gut gefallen würde .
Leider ist die Handybedienung mit TalkBack und Sherpa als Sprachmodul (noch) nicht wirklich zu gebrauchen.
Zu vieles wird nicht erkannt bzw. vorgelsen (ich höre z. B. auf dem Homescreen oder der Übersicht ,dass eine App ausgewählt/markiert wird ,aber bei vielen Apps wird nicht einmal der Name gesagt.
Wenn etwas vorgelesen wird ,dann mit sehr großer Verzögerung.

Der Ansatz von Sherpa TTS ist aber vielversprechend und ich hoffe ,dass es irgendwann zu einer zuverlässigen und stabilen open source Alternative wird.
 
Ja, so richtig geil ist das noch nicht.
Bei mir liest Sherpa meist nur den ersten Satz und bei Punkt und Komma sind ewig lange Pausen.

Wie startet ihr Dicio? Ich bekommen es weder auf den home button, noch auf den cutom key.
Wake Word geht bei mir echt schlecht.
Nervt erst die App öffnen und dann auf das mic. drücken. Da gibt es doch bestimmt eine feinere Lösung für...
 
Das hab ich auch bemerkt da ich die deutschsprachigen Module (glaub ich) alle durchgetestet hab.
Die Verzögerung wäre auch hinnehmbar (ich hab's meist ja noch eilig 😅)

Aber da echt sehr vieles garnicht gelesen wird ,ist es (für mich) derzeit noch nicht verwendbar.