Trigger Start Sound zum Google AIY Voice Kit hinzufügen - Gunook
Trigger Start Sound zum Google AIY Voice Kit hinzufügen - Gunook
Anonim
Image
Image
Schritt 2: Sehen Sie sich die Datei Voicehat.py an, um weitere Informationen zu erhalten
Schritt 2: Sehen Sie sich die Datei Voicehat.py an, um weitere Informationen zu erhalten

Dieses Tutorial ist ziemlich einfach. Ich habe das Google AIY Voice Kit wirklich genossen, aber wie bei meinem normalen Google Home ist das Geräusch, das sie machen, um zu bestätigen, dass sie aktiv zuhören. Dies ist in keinem der Beispiele, die auf dem AIY Voice Kit-Image vorinstalliert sind, standardmäßig eingerichtet.

Ich füge auch einen Link zu den Standard-Start- und Bestätigungsgeräuschen bei, die ich mit meinem Zoom-Recorder von meinem tatsächlichen Google Home aufgenommen habe.

Hier gehen wir - mein erstes instructable!

Schritt 1: Erforderliche Materialien und Dateien

  1. Voll funktionsfähiges Google AIY Voice Kit – um Ihr Kit einzurichten, besuchen Sie die offizielle AIY Voice Kit-Seite.
  2. Möglichkeit, über SSH, VNC oder mit einem Monitor und einer Tastatur auf das Terminal Ihres Pi zuzugreifen
  3. .wav-Datei, die Sie abspielen möchten, wenn Pi auf Spracheingaben hört - Wenn Sie keine benutzerdefinierte Datei verwenden, laden Sie die Standarddatei "Start Talking" hier herunter oder laden Sie sie vom beigefügten Link herunter.
  4. (Optional) Audio-Editor, der Dateien konvertieren und deren Bit- und Abtastrate ändern kann

Schritt 2: Schritt 2: Sehen Sie sich die Datei Voicehat.py an, um weitere Informationen zu erhalten

WICHTIG

Ich verwende nicht das neueste Bild in meinem Voice-Kit, das den Code sowohl für das Voice- als auch für das Vision-Kit enthält (d. h. aiyprojects-2018-01-03.img). Ich verwende den Code aus dem Voice Kit-Zweig, der auf dem Google AIY Raspbian GitHub zu finden ist. Meine persönliche Meinung ist, einfach den Voice-Kit-Zweig zu verwenden, um es einfach zu halten und sich nicht mit dem Vision-Code beschäftigen zu müssen, wenn Sie mit Ihrem Voice-Kit arbeiten

Weiter gehts…

Dieser Schritt ist nicht unbedingt obligatorisch, aber er zeigt Ihnen, wo Google die Anweisungen zum Funktionieren vergraben hat, wenn Sie noch einen Schritt weiter gehen oder verstehen möchten, warum der Code, den ich hinzufüge, funktioniert.

pi@raspberry: cd AIY-voice-kit-python/src/aiy/

Dann werden wir die Datei voicehat.py in diesem Ordner auschecken:

pi@raspberry: ~/AIY-voice-kit-python/src/aiy/sudo nano voicehat.py

Das angehängte Bild zeigt, wo Sie sich über Status-UIs und die Verwendung eines Sounds während des Triggers informieren können.

In Ordnung, jetzt fügen wir einer der Beispieldateien etwas Code hinzu, damit das Ding funktioniert.

Schritt 3: Schritt 3: Trigger-Soundcode zum Demo-Code hinzufügen

Schritt 3: Trigger-Soundcode zum Democode hinzufügen
Schritt 3: Trigger-Soundcode zum Democode hinzufügen

Navigieren Sie zunächst zum Ordner AIY-voice-kit-python und führen Sie den Quellcode aus

CD AIY-Voice-Kit-Python

source env/bin/activate

cd src

Verwenden Sie dann 'sudo nano' entweder in 'assistant_grpc_demo.py' oder 'assistant_library_demo.py'

Der Unterschied zwischen den beiden Dateien besteht darin, dass Assistant_grpc_demo.py die Schaltfläche zum Auslösen von Google Assistant verwendet und Assistant_library_demo.py das Aktivierungswort "Ok, Google" verwendet, um den Google Assistant auszulösen.

Für diese beiden Dateien müssen Sie nur EINE Codezeile hinzufügen:

status_ui.set_trigger_sound_wave('/home/pi/googlestart.wav')

Dies setzt voraus, dass Sie Ihren Startsound im Ordner /home/pi/ abgelegt und ihn googlestart.wav genannt haben. Ändern Sie diese basierend auf dem Namen Ihrer Datei und dem Ort, an dem Sie sie gefunden haben.

Die gesuchte Codezeile ist unten:

status_ui.status('hören')

Wir möchten unsere neue Codezeile VOR dieser Codezeile hinzufügen…

Für das Beispiel 'assistant_library_demo.py' finden Sie es hier:

elif event.type == EventType. ON_CONVERSATION_TURN_STARTED:

# Und jetzt fügen Sie unseren Code hinzu status_ui.set_trigger_sound_wave('home/pi/googlestart.wav') status_ui.status('listening')

Für das Beispiel 'assistant_grpc_demo.py' finden Sie es hier:

button.wait_for_press()

# Und jetzt fügen Sie unseren Code hinzu status_ui.set_trigger_sound_wave('/home/pi/googlestart.wav') status_ui.status('listening')

Dies setzt voraus, dass Sie Ihren Startsound im Ordner /home/pi/ abgelegt und ihn googlestart.wav genannt haben. Ändern Sie diese basierend auf dem Namen Ihrer Datei und dem Ort, an dem Sie sie gefunden haben.

Drücken Sie STRG-X & Y, um alles zu speichern.

***HINWEIS: Ich habe etwas albernes gefunden. Für die 'assistant_library_demo.py' scheint das Hinzufügen des Triggersounds keinen Unterschied in der Funktion der Spracherkennung zu machen. Für die 'assistant_grpc_demo.py' scheint es jedoch, wenn Sie den Trigger-Sound implementiert haben, das erste oder die ersten Wörter, die Sie sagen, abgeschnitten. Nicht ganz sicher warum. Versuche es immer noch herauszufinden.

Schritt 4: Schritt 4: Führen Sie den Code aus und stellen Sie sicher, dass alles in Ordnung ist

pi@raspberry: cd AIY-voice-kit-python

und lade virtualenv. hoch

pi@raspberry:~/AIY-voice-kit-python $ source env/bin/activate

und führe es aus!

(env) pi@raspberry:~/AIY-voice-kit-python $ src/assistant_library_demo.py

oder

(env) pi@raspberry:~/AIY-voice-kit-python $ src/assistant_grpc_demo.py

Sagen Sie jetzt "Okay, Google" oder drücken Sie diese Taste und sehen Sie, ob es funktioniert!

Die nächste Seite hilft Ihnen, wenn Sie Ihre eigene benutzerdefinierte Datei und die entsprechenden Bit- und Abtastraten für Ihre.wav-Datei haben

Schritt 5: Schritt 5: Erstellen Sie Ihre eigene.wav-Datei

Schritt 5: Erstellen Sie Ihre eigene.wav-Datei
Schritt 5: Erstellen Sie Ihre eigene.wav-Datei

Wenn Sie meine WAV-Datei des standardmäßigen Google Home-Startsounds nicht verwenden möchten, müssen Sie Ihre eigene WAV-Datei erstellen. Es dauerte ein wenig Versuch und Irrtum, um die richtige Bit- und Abtastrate für mich zu finden.

Ich habe Logic Pro X für alle meine Bearbeitungen (im Bild) verwendet, eine vollwertige DAW zum Erstellen und Produzieren von Musik. Zwei Optionen, die ich gefunden habe, die geeignet sein könnten, sind Switch oder MediaHuman Audio Converter. Ich nehme an, Sie könnten dies mit Garageband tun, wenn Sie einen Mac haben, aber ich habe das nicht ausprobiert.

Es gibt drei wichtige Teile Ihrer Datei, die benötigt werden, damit sie mit dem Democode funktioniert.

  1. Muss eine MONO-Audiodatei sein
  2. Die Abtastrate muss 32000. betragen
  3. Muss eine.wav-Datei sein
  4. (Optional) 16-Bit-Auflösung hat für mich am besten funktioniert

Schritt 6: Schritt 6: Bestätigungston hinzufügen?

Hier stecke ich fest, falls jemand irgendwelche Gedanken hat. Ich würde gerne das Bestätigungsgeräusch hinzufügen, wenn das System die Spracheingabe wie bei einem normalen Google Home erkennt.

Ich habe das Lagerbestätigungsgeräusch unten für Ihre Bequemlichkeit angehängt.

Genießen!