AI

音声認識

https://github.com/julius-speech/julius

インストール(ビルド)

sudo apt update
sudo apt upgrade -y
sudo apt-get install build-essential zlib1g-dev libsdl2-dev libasound2-dev
git clone https://github.com/julius-speech/julius.git
cd julius
CC=/usr/local/cuda/bin/nvcc CFLAGS=-O3 ./configure --enable-words-int --with-mictype=pulseaudio
# CUDA不要であれば、./configure より前は不要。
# Raspbery Pi 等で次のようなエラーがでるようであれば、
#  configure: error: cannot guess build type; you must specify one
# --build=aarch64 を付与する。
make -j4
ls -l julius/julius

日本語のモデル取得

https://github.com/julius-speech/dictation-kit/tree/master

設定

sudo apt install alsa-utils
sudo apt install pulseaudio
sudo gpasswd -a <USBマイクを使うユーザー> audio

以下、編集中

WSLの場合、直接 マイク、スピーカーは扱えないため、pulseaudio for windows で転送する。

Windows 側

WSL 側

/etc/pulse/client.conf に以下追記する。

default-server = tcp:localhost

/etc/pulse/default.pa の下記を有効にする。(元々コメントアウトされているので)

load-module module-native-protocol-tcp
トップ   一覧 検索 最終更新   ヘルプ   最終更新のRSS