USB микрофон конечно-же я бы такой не советовал. Надо что-то сильно получше. Так-же для уменьшение задержек от команды до исполнения (у меня это 6 секунд). Надо сервер как можно мощнее.
Распознавание голоса выполнено с помощью 4рех дополнений: Whisper, Piper, openWakeWord и Assist Microphone. С этими настройками управление голосом активируется по фразе.