Crie um Aplicativo de IA Ativado por Voz com a Web Speech API
Aprenda a construir um aplicativo web que transcreve voz, interage com IA e exibe respostas em tempo real.

Crie um Aplicativo de IA Ativado por Voz com a Web Speech API
27 de março de 2026
A Web Speech API é uma ferramenta poderosa que permite que aplicativos web utilizem o som como dado, abrindo um leque de possibilidades para interações inovadoras. Com ela, é possível transcrever a fala em tempo real e até mesmo sintetizar voz a partir de texto, criando experiências de usuário mais intuitivas e acessíveis. Este artigo guiará você na construção de um aplicativo web completo que aceita entrada de áudio, transcreve a fala, interage com um agente de IA e exibe as respostas na interface do usuário.
O que você aprenderá
Ao longo deste guia, você aprenderá a:
- Utilizar a API SpeechRecognition para capturar e transcrever a voz do usuário.
- Criar um backend que se comunica com um assistente de IA de sua escolha.
- Integrar o frontend e o backend para uma experiência completa de voz para texto e resposta de IA.
- Opcionalmente, implantar o frontend e o backend para que seu aplicativo esteja acessível a todos.
Entendendo a Web Speech API
A Web Speech API é composta por dois componentes principais:
- SpeechRecognition: Responsável por capturar o áudio, reconhecer a fala e transcrevê-la em texto.
- SpeechSynthesis: Responsível por converter texto em fala, permitindo que o aplicativo "responda" verbalmente.
Neste guia, focaremos no componente SpeechRecognition. Ele funciona através de um objeto JavaScript que você instancia em seu código. Esse objeto possui diversos eventos e propriedades que permitem configurar e controlar o processo de reconhecimento de fala.
Como o Aplicativo Funciona
O aplicativo que construiremos capturará o áudio do microfone do usuário, transcrevendo-o em texto com a Web Speech API. Esse texto será então enviado ao backend, que utilizará um agente de IA para gerar uma resposta. A resposta da IA será enviada de volta ao frontend, onde será exibida ao usuário.

Precisa de uma solução completa para integrar IA em seus aplicativos? Conheça a Toolzz AI e simplifique o desenvolvimento com nossa plataforma robusta.
Construindo o Aplicativo
O processo de construção será dividido em duas partes: o backend (Node.js) e o frontend (Vite).
Criando o Backend com Node.js
Primeiro, crie um diretório para o backend e inicialize um projeto Node.js com npm init -y. Em seguida, instale as dependências necessárias, incluindo um pacote para interagir com a API do seu assistente de IA preferido. Neste exemplo, utilizaremos o Google Gemini.
bash npm install @google/genai
Crie um arquivo index.js com o seguinte código:
javascript import http from 'node:http'; import { GoogleGenAI } from '@google/genai';
const ai = new GoogleGenAI({ apiKey: 'SUA_CHAVE_API_AQUI' });
const server = http.createServer(async (req, res) => { if (req.method === 'POST') { let body = ''; req.on('data', (chunk) => body += chunk); req.on('end', async () => { try { const { prompt } = JSON.parse(body); const response = await ai.models.generateContent({ model: 'gemini-1.5-pro-latest', contents: prompt }); res.writeHead(200, { 'Content-Type': 'application/json' }); res.end(JSON.stringify({ response: response.text })); } catch (error) { console.error(error); res.writeHead(500, { 'Content-Type': 'text/plain' }); res.end('Erro ao processar a solicitação.'); } }); } else { res.writeHead(405, { 'Content-Type': 'text/plain' }); res.end('Método não permitido.'); } });
const port = process.env.PORT || 8000;
server.listen(port, () => {
console.log(Servidor rodando na porta ${port});
});
Criando o Frontend com Vite
Agora, crie um diretório para o frontend e inicialize um projeto Vite com npm create vite@latest.
bash npx create-vite frontend --template react cd frontend npm install
Substitua o conteúdo do arquivo src/App.js pelo seguinte código:
javascript import React, { useState } from 'react';
function App() { const [transcript, setTranscript] = useState(''); const [response, setResponse] = useState('');
const handleRecognitionResult = (event) => { setTranscript(event.results[0][0].transcript); };
const sendMessage = async () => { try { const res = await fetch('http://localhost:8000', { method: 'POST', headers: { 'Content-Type': 'application/json', }, body: JSON.stringify({ prompt: transcript }), }); const data = await res.json(); setResponse(data.response); } catch (error) { console.error(error); setResponse('Erro ao enviar a mensagem.'); } };
return (
Aplicativo de IA por Voz
<button onClick={() => { const recognition = new webkitSpeechRecognition() || new SpeechRecognition(); recognition.lang = 'pt-BR'; recognition.interimResults = false; recognition.onresult = handleRecognitionResult; recognition.start(); }}>FalarTranscrição: {transcript}
Resposta da IA: {response}
export default App;
Testando o Aplicativo Localmente
Execute o backend com node index.js e o frontend com npm run dev. Abra o navegador em http://localhost:3000 e comece a testar o seu aplicativo de IA ativado por voz.
Quer simplificar a integração da IA no seu negócio?
Solicitar demonstraçãoIntegração com a Toolzz
Plataformas como a Toolzz AI facilitam a criação e o gerenciamento de agentes de IA personalizados. Com a Toolzz, você pode integrar diferentes modelos de linguagem, como o Gemini, em seus aplicativos, sem precisar se preocupar com a complexidade da infraestrutura. Além disso, a Toolzz oferece recursos avançados para monitorar e otimizar o desempenho de seus agentes, garantindo a melhor experiência para seus usuários. Se você busca uma solução completa e escalável para impulsionar sua estratégia de IA, a Toolzz é a escolha ideal.
Conclusão
Neste guia, você aprendeu a construir um aplicativo web que utiliza a Web Speech API para transcrever voz, interagir com um agente de IA e exibir as respostas. Este é apenas o começo do que você pode alcançar com a combinação de tecnologias web e inteligência artificial. A automação de tarefas, a criação de interfaces de voz intuitivas e a personalização da experiência do usuário são apenas algumas das possibilidades.
Com a Toolzz AI, você pode levar suas soluções de voz e IA para o próximo nível, criando aplicativos inovadores e impactantes para seus clientes e usuários. A plataforma oferece uma ampla gama de recursos e ferramentas para simplificar o desenvolvimento, a implantação e o gerenciamento de seus agentes de IA.
Explore as possibilidades da inteligência artificial e transforme a maneira como você interage com o mundo digital!
Configuração do ToolzzVoice
Veja como configurar agentes de voz e ligações telefônicas com IA no Toolzz Voice.















