Crie um Aplicativo de IA Ativado por Voz com a Web Speech API

Aprenda a construir um aplicativo web que transcreve voz, interage com IA e exibe respostas em tempo real.

Crie um Aplicativo de IA Ativado por Voz com a Web Speech API — imagem de capa Toolzz

Crie um Aplicativo de IA Ativado por Voz com a Web Speech API

Lucas Moraes (CEO Toolzz AI)
Lucas Moraes (CEO Toolzz AI)
27 de março de 2026

A Web Speech API é uma ferramenta poderosa que permite que aplicativos web utilizem o som como dado, abrindo um leque de possibilidades para interações inovadoras. Com ela, é possível transcrever a fala em tempo real e até mesmo sintetizar voz a partir de texto, criando experiências de usuário mais intuitivas e acessíveis. Este artigo guiará você na construção de um aplicativo web completo que aceita entrada de áudio, transcreve a fala, interage com um agente de IA e exibe as respostas na interface do usuário.

O que você aprenderá

Ao longo deste guia, você aprenderá a:

  • Utilizar a API SpeechRecognition para capturar e transcrever a voz do usuário.
  • Criar um backend que se comunica com um assistente de IA de sua escolha.
  • Integrar o frontend e o backend para uma experiência completa de voz para texto e resposta de IA.
  • Opcionalmente, implantar o frontend e o backend para que seu aplicativo esteja acessível a todos.

Entendendo a Web Speech API

A Web Speech API é composta por dois componentes principais:

  • SpeechRecognition: Responsável por capturar o áudio, reconhecer a fala e transcrevê-la em texto.
  • SpeechSynthesis: Responsível por converter texto em fala, permitindo que o aplicativo "responda" verbalmente.

Neste guia, focaremos no componente SpeechRecognition. Ele funciona através de um objeto JavaScript que você instancia em seu código. Esse objeto possui diversos eventos e propriedades que permitem configurar e controlar o processo de reconhecimento de fala.

Como o Aplicativo Funciona

O aplicativo que construiremos capturará o áudio do microfone do usuário, transcrevendo-o em texto com a Web Speech API. Esse texto será então enviado ao backend, que utilizará um agente de IA para gerar uma resposta. A resposta da IA será enviada de volta ao frontend, onde será exibida ao usuário.

Diagrama de fluxo do aplicativo

Precisa de uma solução completa para integrar IA em seus aplicativos? Conheça a Toolzz AI e simplifique o desenvolvimento com nossa plataforma robusta.

Construindo o Aplicativo

O processo de construção será dividido em duas partes: o backend (Node.js) e o frontend (Vite).

Criando o Backend com Node.js

Primeiro, crie um diretório para o backend e inicialize um projeto Node.js com npm init -y. Em seguida, instale as dependências necessárias, incluindo um pacote para interagir com a API do seu assistente de IA preferido. Neste exemplo, utilizaremos o Google Gemini.

bash npm install @google/genai

Crie um arquivo index.js com o seguinte código:

javascript import http from 'node:http'; import { GoogleGenAI } from '@google/genai';

const ai = new GoogleGenAI({ apiKey: 'SUA_CHAVE_API_AQUI' });

const server = http.createServer(async (req, res) => { if (req.method === 'POST') { let body = ''; req.on('data', (chunk) => body += chunk); req.on('end', async () => { try { const { prompt } = JSON.parse(body); const response = await ai.models.generateContent({ model: 'gemini-1.5-pro-latest', contents: prompt }); res.writeHead(200, { 'Content-Type': 'application/json' }); res.end(JSON.stringify({ response: response.text })); } catch (error) { console.error(error); res.writeHead(500, { 'Content-Type': 'text/plain' }); res.end('Erro ao processar a solicitação.'); } }); } else { res.writeHead(405, { 'Content-Type': 'text/plain' }); res.end('Método não permitido.'); } });

const port = process.env.PORT || 8000; server.listen(port, () => { console.log(Servidor rodando na porta ${port}); });

Criando o Frontend com Vite

Agora, crie um diretório para o frontend e inicialize um projeto Vite com npm create vite@latest.

bash npx create-vite frontend --template react cd frontend npm install

Substitua o conteúdo do arquivo src/App.js pelo seguinte código:

javascript import React, { useState } from 'react';

function App() { const [transcript, setTranscript] = useState(''); const [response, setResponse] = useState('');

const handleRecognitionResult = (event) => { setTranscript(event.results[0][0].transcript); };

const sendMessage = async () => { try { const res = await fetch('http://localhost:8000', { method: 'POST', headers: { 'Content-Type': 'application/json', }, body: JSON.stringify({ prompt: transcript }), }); const data = await res.json(); setResponse(data.response); } catch (error) { console.error(error); setResponse('Erro ao enviar a mensagem.'); } };

return (

Aplicativo de IA por Voz

<button onClick={() => { const recognition = new webkitSpeechRecognition() || new SpeechRecognition(); recognition.lang = 'pt-BR'; recognition.interimResults = false; recognition.onresult = handleRecognitionResult; recognition.start(); }}>Falar

Transcrição: {transcript}

Resposta da IA: {response}

); }

export default App;

Testando o Aplicativo Localmente

Execute o backend com node index.js e o frontend com npm run dev. Abra o navegador em http://localhost:3000 e comece a testar o seu aplicativo de IA ativado por voz.

Quer simplificar a integração da IA no seu negócio?

Solicitar demonstração

Integração com a Toolzz

Plataformas como a Toolzz AI facilitam a criação e o gerenciamento de agentes de IA personalizados. Com a Toolzz, você pode integrar diferentes modelos de linguagem, como o Gemini, em seus aplicativos, sem precisar se preocupar com a complexidade da infraestrutura. Além disso, a Toolzz oferece recursos avançados para monitorar e otimizar o desempenho de seus agentes, garantindo a melhor experiência para seus usuários. Se você busca uma solução completa e escalável para impulsionar sua estratégia de IA, a Toolzz é a escolha ideal.

Conclusão

Neste guia, você aprendeu a construir um aplicativo web que utiliza a Web Speech API para transcrever voz, interagir com um agente de IA e exibir as respostas. Este é apenas o começo do que você pode alcançar com a combinação de tecnologias web e inteligência artificial. A automação de tarefas, a criação de interfaces de voz intuitivas e a personalização da experiência do usuário são apenas algumas das possibilidades.

Com a Toolzz AI, você pode levar suas soluções de voz e IA para o próximo nível, criando aplicativos inovadores e impactantes para seus clientes e usuários. A plataforma oferece uma ampla gama de recursos e ferramentas para simplificar o desenvolvimento, a implantação e o gerenciamento de seus agentes de IA.

Explore as possibilidades da inteligência artificial e transforme a maneira como você interage com o mundo digital!

Configuração do ToolzzVoice

Veja como configurar agentes de voz e ligações telefônicas com IA no Toolzz Voice.

Más información sobre este tema

Resumen del artículo

Aprenda a construir um aplicativo web que transcreve voz, interage com IA e exibe respostas em tempo real.

Preguntas Frecuentes

O que é a Toolzz e como pode ajudar minha empresa?

A Toolzz é uma plataforma de inteligência artificial que oferece soluções de chatbots, agentes de voz, educação corporativa (LXP) e atendimento omnichannel. Com IA generativa, você automatiza atendimento, vendas e treinamento sem necessidade de programação.

Como a IA pode melhorar o atendimento ao cliente?

Chatbots com IA atendem 24/7, resolvem mais de 50% dos tickets automaticamente e qualificam leads. A Toolzz integra WhatsApp, Instagram e site em uma única plataforma, reduzindo tempo de resposta e custos operacionais.

Preciso saber programar para usar a Toolzz?

Não. A Toolzz oferece builders visuais no-code para criar chatbots, agentes de voz e fluxos de atendimento. Você configura tudo pela interface, sem escrever código.

A Toolzz integra com CRM e outras ferramentas?

Sim. A Toolzz integra nativamente com WhatsApp Business, Instagram, CRM, Zapier, Make e diversas ferramentas via API. Conecte sua IA ao ecossistema existente da sua empresa.

Quanto custa implementar soluções de IA com a Toolzz?

A Toolzz oferece planos a partir de R$299/mês para LXP e R$399/mês para chatbots. Os valores variam conforme o volume de conversas e funcionalidades. A implementação é rápida e não exige investimento inicial em infraestrutura.

O conteúdo deste artigo foi gerado por IA?

O blog da Toolzz utiliza IA para auxiliar na criação de artigos relevantes sobre tecnologia, automação e negócios. Todo conteúdo passa por revisão para garantir qualidade e precisão das informações.

Mais de 3.000 empresas em todo mundo utilizam nossas tecnologias

Bradesco logo
Itaú logo
BTG Pactual logo
Unimed logo
Mercado Bitcoin logo
SEBRAE logo
B3 logo
iFood logo
Americanas logo
Cogna logo
SENAI logo
UNESCO logo
Anhanguera logo
FDC logo
Unopar logo
Faveni logo
Ser Educacional logo
USP logo

Produtos e Plataformas

Ecossistema de soluções SaaS e Superapp Whitelabel

Plataforma de Educação Corporativa

Área de Membros e LMS whitelabel estilo Netflix

Teste 15 dias

Plataforma de Agentes de IA

Crie sua IA no WhatsApp e treine com seu conteúdo

Teste 15 dias

Crie chatbots em minutos

Plataforma de chatbots no-code

Teste 15 dias

Agentes de IA que fazem ligação

Plataforma de Agentes de Voz no-code

Teste 15 dias

Central de Atendimento com IA

Plataforma de suporte omnichannel

Teste 15 dias

Conheça o Toolzz Vibe

Plataforma de Vibecoding. Crie Automações e Apps com IA em minutos sem programar.

Criar conta FREE

Loja de Agentes de IA

Escolha entre nossos agentes especializados ou crie o seu próprio

Crie sua IA personalizada