A rápida evolução das tecnologias de inteligência artificial (IA) generativas, como a utilizada no ChatGPT, tem impulsionado a tendência de incorporar interfaces de voz e IA nos aplicativos, transformando a maneira como interagimos com a tecnologia.
Assistentes virtuais populares, como Alexa, Google Assistant e Siri, também têm desempenhado um papel fundamental na popularização dessas interfaces de voz.
As primeiras implementações dessas tecnologias, porém, muitas vezes decepcionaram os usuários devido à sua incapacidade de entender adequadamente o contexto e fornecer respostas precisas.
No entanto, com o avanço das tecnologias de inteligência artificial generativas e processamento de linguagem natural (NLP), a interação por voz se tornou mais sofisticada e precisa, podendo tornar a experiência do usuário muito satisfatória.
A popularidade do aplicativo de mensagens WhatsApp, especialmente no Brasil, aumentou consideravelmente após a introdução da funcionalidade de mensagens de voz.
O envio de áudios permite que os usuários se comuniquem de forma rápida e natural, sem a necessidade de digitar mensagens.
Isso é particularmente importante no país, onde a população em geral pode enfrentar dificuldades de interpretação de textos devido ao baixo nível da média de escolaridade.
O projeto Copilot da Microsoft já está sendo usado dentro do Office 365, facilitando a interação com aplicativos como Word, Excel e PowerPoint por meio de comandos de voz.
O usuário pode pedir ao Copilot para formatar um documento no Word, criar gráficos no Excel ou adicionar uma transição específica no PowerPoint.
IA nas empresas
Essa abordagem pode ser estendida para aplicativos de gestão empresarial, onde o Copilot poderia ser usado para ajudar os profissionais a acessar informações e executar tarefas específicas apenas usando comandos de voz.
Por exemplo, um usuário poderia perguntar: “Quais foram as vendas totais no último trimestre?” e o sistema forneceria as informações solicitadas, sem a necessidade de navegar pelos menus e relatórios.
Um aplicativo que poderia se beneficiar da interação por voz é o de busca de restaurantes.
Usando comandos de voz, os clientes poderiam solicitar ao aplicativo para encontrar um prato específico em um restaurante com boa reputação.
Por exemplo, um usuário poderia dizer: “Encontre um restaurante que sirva lasanha vegetariana, que custe menos de 70 reais e tenha pelo menos quatro estrelas”.
Graças ao avanço dessas tecnologias, o sistema seria capaz de entender o contexto da solicitação e fornecer resultados relevantes.
Essa evolução rápida na comunicação homem-máquina permite uma experiência de usuário mais intuitiva, natural e eficiente, já que as pessoas podem conversar com aplicativos e solicitar informações ou executar tarefas específicas usando apenas a voz.
Isso elimina barreiras e dificuldades que muitas vezes surgem ao usar interfaces baseadas em texto ou toque, melhorando a acessibilidade e a inclusão digital.