O CPQD está revolucionando o campo da síntese de fala com a solução I2, uma iniciativa que utiliza inteligência artificial generativa e machine learning para criar vozes com alto nível de naturalidade e personalização. A solução desenvolvida foi capaz de reduzir de seis meses para 15 dias o desenvolvimento de vozes digitais.
A nova tecnologia representa um marco na trajetória da organização, que estuda a síntese e os padrões de fala desde a década de 1990. Até pouco tempo atrás, o processo exigia a gravação em estúdio com locutores humanos e podia levar até seis meses para ser concluído.
Com o I2, esse prazo foi significativamente reduzido para apenas 15 dias, sem a necessidade de gravações presenciais. Além disso, a tecnologia é capaz de emular sotaques de determinadas regiões do país, o que inclui uso de gírias e ritmo de fala.
"O I2 combina nossa experiência histórica com o poder das tecnologias mais avançadas de IA. Isso nos permite atender com mais agilidade e precisão empresas que buscam vozes únicas para seus assistentes virtuais, serviços automatizados ou produtos com interface falada", explica Fernando Marino, gerente de Produtos da instituição.
Além do ganho de eficiência e escalabilidade, a tecnologia tem aplicações estratégicas para o mercado. Um exemplo é o setor bancário: a Lei 3.898/02 exige que os bancos disponibilizem ao menos um caixa eletrônico adaptado para pessoas com deficiência. O desafio está em assegurar compliance com a legislação brasileira, sem comprometer a experiência do cliente e a padronização do atendimento.
Nesse contexto, três dos maiores bancos do Brasil já adotaram a solução de Texto para Fala (TTS) do portfólio do I2 – sigla para Interação Inteligente –, garantindo acessibilidade, inclusão e uma experiência digna e personalizada para clientes com deficiência. A tecnologia permite que caixas eletrônicos e outros pontos de atendimento automatizado se comuniquem com clareza, naturalidade e respeito às necessidades do usuário. Ao todo, o CPQD possui mais de 28 mil licenças mensais para a síntese em tempo real.
As vozes geradas pelo I2 são treinadas a partir de amostras de áudio e texto, permitindo ajustes finos de entonação, ritmo e emoção, conforme a identidade de marca de cada cliente. O uso da IA Generativa também garante escalabilidade e flexibilidade, inclusive para aplicações que exigem atualizações constantes de conteúdo falado.
Fonte: TIInside (16/07/2025)

Nenhum comentário:
Postar um comentário
"Este blog não se responsabiliza pelos comentários emitidos pelos leitores, mesmo anônimos, e DESTACAMOS que os IPs de origem dos possíveis comentários OFENSIVOS ficam disponíveis nos servidores do Google/ Blogger para eventuais demandas judiciais ou policiais".