Embora streamers e criadores de conteúdo tenham descoberto maneiras acessíveis e convenientes de adicionar legendas e dublagens para conteúdo de vídeo sob demanda (VOD), fazer isso para transmissão ao vivo tem sido um grande desafio, principalmente porque os fluxos de trabalho de transmissão ao vivo são complexos e os métodos tradicionais, incluindo codificadores de hardware, são caros e inacessíveis.
Entre os desenvolvimentos do SyncWords e da IA, você terá uma tecnologia avançada e patenteada de ponta para gerar legendas, legendas e dublagens de voz precisas em tempo real e injetá-las em transmissões ao vivo com uma latência muito baixa de alguns segundos. Além disso, com os modernos protocolos de streaming de HLS (transmissão ao vivo HTTP), há suporte a idiomas em todos os idiomas disponíveis. Este é um divisor de águas para a transmissão ao vivo, incluindo esportes ao vivo, notícias e eventos corporativos e governamentais ao vivo, que podem ser transmitidos para o público global nos idiomas de sua escolha.
Tendo arrecadado 2 milhões de dólares em financiamento inicial, Ash pretende tornar a tecnologia da SyncWords onipresente para que a maior parte da transmissão ao vivo contenha legendas e traduções ao vivo, democratizando o conteúdo de vídeo ao vivo para o público mundial.
P: Você pode descrever a oportunidade de mercado que a SyncWords está buscando? Quais são os pontos problemáticos que você está resolvendo para seus clientes?
A: Há mais de 200 bilhões de horas de transmissão ao vivo acontecendo todos os anos, e apenas uma pequena porcentagem delas tem legendas ao vivo ou traduções de voz — dublagens. Estamos falando de transmissão ao vivo de esportes, notícias, jogos e eventos. Mais de 10% da população mundial é surda ou tem deficiência auditiva, e mais de 80% da população global entende muito bem inglês e, portanto, temos um problema. Além disso, os Estados Unidos, o Canadá, a Austrália, a União Europeia e um número crescente de países estão exigindo a acessibilidade ao vídeo. Portanto, esse é um problema não resolvido desde o início do streaming de vídeo. Estimamos que a tradução de vídeos pode aumentar o tamanho do público em 5 vezes. Portanto, as empresas de streaming de vídeo estão levando a localização de vídeo muito a sério.
O conteúdo ao vivo precisa ser legendado e traduzido em tempo real, com legendas e dublagens inseridas no vídeo ao vivo. Ao contrário do conteúdo VOD, que é baseado em arquivos, a transmissão ao vivo apresenta desafios de fluxo de trabalho muito maiores, tornando o problema difícil de resolver. As soluções atuais para legendas ao vivo incluem codificadores de hardware e legendadores humanos, ambos caros e difíceis de gerenciar. Nenhuma empresa conseguiu decifrar o código, até que a SyncWords resolveu o problema com sua plataforma inovadora.
P: Sua empresa já fez alguns pivôs antes, o que há de especial nesse pivô?
A: Na era da IA, as empresas precisam se adaptar para sobreviver e, se você mudar com rapidez suficiente, isso pode gerar uma enorme vantagem técnica para sua empresa. O perigo está em usar a IA para se tornar outro produto “eu também”. E isso pode acontecer se uma empresa entrar em um mercado competitivo em que muitos produtos similares já estão disponíveis.
Quando formamos a SyncWords, nosso produto na época eram legendas e legendas para vídeo sob demanda, que era um mercado competitivo e, embora tivéssemos uma tecnologia inovadora para automatizar o processo, era um mercado competitivo. Também desenvolvemos um produto para transcrever eventos ao vivo em tempo real na forma de legendas e traduções de widgets. Sem dublagens ao vivo naquele momento, apenas texto. E durante o COVID, tudo parecia vender, até mesmo essas legendas de widgets. Você pode ver que adquirimos ótimos logotipos de clientes durante o COVID.
No entanto, é claro, 99% dos nossos clientes preferiram ver legendas e dublagens de áudio dentro de um player de vídeo, e não fora de um widget. Meus colegas cofundadores, Alex Dubinsky e Sam Cartsos, também perceberam isso e, em 2022, decidimos criar uma plataforma de legendas e dublagens ao vivo para streaming de vídeo. Lançamos a plataforma em dezembro de 2023 e, a partir daí, contratamos vários novos clientes. Surpreendentemente, iniciamos nossa empresa na maior parte do desenvolvimento de produtos usando as receitas de nosso produto legado. Até o momento, garantimos 2 milhões de dólares em financiamento inicial e pretendemos levantar uma nova rodada depois de atingirmos determinadas marcas, que estamos confiantes de cumprir, dada a demanda e os novos negócios da nova plataforma.
P: Quais foram os principais fatores que contribuíram para resolver com sucesso um problema tecnológico desafiador?
A: Claramente, é um grande desafio desenvolver software para resolver um problema desafiador, especialmente um que foi tentado sem sucesso por outras empresas. Ficou muito claro para nós que o setor precisava dessa solução. Deixe-me dizer o que torna o problema altamente desafiador. Primeiro, você está lidando com protocolos de transmissão ao vivo, muito diferentes do formato baseado em arquivo para vídeo sob demanda, o que torna muito mais difícil trabalhar com eles. Não há código-fonte aberto disponível para o Live, portanto, tivemos que criar tudo internamente no SyncWords.
O aspecto principal de nossa abordagem foi nossa arquitetura. A adoção de uma arquitetura escalável do Kubernetes baseada em nuvem foi essencial. Também éramos maníacos em relação à experiência do usuário e à precisão de nossas saídas de legendas e dublagens, que são geradas pela IA e produzem 94% de precisão em nossos principais pares de idiomas com muitos recursos. A precisão das traduções por IA continua aumentando, e esperamos que mais pares de idiomas entrem na zona de alta precisão em 2024. Também não reinventamos as modalidades de IA e usamos os melhores fornecedores de IA de reconhecimento de voz e tradução para gerar uma solução altamente precisa para nossos clientes.
E, finalmente, a equipe da SyncWords é composta por pessoas com diversas experiências em tecnologia — transmissão ao vivo, vídeo, inteligência artificial, legendas e voz, o que foi fundamental para resolver o problema. As principais contribuições de Alex para o produto nos permitiram criar uma oferta exclusiva com foco em legendas e dublagens de baixa latência e escalabilidade usando o Kubernetes. A maioria da equipe é formada por nossos engenheiros e estamos adicionando mais pessoas às vendas e ao marketing.
P: Quais são os destaques exclusivos da sua tecnologia?
A: A SyncWords não está apenas acompanhando o ritmo; estamos liderando legendas e traduções ao vivo para transmissões e eventos.
Protocolos de streaming prontos para o futuro: Embora o RTMP (S) tenha sido fundamental, o futuro gira em torno dos protocolos HLS e SRT. O SyncWords suporta todos eles, tornando sua transmissão ao vivo mais ágil e escalável. O SRT (Secure Reliable Transport) é um protocolo de streaming mais recente que está rapidamente ganhando popularidade entre emissoras e plataformas OTT.
Magia e variedade de voz em vários idiomas: Imagine legendar em mais de 50 idiomas e traduzir para mais de 100 idiomas em minutos, mesmo durante transmissões ao vivo simultâneas. Além disso, você pode escolher entre 900 vozes diferentes, incluindo sotaques regionais, para uma dublagem ao vivo automatizada que é verdadeiramente inclusiva. O SyncWords supera as barreiras linguísticas, tornando a comunicação global perfeita e instantânea.
Integração perfeita: O SyncWords se encaixa perfeitamente no seu fluxo de trabalho atual de transmissão ao vivo sem precisar de alterações no software. A solução também é totalmente compatível com AWS Elemental MediaPackage, MediaLive e MediaConnect, e somos os únicos no mercado a oferecê-los.
Especificações técnicas de alto nível: Acertamos o essencial para transmissão ao vivo: suporte para codecs UHD e HAVC, baixa latência, PIDs, canais de áudio e recursos de API. Portanto, nossa solução baseada em nuvem garante que você esteja pronto para uma programação ao vivo 24 horas por dia, 7 dias por semana, inclusive e operacionalmente perfeita.
P: A demanda por legendas e traduções ao vivo continuará crescendo?
A: Com certeza, e aqui está o porquê. Primeiro, a quantidade de conteúdo de vídeo ao vivo está subindo rapidamente. Mais transmissões ao vivo significam mais necessidade de legendas e traduções. Em segundo lugar, novas regras de acessibilidade e inclusão estão pressionando os provedores de transmissão ao vivo a intensificarem seu jogo. Eles precisam atender a esses padrões ou enfrentar muitas pesadas. E, por fim, é o que os espectadores querem. As pessoas desejam uma experiência de visualização mais envolvente e inclusiva.
Além disso, a influência de plataformas como Netflix, Amazon Prime e Hulu não pode ser ignorada. Eles estabeleceram um padrão alto com sua ampla variedade de opções de idioma para legendas, legendas e dublagem de áudio. Agora, os espectadores esperam a mesma flexibilidade para a programação ao vivo. Então, sim, a demanda definitivamente continuará crescendo, e a SyncWords será uma grande beneficiária desse rápido crescimento.