Portugal
Breadcrumb navigation
NEC utiliza IA generativa (LLM) e IA de reconhecimento de vídeo para gerar automaticamente texto explicativo a partir de vídeo
- Aplicado a vídeos de imagens de condução, reduz para metade o tempo de geração de relatórios de acidentes –
Lisboa, 09 de janeiro, 2024 – A NEC Corporation (NEC; TSE: 6701) desenvolveu a primeira tecnologia a nível mundial (*1) que integra um modelo Large Language (LLM) de IA generativa e IA de reconhecimento de vídeo, de modo a produzir de forma automática vídeos mais curtos, com texto explicativo, a partir de vídeos longos.
Ao analisar vídeos de imagens de condução com esta tecnologia, é possível gerar automaticamente texto e vídeos mais curtos que explicam as circunstâncias de um acidente e como este ocorreu. Com base no texto e no vídeo, pode ser criado de forma automática um relatório de investigação do acidente, num formato adequado para pedidos de indemnização de seguros de não vida e instruções de segurança rodoviária. A NEC planeia disponibilizar uma versão experimental desta tecnologia em março de 2024.

Captura de ecrã de demonstração desta tecnologia (*2)
Contextualização
Nos últimos anos, o vídeo tem sido cada vez mais utilizado para efeitos de gestão da segurança e eficiência operacional numa variedade de indústrias, incluindo transportes, logística, fabrico, construção e retalho. Contudo, é necessário alocar um grande número de horas para verificar manualmente vídeos longos e criar relatórios sobre potenciais acidentes e áreas a melhorar. Apesar de se ter tornado possível gerar um texto explicativo para imagens fixas através da IA generativa (imagem-para-texto), tem sido difícil aplicar essas tecnologias de imagem-para-texto a vídeos que contenham cenas complexas, constituídas por vários objetos e ambientes e que mudam ao longo do tempo.
Características da Tecnologia
Processo de análise usando a tecnologia
- 1.Encontrar cenas de forma eficiente e criar relatórios com maior rapidez
A combinação de IA de reconhecimento de vídeo e LLM permite compreender cada cena de um vídeo. Especificamente, mais de 100 algoritmos de IA de reconhecimento de vídeo são aplicados para reconhecer, de forma individual, os vários objetos e ambientes que compõem uma cena, tais como pessoas, carros, edifícios, animais, árvores e outros elementos naturais, e também o clima, assim como as alterações de todos esses elementos. Ao utilizar o LLM para analisar apenas os resultados do reconhecimento, os utilizadores podem encontrar a cena que procuram de forma mais eficiente do que ao analisar um vídeo inteiro, eliminando a necessidade de verificar repetidamente um vídeo.
- 2.Interpretação exata do contexto do vídeo para gerar relatórios de qualidade pericial
Para melhorar a qualidade do texto gerado, o LLM é pré-ajustado utilizando amostras de vídeos de um domínio específico. Por exemplo, quando aplicado a vídeos de imagens de condução, vídeos relacionados com tráfego rodoviário são previamente analisados. Isto dá ao LLM a experiência necessária para compreender corretamente o que aconteceu no vídeo. Como resultado, é possível criar relatórios altamente fiáveis, ao mesmo tempo que se aborda a alucinação (*3), que tem sido um problema em termos de precisão da IA generativa.
- 3.Gerar relatórios em segundos sem grandes recursos informáticos
Esta tecnologia pode criar um vídeo de uma cena desejada e um texto explicativo em poucos segundos a partir de um vídeo com mais de uma hora de duração. Para o conseguir, a NEC integrou um LLM compacto e de elevado desempenho e um sistema de leitura de dados de alta velocidade desenvolvido pela própria empresa.
Resultados de Validação
A NEC verificou esta tecnologia num caso de uso de criação de relatórios de investigação de acidentes a partir de vídeos de imagens de condução. Como resultado, ao automatizar a pesquisa de acidentes e as cenas que os causaram, bem como a criação de rascunhos de relatórios, que anteriormente eram feitos manualmente, o tempo necessário para criar os relatórios foi reduzido para metade.
Desenvolvimentos Futuros
Em março de 2024, a NEC planeia começar a disponibilizar uma versão experimental desta tecnologia a companhias de seguros de não vida e fabricantes de automóveis para apoiar a preparação de relatórios de investigação de acidentes e outros documentos que utilizem vídeos de imagens de condução.
No futuro, esta tecnologia será implementada em vários casos de uso, incluindo apoio à criação de registos de enfermagem e cuidados, apoio à criação de registos de trabalho em locais de fabrico e construção, criação de texto explicativo a ser aprendido por IA para condução autónoma, bem como recolha de conteúdo específico para vídeos de transmissão e criação de guiões de locução.
***
- (*1)
À data de 5 de dezembro de 2023, de acordo com um inquérito de pesquisa.
- (*2)Fonte do vídeo: https://www.youtube.com/watch?v=YBbutvif1W8
- (*3)Alucinação: Um fenómeno em que a IA generativa produz informações incorretas num formato plausível.
Sobre a NEC Corporation
A NEC Corporation estabeleceu-se como líder na integração de tecnologias TI e de rede, promovendo a declaração de marca “Orquestrando um Mundo melhor.” A NEC permite que empresas e comunidades se adaptem às rápidas mudanças que estão a ter lugar na sociedade e no mercado, facultando os valores sociais de segurança, proteção, equidade e eficiência para promover um mundo mais sustentável onde todos tenham a possibilidade de atingir todo o seu potencial.
Para mais informações, visite a NEC em https://www.nec.com.

NEC é uma marca registada da NEC Corporation. Todos os Direitos Reservados. Outras marcas de produtos ou serviços aqui mencionadas são marcas dos seus respetivos donos. © NEC Corporation.