Melhorias no WebAssembly e WebGPU para IA para Web mais rápida
Saiba como o WebAssembly e WebGPU estão evoluindo com extensões de baixo nível que aceleram a inferência de IA na Web.
Melhorias no WebAssembly e WebGPU para IA para Web mais rápida
Saiba como o WebAssembly e WebGPU estão evoluindo com extensões de baixo nível que aceleram a inferência de IA na Web.
Melhorias no WebAssembly e WebGPU para IA para Web mais rápida
Executar inferências de IA diretamente nas máquinas dos clientes reduz a latência, melhora a privacidade ao manter todos os dados com o cliente e economiza custos com servidor. Para acelerar essas cargas de trabalho, o WebAssembly e WebGPU estão evoluindo para incorporar novos itens primitivos de baixo nível. Saiba como essas novas adições desbloqueiam recursos de hardware rápido para acelerar significativamente inferências de IA e habilitar bibliotecas e frameworks de inferências altamente ajustadas para executar de modo eficiente modelos grandes de IA.
Intermediário
Sessão técnica