O que é uma câmera AI e como funciona a edição de fotos AI?

A inteligência artificial (IA) está em toda parte, e se você ainda não tem um smartphone com IA, provavelmente terá em breve. Até o software do seu telefone usa IA para tomar decisões em seu nome. A câmera Photoshop da Adobe, recém-lançada, usa IA para identificar objetos e cenas em suas fotos e sugerir 'lentes' (efeitos digitais) para impacto criativo e cômico.

É tudo apenas arrogância de marketing ou a IA em um smartphone - e, particularmente, em sua câmera - é algo que todos devemos aspirar a ter? Com o termo IA cada vez mais sendo usado não apenas em telefones com câmera, mas em todos os tipos de câmeras, vale a pena saber o que a IA está realmente fazendo por suas fotos.

A IA turvou os limites entre captura de imagem, aprimoramento de imagem e manipulação de imagem. É usado na edição de fotos, para fundir, aprimorar e 'aumentar' a realidade, para fazer seleções de objetos mais inteligentes, para combinar os parâmetros de processamento com o assunto e para ajudá-lo a encontrar as imagens automaticamente com base no que está em suas fotos, em vez de palavras-chave manuais e descrições. Ele já está olhando para o que você fotografa e tomando suas próprias decisões sobre como lidar com isso.

Bem-vindo ao admirável mundo novo das câmeras de IA.

O que é IA?

IA é um gênero de ciência da computação que examina se podemos ensinar um computador a pensar ou, pelo menos, aprender. Geralmente é dividido em subconjuntos de tecnologia que tentam emular o que os humanos fazem, como reconhecimento de fala, ditado de voz para texto, reconhecimento de imagem e digitalização de rosto, visão computacional e aprendizado de máquina.

Existe todo um conjunto de palavras-chave em torno deste tópico. 'IA', 'aprendizado profundo', 'aprendizado de máquina' e 'redes neutras' estão todos interligados neste novo ramo da tecnologia.

O que isso tem a ver com câmeras? Fotografia computacional e edição de fotos que economiza tempo, é isso. E ativação por voz.

Câmeras ativadas por voz

A habilidade de um computador de entender a fala humana é uma forma de IA e tem se infiltrado nas câmeras nos últimos anos.

Os smartphones oferecem o Google Now e o Siri há alguns anos, enquanto o Alexa está entrando em casa por meio dos alto-falantes do Amazon Echo. As câmeras de ação entraram nesse movimento nos últimos anos, com as câmeras de ação GoPro e até mesmo câmeras de painel capazes de realizar ações quando você profere frases simples como 'iniciar vídeo', 'tirar foto' e assim por diante.

Tudo faz sentido, especialmente para câmeras de ação em que a operação viva-voz as torna muito mais fáceis de usar, mas é realmente IA? Tecnicamente, é, mas até recentemente os gadgets ativados por voz eram simplesmente chamados de 'inteligentes'. Alguns agora permitem que você diga coisas bastante específicas, como "fazer um vídeo em câmera lenta" ou "tirar uma foto com pouca luz", mas uma câmera AI precisa fazer um pouco mais do que isso para merecer o nome.

Software de IA

AI é sobre novos tipos de software, inicialmente para compensar a falta de lentes de zoom nos smartphones. “O software está se tornando cada vez mais importante para smartphones porque eles têm uma falta física de ótica, então vimos o surgimento da fotografia computacional que tenta replicar um zoom ótico”, disse o analista de imagens Arun Gill, analista de mercado sênior da Futuresource Consulting . “Smartphones de última geração estão cada vez mais apresentando câmeras de lente dupla, mas o Google Pixel 3 usa uma única lente de câmera com fotografia computacional para replicar um zoom óptico e adicionar vários efeitos.”

Desde o Pixel 3, matrizes de múltiplas câmeras e imagens computacionais se fundiram para produzir uma tecnologia híbrida que replica muitos dos efeitos de profundidade de campo e lente obtidos com câmeras maiores. Um telefone com câmera não é mais "apenas" uma câmera. É um dispositivo de cálculo, análise e 'pensamento' que não apenas captura a cena como ela é, mas como pensa que você quer que seja, ou como pensa que você deveria querer que fosse …

A IA pode ser como ter um assistente que sabe tudo. Depois de um tempo, você pode começar a se perguntar quem está realmente no comando.

O mundo não está necessariamente pronto para todas as implicações das câmeras de IA. O Google usou IA em sua câmera vestível Google Clips, que usava IA para capturar e manter apenas momentos particularmente memoráveis. Ele usava um algoritmo que entendia o básico sobre fotografia, então não perdia tempo processando imagens que definitivamente não fariam o corte final de um rolo de destaques. Por exemplo, ele excluiu automaticamente fotografias com um dedo no enquadramento e imagens fora de foco, e favoreceu aquelas que obedecem ao conceito geral de regra dos terços de como enquadrar uma foto.

Assustador e controlador? Alguns pensaram assim. Em qualquer caso, o Google puxou a câmera em 2022-2023. A questão não é se a IA é poderosa o suficiente para fazer as coisas que queremos, mas se ainda estamos prontos para entregar tanto poder a uma máquina … ou à empresa que possui e opera os algoritmos de IA por trás dele.

O que é fotografia computacional?

A fotografia computacional é uma técnica de processamento digital de imagens que utiliza algoritmos para substituir processos óticos e busca melhorar a qualidade da imagem por meio da visão de máquina para identificar o conteúdo de uma imagem.

“Trata-se de pegar efeitos de estúdio que você consegue com Lightroom e Photoshop e torná-los acessíveis às pessoas com o clique de um botão”, diz Simon Fitzpatrick, Diretor Sênior, Gerenciamento de Produto da FotoNation, que fornece grande parte da tecnologia computacional para marcas de câmeras.

“Assim, você pode alisar a pele e se livrar das manchas, mas não apenas desfocando-a - você também obtém textura.” No passado, a tecnologia por trás dos modos de 'pele lisa' e 'beleza' consistia essencialmente em desfocar a imagem para esconder imperfeições. “Agora se trata de criar looks que sejam verossímeis, e a IA desempenha um papel fundamental nisso”, diz Fitzpatrick. “Por exemplo, usamos IA para treinar algoritmos sobre as características do rosto das pessoas.”

Desde o telefone LG V30S ThinQ, a LG usa IA para geração de imagens. Ele permite que o usuário selecione uma imagem profissional em seu aplicativo Graphy e aplique o mesmo balanço de branco, velocidade do obturador, abertura e ISO. A LG também lançou o Vision A, um mecanismo de reconhecimento de imagem que usa uma rede neural treinada em 100 milhões de imagens, que recomenda como configurar a câmera. Ele até detecta reflexos na imagem, o ângulo da foto e a quantidade de luz disponível.

Sensores de profundidade e fundos borrados

Nos últimos anos, vimos muitas câmeras de telefone com várias lentes usarem duas ou mais lentes para produzir imagens esteticamente agradáveis ​​com um fundo desfocado em torno do assunto principal. As pessoas (e, portanto, o Instagram) amam fundos borrados, mas em vez de usar câmeras de lente dupla ou pegar uma DSLR e manipular manualmente a profundidade de campo, a IA agora pode fazer isso por você.

Comumente chamado de efeito 'bokeh' (desfoque em japonês), o aprendizado de máquina identifica o assunto e desfoca o resto da imagem. “Agora podemos simular o bokeh usando algoritmos baseados em IA que segmentam as pessoas do primeiro e do segundo plano, para que possamos criar um efeito que começa a se parecer muito com um retrato tirado em um estúdio”, diz Fitzpatrick. Os smartphones mais recentes permitem que você faça isso para fotos tiradas com a câmera traseira ou frontal (selfie).

“As pessoas se referem a isso como bokeh, mas você não consegue o verdadeiro desfoque que obtém com uma DSLR, onde pode alterar a profundidade; com um telefone, você só pode desfocar o fundo ”, diz Gill. “Mas um número pequeno e crescente de fotógrafos está realmente impressionado com ele e está usando um iPhone X para capturas do dia a dia, e somente quando estão em trabalhos profissionais é que eles pegam sua DSLR.”

As câmeras AI podem mesclar automaticamente imagens HDR em luz forte, alternar para um modo de captura de várias imagens com pouca luz e usar a magia da imagem computacional para criar um efeito de zoom contínuo com dois ou mais módulos de câmera.

E quanto às DSLRs e outras câmeras "adequadas"?

A remoção automática de olhos vermelhos está presente nas câmeras DSLR há anos, assim como a detecção de rosto e, ultimamente, até mesmo a detecção de sorriso, por meio da qual uma selfie é tirada automaticamente quando o assunto abre um sorriso. Tudo isso é IA. Será que empresas como a Nikon e a Canon adotarão IA mais avançada para suas DSLRs carro-chefe? Afinal, demorou muitos anos para que o WiFi e o Bluetooth aparecessem nas DSLRs.

Enquanto esperamos, um acessório de ‘assistente de câmera inteligente’ financiado pelo Kickstarter, chamado Arsenal, quer preencher a lacuna. “O Arsenal é um acessório que permite o controle sem fio de uma câmera de lente intercambiável (por exemplo, uma DSLR) a partir de um dispositivo móvel, com algoritmos de aprendizado de máquina usados ​​para tirar a foto perfeita”, diz Gill. “O que ela está fazendo é comparar a cena atual com milhares de imagens anteriores, usando o reconhecimento de imagem para reconhecer um assunto específico e aplicando as configurações corretas, como uma velocidade rápida do obturador se reconhecer a vida selvagem.”

Enquanto isso, a Canon se apoiou fortemente na tecnologia AI para o sistema de foco automático de ponta na EOS-1D X Mark III. Ou, para ser mais preciso, 'aprendizado profundo'. A complexidade dos algoritmos é a mesma (o sistema é treinado com fotos profissionais), mas o resultado final é o aprendizado profundo … inteligência artificial é a capacidade de uma máquina de continuar aprendendo por conta própria.

No entanto, pode ser difícil separar a IA verdadeira da automação sofisticada. Durante anos, os fabricantes de câmeras compactas oferecem diferentes modos de cena orientados para o assunto, que podem ser escolhidos automaticamente pela câmera. Isso é 'inteligência' ou simplesmente uma implementação um pouco mais avançada de medição de exposição, movimento do assunto e distância de foco? Os sistemas de medição multipadrão normalmente usam uma medição complexa de distribuição de luz com base em milhares de fotos do mundo real e usavam um processo de 'aprendizado profundo' antes que o termo fosse inventado.

Para quem é a fotografia de IA?

Todos. Para começar, trata-se de democratizar a fotografia. “No passado, a fotografia era domínio daqueles com experiência no uso de DSLR para criar diferentes tipos de imagens, e o que a IA começou a fazer é disponibilizar os efeitos e recursos da fotografia mais avançada para mais pessoas”, diz Fitzpatrick .

Então, isso significa que o Photoshop e o Lightroom da Adobe estarão extintos em breve? Absolutamente não; AI é uma tecnologia complementar e já está tornando a edição de fotos muito mais automatizada. Um dos parceiros da FotoNation é a Athen Tech, cuja tecnologia baseada em IA "Perfectly Clear" realiza correções de lote automáticas que imitam o olho humano. Um plug-in para o Lightroom, destina-se especificamente a reduzir o tempo que os fotógrafos ficam em frente aos computadores editando manualmente. “Os fotógrafos profissionais ganham dinheiro quando estão tirando fotos, não quando estão processando imagens”, diz Fitzpatrick. “A IA torna os efeitos criativos de aparência profissional mais acessíveis aos usuários de smartphones e ajuda os fotógrafos profissionais a maximizar sua capacidade de ganhar a vida.”

IA está rapidamente se tornando um termo usado demais no mundo da fotografia. No momento, isso se aplica amplamente a câmeras de smartphones, mas os algoritmos incríveis e o nível absoluto de software automatizado que a tecnologia está permitindo logo se provarão irresistíveis para a maioria de nós. Pode não ser hora de jogar fora a DSLR ainda, mas a IA parece determinada a mudar a forma como tiramos fotos.

Não só isso, mas em breve também poderá se encarregar da edição e da curadoria de nossas bibliotecas de fotografia existentes. Esse processo já começou. O Lightroom CC usa o sistema de reconhecimento de objetos Sensei baseado em servidor da Adobe para identificar imagens por assunto, para que você não precise mais gastar horas adicionando palavras-chave manualmente. IA pode ser um termo exagerado e muitas vezes uma abreviação para o que nada mais é do que o software mais recente e avançado, mas a IA promete fazer algo incrível para os fotógrafos; vai liberar mais do seu tempo para que você possa tirar mais e melhores fotos.

Por que alguns telefones têm duas câmeras em um lado? Explicação dos designs de câmera dupla

Skylum Software é um dos líderes em software de edição de fotos com tecnologia de IA. Introduziu o AI Sky Replacement no Luminar para eliminar todo o mascaramento manual necessário para fazer isso manualmente, AI Augmented Skies para adicionar nuvens, planetas, relâmpagos e muito mais às suas imagens, ferramentas de aprimoramento de retrato de AI que podem identificar autonomamente características humanas e estrutura de AI para adicionar definição apenas às áreas de uma imagem onde for apropriado.

O uso de realidade aumentada na fotografia ainda pode ser controverso. Desde a invenção dos editores de imagem, é possível distorcer, distorcer e 'inventar' a realidade, mas a IA promete tornar isso tão fácil e tão convincente que não requer nenhuma habilidade particular (ou consciência) para fazer.

• Os melhores telefones com câmera que você pode comprar hoje
• O melhor software de edição de fotos do momento
• Como fazer o download do Photoshop
• Como fazer o download do Lightroom

Artigos interessantes...