STEVE LOHR*
Computadores com visão estão se tornando comuns. Câmeras baratas e de alta resolução se proliferam em produtos como smartphones e laptops. E novos algoritmos de computação para localizar, comparar e avaliar a enxurrada de dados visuais têm progredido rapidamente.
A tecnologia pode ser usada em hospitais, shopping centers, escolas, plataformas de metrô, escritórios e estádios. As máquinas nunca piscam.
Tudo isso pode ser muito útil -ou alarmante.
"As máquinas definitivamente serão capazes de nos observar e nos entender melhor", disse Hartmut Neven, cientista da computação do Google e especialista em visão. "Aonde isso leva é incerto", completou.
O Google está na linha de frente do desenvolvimento tecnológico, e é também motivo de apreensão por causa disso. Seu serviço Street View, em que usuários da internet podem olhar um determinado local, recebeu queixas por violação de privacidade. O Google irá borrar as fotos das casas de quem assim solicitar.
Com o aplicativo Goggles, do Google, as pessoas podem tirar uma foto com um smartphone e vasculhar a internet em busca de imagens semelhantes. Executivos da empresa excluíram uma ferramenta de reconhecimento facial, temendo que isso servisse na busca por informações pessoais.
Cientistas preveem que as pessoas ficarão cada vez mais cercadas por máquinas que podem não só ver, mas também raciocinar a respeito daquilo que estão vendo.
Segundo Frances Scott, que é especialista em tecnologias de vigilância, isso poderá permitir que autoridades localizem um terrorista ou uma criança perdida.
Milhões de pessoas têm usado produtos que mostram o progresso alcançado pela visão informatizada. Os principais serviços on-line de compartilhamento de fotos já contam com reconhecimento facial.
O Kinect, que pode ser agregado ao console Xbox 360, da Microsoft, usa uma câmera digital e sensores para reconhecer as pessoas e seus gestos; ele também entende comandos de voz.
Com o Kinect, "a tecnologia entende você de forma mais fundamental, de modo que você não precisa entendê-la", disse Alex Kipman, engenheiro envolvido no desenvolvimento da ferramenta.
'Lave as mãos, por favor'
Há três meses, o Centro Médico Bassett, de Cooperstown, em Nova York, iniciou experiências com a visão informatizada. Pequenas câmeras no teto monitoram os movimentos dos pacientes e das pessoas que entram e saem da sala.
"Cientistas preveem que as
pessoas ficarão cada vez mais cercadas
por máquinas que podem não só ver,
mas também raciocinar a
respeito daquilo que estão vendo."
As primeiras aplicações do sistema, criado pela General Electric, são lembretes e alertas. Médicos e enfermeiros precisam lavar as mãos antes e depois de tocar em pacientes, para evitar infecções hospitalares. Quando alguém se esquece, uma voz declara: "Perdoe a interrupção; por favor, lave as mãos".
O sistema é capaz de reconhecer movimentos que indicam quando um paciente corre o risco de cair do leito, e alerta uma enfermeira. Outras ferramentas podem ser acrescentadas, como um software que analisa expressões faciais em busca de sinais de dor ou outro desconforto grave, segundo Kunter Akbay, cientista da GE.
Espelho, espelho meu
O pós-graduando Daniel McDuff parou diante de um espelho translúcido no Laboratório de Mídia do Instituto de Tecnologia de Massachusetts (MIT). Após 20 segundos, um número -65, seu batimento cardíaco por minuto- apareceu no espelho. Por trás dele, uma webcam enviava imagens de McDuff a um computador cujo software monitorava o fluxo sanguíneo em seu rosto. O programa separa as imagens de vídeo em três canais -para as cores básicas vermelho, verde e azul. Mudanças nas cores e movimentos feitos por minúsculas contrações e expansões dos vasos sanguíneos no rosto não são perceptíveis ao olho humano.
"O sinal do seu ritmo cardíaco está na sua cara", disse Ming-zher Poh, também pós-graduando do MIT. Outros sinais vitais, como ritmo da respiração e pressão arterial, devem deixar pistas semelhantes.
Esse projeto, descrito numa publicação feita em maio por Poh, McDuff e Rosalind Picard, professora do laboratório, está só começando, segundo Poh. Mensurações diárias feitas com esse método poderão revelar, por exemplo, que uma pessoa está ficando sob maior risco de um ataque cardíaco. "No futuro, isso estará nos espelhos", disse.
Os rostos podem fornecer todo tipo de informação aos computadores. No MIT, Picard e a pesquisadora Rana el Kaliouby aplicam um software de análise da expressão facial para ajudar autistas a reconhecerem melhor os sinais emocionais.
As duas cientistas fundaram a Affectiva, empresa com sede em Waltham, Massachusetts, que está produzindo softwares de análise facial para fabricantes de produtos comerciais, varejistas, profissionais de marketing e estúdios cinematográficos.
John Ross, executivo-chefe da Shopper Sciences, uma empresa de pesquisa de mercado, disse que a tecnologia da Affectiva promete dar aos profissionais de marketing uma leitura imparcial sobre a sequência de emoções que levam a uma compra. "Pode-se ver e analisar como as pessoas estão reagindo em tempo real, não o que elas estão dizendo mais tarde [num grupo de pesquisas], quando com frequência estão tentando ser educadas."
O software, segundo Ross, poderia ser usado em quiosques comerciais ou com webcams. A Shopper Sciences, acrescentou ele, está testando o programa da Affectiva com um grande varejista e com um site de relacionamentos amorosos.
Observando o observador
Maria Sonin, 33, funcionária de um escritório em Waltham, Massachusetts, assistiu o trailer de um filme enquanto o software da Affectiva acompanhava os movimentos de 12 pontos do seu rosto.
Aos olhos de um humano, ela estava se divertindo. O software concordou, disse Kaliouby, mas usou uma análise mais detalhada, como ao registrar que seus sorrisos eram simétricos (o que sinaliza diversão, e não constrangimento).
Christopher Hamilton, um diretor-técnico de efeitos visuais, disse que a tecnologia de análise das expressões faciais "possibilita medir a reação da audiência com um detalhamento cena a cena, o que a atual abordagem de pesquisa e questionário não permite". Um diretor pode descobrir, por exemplo, que a plateia, mesmo gostando de um filme como um todo, desaprova duas ou três cenas. Ou que determinado personagem não inspira a reação emocional pretendida.
Mas a visão computadorizada também traz desafios. No trabalho ou na escola, a tecnologia abre as portas para um supervisor informatizado que está sempre observando. Um efeito sutil decorreria de a pessoa saber que está sendo observada, o que poderia ser benéfico: um criminoso iria pensar duas vezes antes de agir, por exemplo. Mas isso não levaria também a uma sociedade menos espontânea, menos criativa e menos inovadora?
Como disse Hany Farid, cientista da computação no Dartmouth College, de New Hampshire: "Em toda tecnologia há um lado negro".
_____________________________
*
Folha online, 16/01/2011
Imagens da Internet
Nenhum comentário:
Postar um comentário