Aprendizagem de máquina e subjetividade

Como visto em Paradigmas estéticos para classificar imagens informacionais primeiramente, trabalhou-se na classificação cognitiva da amostra inicial de 6.000 imagens, nas categorias Factual, Memes, Ilustração digital, Tipografia digital, Ilustração manual, Tipografia vernacular e Apropriação. Essa classificação inicial foi usada como referência (target) para o treinamento e aprendizagem da máquina supervisionada (supervised learning) na criação de cinco rotuladores de imagens (labels). [Sidenote: 16. As estratégias e decisões acerca dos modelos utilizados para essa etapa de trabalho, assim como o protocolo desse processo de trabalho foram realizados em conjunto com o cientista de dados e então aluno da POLI-USP e pesquisador do Inova USP, Gustavo Polleti.] Construímos seis bibliotecas de dados incluindo seis targets (imagens com atributos para treinar a máquina em cada categoria).

A aplicação de uma estratégia metodológica baseada em uma análise qualitativa a partir de uma amostra quantitativa de uma grande quantidade de imagens, resultou em uma amostragem e uma classificação significativa para o objetivo proposto. A inteligência artificial foi aplicada como ferramenta criativa no processo de arquivamento, edição e visualização das narrativas, desde a captação das imagens, visualização e rotulação, até a catalogação como acervo da memória gráfica brasileira, como pode ser visto no Calendário Dissidente.

O processo de design dos códigos para treinamento e aprendizagem de máquina supervisionada com o objetivo de visão computacional para fins estéticos de reconhecimento de determinada linguagem visual foi, até onde pudemos apurar, um procedimento inédito. Um experimento que tinha uma demanda do campo do design gráfico e exigia conhecimentos da ciência de dados para ser realizado. Esta experiência colaborativa também foi desenvolvida durante a residência no Inova USP.

O uso de AI e aprendizagem de máquina para a classificação dessa superprodução de imagens dissidentes mostrou-se fundamental por três motivos: o primeiro, para auxiliar na classificação dessa amostragem quantitativa muito grande; o segundo, para desmistificar as inteligências artificiais como uma “caixa preta”, abrindo a possibilidade de uso de novas ferramentas para a visualização de narrativas de imagens. E o terceiro e mais importante, diz respeito à subjetividade da atividade de classificação, seja ela humana ou algorítmica. A interpretação de uma imagem feita por rotuladores é matemática. Porém, a interpretação dessas imagens pelas IAs também apresenta traços de subjetividade, herdados da classificação humana dos modelos de treinamento. Os pontos críticos da decisão entre uma categoria ou outra acontecem tanto na categorização cognitiva, feita por humanos como na leitura dos classificadores da rede neural.

Paralelamente ao processo tecnológico da criação dos rotuladores, problematizamos a visualização de dados, o engajamento de grupos e uso de bots e algoritmos para constatar a estandardização (ou proliferação) de linguagem das imagens das redes a partir de Manovich (2018).

Em Estéticas da inteligência artificial, Manovich (2018) aborda a importância do uso criativo da aprendizagem de máquina supervisionada como uma excelente ferramenta para designers, artistas e pesquisadores. O autor propõe quatro taxonomias para entendermos o potencial da cultura digital e o uso de inteligência artificial:

(i) selecionando conteúdo de grandes coleções;

(ii) segmentando e objetivando a extração de conteúdo: marketing personalizado/público – viés comercial;

(iii) assistindo à criação/edição de conteúdos ou participação na criação de conteúdo;

(iv) criando obras totalmente autônomas (compondo músicas, faixas, escrevendo, criando visualizações a partir de determinados conjuntos de dados).

Nesse estudo, a inteligência artificial está sendo aplicada na seleção e classificação de uma coleção de imagens (i) assim como na criação de conteúdos específicos a partir dos seis parâmetros curatoriais (iv). O autor nos provoca a questionar nossa responsabilidade como criadores de classificações e rótulos. Concordamos com Manovich (2018) sobre a responsabilidade dos parâmetros e escolhas das imagens selecionadas como modelo para a aprendizagem de máquina. Essas são a medida para que a inteligência artificial opere mais qualitativamente. Pudemos verificar esse fenômeno na prática quando observamos como as restrições e potencialidades dos robôs são similares às dos humanos.

Damos continuidade à discussão sobre o uso criativo e disruptivo e novas estratégias para visões computacionais por meio das obras expostas na galeria Uso de IA para fins artísticos e curatoriais. São trabalhos realizados por artistas e pesquisadores – Paglen (2018), Moreschi (2018), Beiguelman (2022), Velazquez (2021), entre outros – nos quais discute-se os vieses políticos e tendenciosos das classificações e dos treinamentos por um viés cultural, decolonial e social.

 

Estandardização e escolhas algorítmicas

Sobre a estandardização da estética global das imagens que circulam nas mídias digitais, Manovich (2018) comenta que as inteligências artificiais são utilizadas por diversos aplicativos de fotografia disponíveis para download por qualquer usuário. Esses apps fornecem tags e parâmetros relacionados ao tipo de foco, filtros de cor, composição, além de tagueamentos como “retrato”, “comida”, “paisagem”, etc. Tais modelos, previamente disponíveis para o usuário “plug and play”, acabam automatizando e sugerindo padrões estéticos pré-estabelecidos – “the stardardization of photo imagination” (GRIGONIS, 2016; apud MANOVICH, 2018).

Por outro lado, há cada vez mais aplicativos e sites para diferentes mídias que permitem a customização dos serviços. A inteligência artificial, neste caso, aumentou a diversidade dessas funções e essas mudanças de algoritmo, cada vez mais presentes nas redes e em outras mídias. Ela permite uma variedade de combinações infinitas. O Instagram, por exemplo, usa datasets (conjunto de dados programados para exercer determinadas funções e comportamentos) que determinam a visualização das imagens: os posts são programados para serem visualizados primeiramente dentro do círculo de seguidores com os quais o usuário mais interage, ou seja, dentro da sua “bolha” de amigos que interagem com o mesmo tipo de notícia, etc. A experiência do usuário, dos compartilhamentos, dos likes e dos engajamentos das repostagens é moldada pela experiência visual restringida pelos filtros algorítmicos do aplicativo. Pesquisando, por exemplo, por #designativista, o que uma pessoa vê em seu feed como “top posts” é diferente do que outra pessoa que não pertence ao mesmo grupo de seguidores vê, conforme demonstra a figura abaixo.

Captura de tela da visualização do feed da #designativista de duas pessoas de diferentes ciclos de amizades. O “top posts” é completamente diferente.

Ou seja, a visualização institucional do Instagram está programada para que o usuário veja primeiramente imagens de amigos e amigos de amigos, que, de certa forma, têm mais afinidade estética com as escolhas da pessoa usuária. Esse ambiente “fechado” e manipulado age como um vírus, um “contágio”, compreendido em um léxico de linguagem visual, incentivando a produção de outras peças gráficas que seguem a mesma estética “coletiva”. Um esquema já foi criado por alguém, e, posteriormente, apropriado e remixado. Portanto, cria-se um padrão visual identificatório, do qual seus pares, seguidores, amigos e familiares se sentem representados. Há um conforto estético, algo “estranhamente familiar” – para citar uma expressão freudiana, na medida em que os elementos visuais, as cores e a tipografia remetem a algo revisitado, visto e revisto, já conhecido e presente no nosso inconsciente. [Sidenote: 17. Ver O inconsciente estético de Jacques Rancière (2009, p. 12). O autor aplica a teoria freudiana do inconsciente ao domínio da estética. E discorre sobre um modo de pensamento que se desenvolve sobre as coisas da arte “que procura dizer em que elas consistem enquanto coisas do pensamento”.]

Para ampliar a amostra qualitativa da produção cultural, mostrando a diversidade da produção nacional, precisamos buscar as diferenças, o que está fora da curva, o novo, em uma amostragem abundante. Portanto, redundância, repetição de imagens e quantidade foram bem-vindos nesse estágio da pesquisa.

 

Trabalho com os classificadores de imagem

Os classificadores de imagem visam discernir entre um conjunto pré-definido e finito de rótulos, qual o mais apropriado para uma dada figura no Instagram. Em função da subjetividade inerente às classes abordadas neste trabalho, é difícil criar um algoritmo ou método objetivo capaz de realizar a tarefa de classificação por completo. No caso desta investigação o uso de scripts open sourcepara classificadores de imagens agilizou o processo de criação e customização dos “classificadores dissidentes”.

A partir dos dados coletados e rotulados na etapa anterior, iniciamos o treinamento supervisionado de modelos de aprendizagem de máquina (machine learning). Partimos de testes usando técnicas de aplicação de modelos de aprendizagem profunda (deep learning) em redes neurais profundas – essas têm como objetivo aprender as representações latentes e poder identificar alguns padrões “ocultos” nos dados (KRIZHEVSKY et al., 2012).

A rede neural convolucional, a arquitetura selecionada para este trabalho, é projetada para considerar referências espaciais e de localidade, de modo que a proximidade entre os pixels seja aferida. Os modelos da convolutional neural network (CNN) são notavelmente recomendados para estudos de visão computacional, como a classificação de imagens. Segundo Krizhevsky, esses modelos visam aprender representações a partir dos dados brutos.

A etapa de configuração e processamento dos algoritmos é realizada automaticamente, como parte do próprio aprendizado da máquina. Estas operações são conhecidas por sua capacidade de considerar padrões complexos, como em classificação de imagens, o que as torna apropriadas para o estudo de caso (LECOUTRE et al., 2017). Com tal metodologia, pudemos apurar numericamente o comportamento dos rotuladores, seus acertos e erros.

Para complementar a avaliação da acurácia dos seis rotuladores (labels), realizamos a análise da Matrix de confusão (confusion matrix). Nessa etapa, verificamos que precisaríamos de outra metodologia e de outro modelo para a criação do classificador de apropriação, pois o banco de imagens de treinamento exigiria uma ampla pesquisa das referências visuais originais.

 

Análise quantitativa dos classificadores: acurácia

A criação dos modelos de classificação foi realizada no sistema computacional Python 3.7. Utilizou-se primeiramente, modelos e bibliotecas de classificadores de imagens disponíveis como “open source”, e implementamos os modelos de linha Logistic Regression (LR) e Random Forest (RF). Em seguida, avaliamos os dois modelos para precisão, conforme mostrado na figura abaixo. LR e RF tiveram um desempenho ruim, atingindo menos de 35% de precisão.

 

Visualização das métricas das acurácias dos classificadores (em todas as categorias):

Na prática, esses modelos fazem a leitura dos pixels das imagens, detectando se compõem fotografias, desenhos vetoriais, tipografias. A leitura é realizada por micro pixels, de modo que uma fração mínima é interpretada, criando parâmetros horizontais e verticais de leitura para a configuração do todo da imagem. Esses resultados sugerem que os modelos iniciais estavam mal equipados, ou seja, não foram capazes de capturar efetivamente os padrões sutis que descrevem nossas classes estéticas. Além disso, o fraco desempenho de nossos modelos de linha de base apontou para a necessidade de um modelo mais flexível, como os do deep learning (aprendizagem profunda). Os modelos flexíveis conseguem fazer correlações de mais detalhes das imagens para transformá-las em dados classificatórios. Esses modelos interpretam mais profundamente a leitura das imagens utilizadas na aprendizagem da máquina, melhorando a acurácia da classificação.

 

Parâmetros dos classificadores

As representações resultantes da aprendizagem da máquina capturam dados e informações relevantes que supostamente estão ocultas. Dessa maneira, a classificação será realizada usando abstrações de alto nível de detalhes da imagem, em vez de pixels, por exemplo. Apesar de altamente precisas, as previsões baseadas nessas representações não são interpretáveis, pois os padrões significativos para a máquina podem não ser vistos pelo olho humano. De fato, essas são modeladas sem um hiperespaço, onde as dimensões não têm significado explícito ou semântico.

Para melhor identificação dos padrões das imagens, implementamos um modelo da CNN que consiste em duas camadas convolucionais. Assim, nossa estrutura consistiu em 128 neurônios organizados em duas camadas de leitura de dados.

Em seguida, avaliamos nosso modelo na coleção das imagens em termos de precisão. Observa-se que a acurácia usando rede neural convolucional superou os modelos iniciais de linha de base (sem rede neural). Além disso, analisando a matriz de confusão, pode-se observar que nosso modelo conseguiu classificar adequadamente todas as categorias.

Ao observar as imagens classificadas pela inteligência artificial, percebeu-se a dificuldade da interpretação relacionada às ilustrações, em geral. A categoria Ilustração digital é confundida com a Factual e também com Ilustração manual. Discutiremos essa questão adiante, a partir da interpretabilidade e visualização dos dados.

Captura de tela da Matriz de confusão do classificador, organizado pelos rótulos “verdadeiros” (usados para o treinamento) e os rótulos interpretados pela máquina

Embora os métodos de avaliação baseados nas métricas quantitativas de acurácia ofereçam uma visão clara da performance do classificador, reforçamos o fato de que não basta fornecer uma interpretação completa do comportamento do modelo (KIM, 2016).

Com o propósito de visualizar o significado desses números, a autora insistiu na busca de outros modelos de tradução de números em visão computacional, mais palpáveis para um editor de imagem e designer. Buscou-se técnicas de interpretabilidade para complementar a análise e explicar por que o modelo é mais propenso a confundir uma classe por outra.

 

A interpretação dos classificadores de imagens

Para atender à necessidade de uma análise mais qualitativa, propomos o uso de método crítico de visualização de dados, que pode ser considerado como a tradução do número à imagem, uma ferramenta de visualização para que um cientista de dados, designer, editor ou artista possa entender melhor o comportamento dos rotuladores.

Em Examples are not enough, learn to criticize, Been Kim (2016) descreve a relevância do modelo “MMD Critic”, software livre (open source) disponibilizado pelos autores, pesquisadores do MIT Lab. O modelo possibilita a visualização da interpretação da máquina e evidencia quais as imagens críticas – cujos elementos visuais não permitem sua classificação em determinada categoria. Essa informação é um dado fundamental em relação às limitações e aos erros dos classificadores de redes neurais. Os autores levantam, ainda, a importância da visualização das imagens críticas como apoio à interpretação humana em relação às limitações e aos erros dos classificadores de redes neurais (KIM et al., 2016). Esse modelo busca identificar simultaneamente quais imagens, em determinado contexto, são representativas de toda a coleção (protótipos) e quais diferem das demais (críticas), pois não conseguem ser interpretadas por falta de um padrão predominante.

Ao aplicar esse modelo em todas as categorias, podemos afirmar que a visualização dos protótipos e a análise das imagens críticas permitiram insights sobre os padrões estéticos utilizados para o treinamento dos modelos de aprendizagem de máquina. Ainda, observa-se que essas imagens geradas pela máquina, revelam um outro tipo de imagem digital, outra narrativa que representa a “narrativa visual das máquinas”, a partir do que realmente é lido e interpretado por elas.

 

Análise qualitativa dos resultados

Classificar grandes quantidades de imagens e descobrir novas tendências estéticas é uma atividade interdisciplinar na qual os erros e acertos enunciam a fragilidade da rede neural em definir métricas para categorias estéticas. A representação visual das métricas quantitativas também é fundamental no processo de aprendizagem da máquina.

Com o objetivo de analisar a margem de 13% de erro na acurácia dos classificadores do projeto, buscou-se soluções para a visualização do processo de classificação e o porquê do erro. Na amostragem usada para o treinamento, havia imagens que poderiam ser enquadradas em mais de uma categoria. Já era presumida a complexidade do projeto em reconhecer essas imagens, compostas por linguagens híbridas. O processo de tangibilização desses índices por meio da visualização das imagens possibilitou a identificação visual dos acertos e dos erros na classificação. O dado quantitativo passa a ter um valor qualitativo à medida em que ele enuncia quais imagens são mais representativas dos acertos e dos erros dos classificadores.

 

A imagem visualizada pelo robô

Nas imagens abaixo observa-se a visualização das seis categorias com a resolução de 120×120 pixels. A acurácia visual para o olho humano é surpreendentemente boa. Textos e detalhes de imagens podem ser facilmente reconhecidos. Ou seja, existe uma interdependência entre a acurácia da leitura da máquina e a acurácia do olho humano. Curiosamente, as imagens de leitura “crítica” para a rede neural são justamente as imagens nas quais há uma sobreposição de técnicas: desenho manual, foto recortada, colagem digital, tipografia manuscrita.

 

Resultados das imagens rotuladas, visualizadas pelo modelo MMD Critic (KIM et al., 2016). O modelo considera as imagens com linguagem remixada como críticas.

As questões subjetivas do treinamento da máquina não são abertas ao público. O usuário de um serviço de visão computacional tem acesso apenas ao resultado final de determinado classificador. No caso deste estudo, os pesquisadores participaram de todo o processo de treinamento e aprendizagem da máquina para a construção dos rotuladores. Inferiu-se exemplos visuais, muitas vezes de difícil reconhecimento formal devido à linguagem múltipla, remixada, inerente às publicações das redes. De fato, seria impossível ter certeza, empiricamente, sobre o pertencimento de uma imagem às categorias Factual ou Ilustração digital, como no exemplo da figura abaixo:

Captura de tela da #designativista em 19 de abril de 2019, Dia do Índio. Autoria de Mari Morais @moraismavi.

A imagem acima é composta por múltiplas linguagens: a fotografia de um índio é recortada e trabalhada junto à outra fotografia de folhas de bananeira. Ao fundo, grafismos vetoriais aludem às pinturas étnicas. A imagem original foi interpretada pelos editores como Ilustração digital, pois utiliza-se de técnicas de remixagem incluindo uma fotografia documental. O fato de a fotografia (a figura central do índio) estar nítida tornou essa imagem crítica para o classificador, pois as fotografias documentais foram usadas para treinar o rotulador Factual.

As imagens da categoria Tipografia vernacular também foram apontadas como críticas por esse modelo. O que aponta para o fato de que o classificador se confunde e, na dúvida, também descreve essas imagens como críticas.

Imagens apontadas como críticas pelo modelo MMD Critic (KIM et al., 2016). Todas pertenciam à mesma categoria Tipografia vernacular.

Após esta análise, decidiu-se não habilitar o rotulador referente à Tipografia vernacular. Já se sabia que a interpretação dessa categoria é subjetiva, pois considera-se aspectos culturais, regionais e etnográficos para classificar o estilo manuscrito das tipografias e caligrafias manuais. São composições híbridas com diferentes materialidades e resultam em uma linguagem remixada, impossível de ser detectada pela máquina.

Ao eliminarmos a categoria Tipografia vernacular, o desempenho dos classificadores saltou de 77% para 84%. Portanto, definiu-se que seriam utilizados rotuladores para Factual, Ilustração digital, Ilustração manual e Tipografia digital. Nestas categorias, as características formais dos posts não dependem do repertório cultural do treinador e editor para serem classificadas.

 

Classificadores estéticos, scripts creative commons

A partir de todo o contexto sociocultural, político e tecnológico envolvido no processo de utilização de inteligência artificial e aprendizagem de máquina – desde o treinamento dos sets de classificação das imagens, na nomenclatura das categorias, e sobretudo nas políticas de visibilidade dos dados – pudemos compreender a complexidade envolvida na criação de classificadores de imagens propostos nesta pesquisa. Esses, pensados para uma função classificatória bem mais específica (sem fins comerciais ou de vigilância), sofrem analogamente das mesmas dificuldades interpretativas dos seus treinadores.

O propósito da construção dos classificadores em questão pretendia investigar as novas linguagens visuais emergentes das redes, ampliando a amostragem quantitativa. Os parâmetros selecionados para o treinamento dos classificadores se basearam em critérios estéticos. Foram muitas etapas de treinamento e ajustes de modelos para enfim, concluirmos que a ferramenta criada para rotulagem das cinco categorias apresentou uma acurácia de 87%. Este modelo final, desenvolvido exclusivamente para esta pesquisa pelo cientista de dados Gustavo Polleti (Inova USP), gerou scripts open source e estão disponíveis para outras investigações ou produções artísticas nas bibliotecas on-line.

A análise qualitativa dessas imagens e o reconhecimento de algumas tendências e padrões gráficos foram enriquecidos pela amostra quantitativa, pelo uso de inteligências artificiais e pela visualização da acurácia e das dúvidas dos rotuladores. Com a visualização das classificações, foi possível aferir o que merece ser arquivado à luz do design gráfico, como uma nova linguagem visual inerente às redes sociais e como memória gráfica brasileira. Cabe aos designers usarem novas estratégias de visualização de dados a nosso favor.

Embora a subjetividade da classificação seja reconhecida e explicitada, assumiu-se o uso da inteligência artificial como uma ferramenta de apoio curatorial. O resultado bruto da classificação nas categorias propostas não poderia ir ao público sem passar por um filtro de edição e ainda, por uma releitura e análise visual. Nesse sentido, o projeto experimental dos classificadores não foi integrado e publicado ao grande público no site do Calendário Dissidente. Mas foi de suma importância no alargamento dos horizontes a respeito do que se produz nas redes, adicionando uma ferramenta importante para discutirmos as linguagens dessas imagens por um viés mais semântico, assunto a ser tratado em Análise semântica pela cultura do design.

 

Visões computacionais X ativismo

Como vimos, as imagens visualizadas por meio da estética de banco de dados e extração de coleções de imagens por meio de determinadas hashtags para fins de pesquisa e análises visuais apresentam um lado da moeda da visão computacional.

As políticas de visualização de dados relacionadas às imagens nas grandes plataformas têm uma lógica bem diferente do rastreamento algorítmico, por meio de palavras escritas. O treinamento das máquinas para a leitura de imagens requer uma biblioteca mais robusta acerca de parâmetros de reconhecimento das imagens e um conjunto de informações que dependem de ações humanas para a descrição textual das imagens. A subordinação da palavra sobre a imagem depende do olho humano para classificar as imagens. E é precisamente durante esta classificação de imagens que se dá todo o colonialismo das visões computacionais das grandes nuvens, as GAFAM, já apresentadas anteriormente.

O serviço de nuvens está incorporado em várias situações cotidianas de um cidadão portador de um smartphone. Ele utiliza redes sociais, serviço de e-mail e WhatsApp, se locomove utilizando aplicativos de geolocalização como Waze ou Move It, paga suas contas de energia, água, aluguel e impostos pela internet banking, contrata um serviço de backup como o Google Drive ou Dropbox para armazenamento de dados pessoais e trabalha em arquivos compartilhados, guardados em nuvens-servidores no espaço. Todos esses dispositivos são considerados nuvens informacionais e estão organizados por camadas distintas de nuvens de armazenamento e troca de dados – administradas por empresas e instituições privadas ou públicas – e estão fortemente conectadas com a cidade, com serviços e com a mobilidade urbana.

Tais aspectos da mobilidade urbana podem ser compreendidos no pensamento de Castells (1999) antes desta realidade. O autor atribui ao Espaço de Fluxo, a criação de uma nova forma urbana: a cidade informacional “na qual uma série de transformações sociais, econômicas e políticas, potencializadas pelas tecnologias de informação e comunicação, têm prenunciado novas formas de interação do cidadão com o espaço urbano” (CASTELLS, 1999). O conceito de nódulo também é apontado pelo autor como o ponto de encontro no qual estão todas as instituições públicas e privadas que detém todos os dados que circulam no fluxo.

Benjamin Bratton (2015) atualiza alguns dos conceitos introduzidos por Castells em The stack: on software and sovereignty. A partir de um viés mais econômico, tecnológico e informacional, definido pelo autor como “capitalismo-plataforma de nuvens”. Ainda aponta que o grande desafio da contemporaneidade é que independente da geografia, a nuvem alcança qualquer lugar, constrói outros lugares (territórios desconhecidos, pois apaga geografias e constrói outras). Uma nova geografia constituída por redes e fluxos em diversos patamares/ou andares.

Curiosamente o sistema da nuvem informacional está presente acima e debaixo da terra. Formam camadas de troca de dados, constrói mundos e cartografias, habita novos territórios muito além dos lugares onde fazemos nossas atividades cotidianas. Conforme aponta Bratton, elas ocupam espaços transurbanos, excedem o conceito de lugar e fronteiras, são espaços de fluxos. Essas nuvens configuram as Cloud Polis e operam em uma camada intermediária sob as cidades, pois habitam um local nem virtual, nem real.

Esta configuração gera uma outra dinâmica mundial, novas divisões de poderes em novas “polis” que independem dos Estados para funcionarem, existirem e se constituírem em novas cartografias de rede. Essa análise de Bratton é esclarecedora para entendermos a dicotomia dessas nuvens que são terrenas, materializadas em grandes data centers –espalhados em lugares estratégicos no globo – e conectados por grandes cabos de fibra óptica (enterrados na terra).

Os designers e ativistas Daniël van der Velden e Vinca Kruk, do estúdio Metahaven, alfineta a opacidade dessa nuvem: “O Google, uma das sete maiores cloud companies, se comparou a um banco. Se os dados na nuvem são como dinheiro no banco, o que acontece com ele enquanto reside convenientemente na nuvem?” (METAHAVEN, 2012). A dupla observa um fenômeno interessante em relação aos usuários das redes: o senso de abstração sobre as nuvens, responsável por fazer com que os usuários (e dependentes das nuvens) fiquem cada vez mais tranquilos com seus dados guardados nas nuvens de algodão, dormindo como carneirinhos. E assim tornam-se cada vez mais resilientes à obscuridade do fluxo e armazenamento de seus dados pessoais nessas nuvens.

Ou seja, o usuário não precisa ou não quer entender o funcionamento de dentro da nuvem (do software ou aplicativo), onde seus dados estão. A coisa mais importante é que a nuvem funcione.

Vale mencionar que os serviços da nuvem Google vão além das buscas algorítmicas numéricas e alfabéticas e investe em serviços e aplicativos de visualização de imagem. O Google Cloud Vision é uma potente ferramenta de visão computacional que, por meio de aprendizagem de máquina, investiu no reconhecimento e rotulação de imagens com inteligências artificiais. A estratégia vai muito além do que é oferecido no Google Lenz – lançado para uso doméstico em 2018 – na medida em que todo o plano de negócios da empresa gira em torno da comercialização desses dados rastreados e tagueados, visando potenciais anunciantes.

A identificação de imagens e o aprofundamento do significado do que não se sabe (nesse caso, do que não se vê com o olho humano), ganha uma extensão a partir desse aplicativo que interconecta imagem com o significado do objeto. O aplicativo permite conectar a imagem ao seu nome científico, ou descrição textual, numa combinação de dados numéricos e alfabéticos e visuais sem precedentes. O serviço é oferecido como parte do Google Assistant ou nas câmeras dos celulares com sistema Android, quando o aparelho está conectado com uma rede. [Sidenote: 18. Informações extraídas do artigo de Lauren Gear When in nature, Google Lens does what the human brain can’t, publicado em 27 de junho de 2018. In https://www.wired.com/story/google-lens-does-what-the-human-brain-cant/: acesso em 30 de junho, 2018.]

Esse tipo de serviço vislumbra uma nova era de reconhecimento e busca de imagem de banco de dados na qual os dados visuais são associados a outros dados contextuais e talvez represente nesse momento um novo paradigma da era dos dados, no qual as imagens passam a ser interpretadas, clonadas e associadas com outros pares de imagens a partir de rótulos, tags, evidências de repetição que alimentam as redes neurais e treinam “o olho da máquina”.

Em Interrogating vision APIs (MINTZ e SILVA, 2019), os autores abordam as limitações das leituras dos serviços de visualização computacional do Google, IBM e Microsoft. Por meio de uma coleta de imagens acerca do mesmo termo, em diferentes países, o estudo apresenta as dificuldades de interpretações relacionadas às políticas socioculturais locais e os parâmetros estandardizados globais usados por esses classificadores de imagens.

O viés colonialista e comercial das visões computacionais também pode ser observado nessa pesquisa, no estudo de caso das imagens extraídas pela #mariellepresente e submetidas às leituras da visão computacional do Google, conforme detalharemos a seguir.

O argumento de Mintz e Silva (2019) reforça a importância da criação e treinamento de classificadores de imagens específicos (e independentes) para a catalogação de determinados grupos de imagens. A visão computacional está sujeita à visão de mundo e ao repertório do treinador da máquina. Ou seja, modos de ver eurocentristas, muitas vezes racistas e colonialistas, muitas vezes vinculados aos vieses comerciais das ferramentas.

Como visto, para esta pesquisa, trabalhamos com alguns sets de imagens capturadas a partir de algumas hashtags ativistas. Esse conjunto de narrativas, pode ser visto no experimento gráfico Calendário Dissidente.

 

#mariellepresente: visão humana X visão computacional

No conjunto de imagens arquivadas e organizadas pelo software do Calendário Dissidente, podemos observar que #mariellepresente é a hashtag com maior número de postagens dentro do período da coleta de dados. Tiveram início com o seu assassinato em 14 de março de 2018 e, desde então, esse conjunto de milhares de imagens representam um contexto digital inédito, no qual há uma intensa disseminação de conteúdos politicamente engajados, relacionados aos ativismos aos quais a figura de Marielle representa.

Captura de tela da representação visual da amostra de 2.000 imagens da #mariellepresente, publicadas nos dias 13 e 14 de março de 2019 (1 ano após a sua morte) e nos mesmos dias em 2020 (2 anos após a sua morte). A imagem apresenta a classificação de imagens a partir do uso de IA não supervisionado t-SNE (t-Distributed Stochastic Neighbor Embedding/ Distribuição das Imagens por Similaridade Visual).

No caso dessa hashtag, especificamente, essas imagens-mensagens relacionam-se a várias manifestações e a diversos eventos não exatamente relacionados à sua morte. Por um viés de análise semântica (JARDÍ, 2014) a figura de Marielle virou um ícone dos ativismos LGBTQIA+, racismo, empoderamento feminino, democracia, entre outros. E um símbolo de resistência, representado pela sua figura de mulher preta, lésbica, vereadora do Rio de Janeiro durante a gestão de Bolsonaro.

Os valores simbólicos da figura de Marielle mobilizam muitas narrativas nas redes sociais. São narrativas fragmentadas, relacionadas a alguma das várias lutas que de alguma forma estão relacionadas à sua imagem. Quando analisadas em conjunto, a partir da hashtag em questão, se potencializam, em um coro polifônico. No artigo Imagens da resistência: pensando sobre a visão computacional das inteligências artificiais e o capitalismo de vigilância pelas imagens de Marielle Franco [Sidenote: 19. O artigo Images of resistance: thinking about Computer Vision AI in surveillance capitalism through Marielle Franco’s images, publicado no Journal digital culture & society: networked images in surveillance capitalism (2022), foi escrito em conjunto com Vinicius Ariel dos Santos, Bruno Moreschi (coordenador do GAIA e orientador de Santos), Amanda Jurno, Monique Lemos e Lucas Sequeira, membro do Grupo de Inteligência Artificial (GAIA) do Inova USP.] , tivemos a oportunidade de ampliar essa análise sob o ponto de vista do capitalismo de vigilância, exercido pelas grandes nuvens.

O viés de vigilância das visões computacionais é um contraponto importante para a tese, na medida em que os rotuladores de imagem das Big Techs estão treinados para classificar figuras e textos associados a produtos de vendas, e fazem uma leitura estritamente visual do objeto e das palavras. Já os classificadores de imagem da tese foram treinados para classificar elementos relacionados às linguagens visual (ilustrativa ou fotográfica) e verbal (tipografia digital ou manual), com a finalidade de decodificar as linguagens visuais emergentes das redes.

Para os propósitos deste artigo, selecionamos a amostra capturada para o Calendário Dissidente: 300.000 imagens coletadas, nas quais 69,8% delas foram marcadas com #MariellePresente. Desse conjunto, escolhemos 83 imagens relacionadas à Marielle que atingiram o limite de 50.000 curtidas em agosto de 2020 – extraídas da biblioteca Instaloader para a linguagem de programação Python. O segundo conjunto consiste em 213.000 imagens postadas no Instagram, com esta mesma hashtag de janeiro de 2019 a agosto de 2020.

Observamos como essas imagens foram compreendidas pela Google Cloud Vision – ferramenta comercial do Google, treinada a partir de rótulos (labels) focados em geração e negócios para clientes da plataforma. Com base nestas análises de visão computacional, discutimos as ambivalências que o ativismo enfrenta no âmbito capitalista das mídias sociais. E descobrimos que a imagem de Marielle, provavelmente por conta do fenômeno de repetição de sua imagem na dentro e fora das redes, consegue quebrar a invisibilidade do negro na internet. A Google Cloud Vision, passou a reconhecer o rosto de Marielle.

A fotografia abaixo, de autoria de Bernardo Guerreiro, foi feita em 2016 no Complexo da Maré, na época de sua campanha para vereadora do Rio de Janeiro. Depois de sua morte, esta imagem circulou primeiramente via Mídia Ninja e foi replicada inúmeras vezes. É o retrato de Marielle que mais circulou no Instagram e no Google Image, apropriado de diversas formas. Essa imagem, devido à sua ampla circulação, também é uma das únicas reconhecidas pelas IAs da Google Cloud (e tagueada) com o tag “name” Marielle Franco.

A fotografia de Marielle, de autoria de Bernardo Guerreiro, 2016.

Por outro lado, apesar do resultado da visão computacional rotular a figura de Marielle Franco, como melhor aposta, notamos que os rotuladores da Google Cloud Vision classificaram essa imagem icônica de Marielle com as seguintes tags: 99% cabelo; 91% hairstyle; 87% beleza; 81% moda; 80% lábios; 80% cabelo preto; 79% humano; 70% street fashion; 65% pescoço; 62% fotografia, o que comprova que as IAs foram treinadas para identificar objetos específicos que geram tráfego e são metadados para ações comerciais. A tag “humano” está em 7º lugar e a figura da mulher não é identificada pela IA, muito provavelmente por ela ser negra.

Captura de tela de 11 de abril de 2020: visão computacional da Art Decoder, software
criado por Bruno Moreschi e Gabriel Pereira, que compara os rótulos das grandes nuvens.
Nesse exemplo, vemos os resultados gerados pelas IAs do Google Cloud Vision.

As discussões em torno da leitura dessas imagens pelo viés do capitalismo de vigilância contemporâneo podem ser aprofundadas a partir das ponderações de Zuboff (2019). Esse autor, nos alerta sobre o comércio de dados capturados a partir da navegação dos usuários. Essas categorizam e tagueam as imagens com labels específicos, visando os segmentos de seus anunciantes: empresas de cosméticos, automóveis, tecnologia, turismo, setor de alimentação, vestuário etc. Assim, os anúncios passam a ser direcionados aos consumidores, internautas que deixam seus rastros na rede de forma invisível. Ver imagem vigilante.

Não vamos estender essa questão da politização de dados, embora seja um ponto importante para entendermos a complexidade da ecologia das imagens informacionais. Grosso modo, podemos dizer que há uma dicotomia das hashtags ativistas das redes. Se por um lado agregam comunidades e são capazes de engajar multidões acerca de uma luta, conseguindo muitas vezes alterar (ou no mínimo intimidar) o status quo sobre determinados assuntos – como no caso de #blacklivesmatter e #mariellepresente – por outro lado, oferecem dados que podem ser manipulados pelas grandes corporações e permitem, de forma imperceptível ao internauta, a varredura de dados para ações de grupos antagônicos, proclamadores de fake news, além de oferecer informações preciosas para o comércio on-line, principal fonte de renda das Big Techs. Ou seja, quando vemos uma imagem (um metadado) se repetir muitas vezes no nosso feed, essa imagem exposta representa além do ativismo a qual simboliza. Ela é uma imagem cujas tags são potencialmente rentáveis para as grandes plataformas.

Vimos como a imagem-mensagem está atrelada aos acontecimentos das ruas e como o contexto sociopolítico interfere diretamente na produção da imagem, é diretamente proporcional ao engajamento da narrativa de determinada hashtag nas redes. Este agregador de imagens-mensagens dá visibilidade a muitas causas, destaca alguns atores, usuários e produtores de linguagem. E também receptores e mediadores das imagens-mensagens clonadas, apropriadas, remixadas.

A visualização de algumas narrativas como a #mariellepresente, extraídas e analisadas para exemplificar a potencialidade e diversidade das linguagens nas redes a partir da lupa do design gráfico apresenta um recorte dentre as milhares de imagens e aponta como a edição cognitiva limitaria a possibilidade de descobrir artistas emergentes, outros trabalhos e diferentes técnicas.

Entretanto, a visualização com metodologias de IA apresenta agrupamentos de imagens por semelhança visual (no caso do uso da ferramenta t-SNE), que estão longe de representar uma leitura visual das materialidades e linguagens empregadas no post, assim como não conseguem discernir o contexto no qual a imagem foi produzida e veiculada.

Ao verificar a leitura pelos classificadores de imagens das grandes nuvens computacionais, verificamos que esses são programados para ler a imagem a partir do viés cultural de quem treina a máquina para a rotulação de imagens, privilegiando aspectos comerciais e denunciando o colonialismo explícito nas visões computacionais.

A problematização da leitura da #mariellepresente por essas visões computacionais representa um contraponto importante ao fato de a pesquisa propor como desafio metodológico a criação de classificadores de imagens específicos a partir de paradigmas estéticos.

A leitura crítica desses processos institucionalizados pelas nuvens computacionais de empresas como o Google, nos coloca a par da dificuldade da análise de uma amostra volumosa de imagens a partir de critérios contextuais (sociopolíticos e culturais) e estéticos (pela sua configuração formal). Aplicar o uso de scripts de visualização por meio de inteligências artificiais para fins criativos e arquivísticos nos pareceu o caminho mais assertivo para atingir nossos objetivos.

 

Narrativas desobedientes, dados idem

Os dados não obedecem a nossos comandos e desejos. Eles aferem e apostam em uma média e no padrão de repetições e dados numéricos. Como vimos, muitas vezes os resultados são críticos e confusos, análogos à nossa interpretação que, muitas vezes, não consegue aferir uma única categoria à determinada imagem. Classificar essas imagens compostas de múltiplas linguagens é uma tarefa complexa, que problematiza a linguagem remixada das redes e deixa claro a interdependência entre as inteligências artificiais e os humanos.

Para a máquina e para nós, humanos, a ação de classificar significa encontrar evidências que se repetem e configuram um padrão reconhecível dentro de alguns parâmetros. Ao analisar visualmente os erros dos classificadores, conclui-se que a subjetividade da interpretação da rede neural coincide com as dúvidas da classificação dos editores ao estabelecer os modelos ideais para treinar cada categoria de classificador. [Sidenote: 20. Tema também abordado no artigo A subjetividade da interpretação de imagens pelas inteligências, publicado pela autora da presente tese com Giselle Beiguelman, no livro Inteligência artificial: avanços e tendências, 2021.]

Os modelos de inteligências artificiais, criados especificamente para a análise desse conjunto de imagens, foram programados para ler aspectos, às vezes intangíveis, relacionados às suas composições formais e significados. O léxico da linguagem visual é carregado de significados semânticos que fogem a qualquer classificação maquínica, estandardizada ou padronizada. O repertório cultural atribui valores à imagem lida, por meio de processos de associação que extrapolam a sintaxe visual da composição da imagem. E é justamente esse caráter contextual do olhar que aproxima os erros da classificação da máquina aos erros humanos.

A dúvida e a subjetividade na leitura das imagens são inerentes ao processo, além de presentes nos acertos interpretativos da máquina treinada para este projeto. Treinada e manipulada como uma extensão classificatória altamente escalada e capacitada para reconhecer, selecionar e categorizar diversos tipos de imagens, em grandes quantidades, e em segundos. Os dados inferidos como referência visual já passaram por uma interpretação prévia, foram revisados para servirem como parâmetros estéticos de determinado conjunto de imagens. Essa etapa é crucial e nesse estágio reside toda a responsabilidade e o poder humano em manipular os dados para um fim determinado.

A interdependência entre os classificadores de imagens e as diretrizes dadas pelo seu treinador é um ponto crucial para entender como a subjetividade da interpretação da máquina está relacionada ao nosso repertório cultural, ideológico e, principalmente, ao objetivo principal do editor e pesquisador. Os trabalhos de Paglen (2018), Zer-Aviv (2020) e Moreschi (2020), expostos na Galeria Uso de IA para fins artísticos e curatoriais, explicitam a responsabilidade e poder de decisão do treinador, o homem.

No contexto do desconhecimento do que de fato é arquivado retroativamente pelas empresas detentoras dos dados das nuvens das redes sociais, a construção dos classificadores em questão aponta alguns desdobramentos importantes para o campo do design, da fotografia e da net art no quesito da interpretação e da subjetividade das IAs. Os softwares criados geraram seis rotuladores de imagem, estão com os códigos abertos e poderão contribuir para outras pesquisas no campo.

A constatação da interdependência entre os classificadores de imagens e as diretrizes dadas pelo seu treinador, neste caso um pesquisador e designer gráfico, foi um ponto crucial para entender como a subjetividade da interpretação da máquina está relacionada ao repertório cultural, ideológico e, principalmente, ao objetivo principal do editor e curador das imagens.

As imagens arquivadas pelo rótulo “ilustração digital” estão abertas a novas interpretações, sujeitas a outras categorizações estéticas, na medida em que algumas imagens apresentam uma linguagem remixada, composta por sobreposições de imagens e colagens. Outras, são compostas por desenhos vetorizados, massas de cores que configuram formas e contornos. Essas imagens inspiram novas curadorias e a criação de novas narrativas e outras reinterpretações gráficas.

Com a visualização das classificações, conseguimos aferir o que merece ser arquivado à luz do design gráfico, como uma nova linguagem visual inerente às redes sociais. E como memória gráfica brasileira. Em tempos de “memória da amnésia” e políticas de esquecimento (BEIGUELMAN, 2019), a criação de rotuladores próprios para classificar as imagens-mensagens dissidentes significa a possibilidade do designer de estabelecer critérios do que vale a pena ser lembrado, arquivado e visualizado.

A adesão pela metodologia de aprendizagem de máquina para a criação de rotuladores nos coloca em uma situação peculiar onde a estratégia curatorial apreende novas informações relacionadas às imagens analisadas, a partir dos acertos e dos erros dos modelos neurais. A visualização das imagens pelos modelos informacionais contribui para alguns questionamentos do que vemos e das possibilidades interpretativas acerca da imagem, nem sempre categorizadas em uma única categoria. A interpretação visual das IAs, reconfigurada e “re-representada” pelos modelos visuais do MMD Critic (KIM et al., 2016) nos leva a outras descobertas e indagações.

A estética de banco de dados emerge da superprodução de informações disponíveis no fluxo das redes. A pesquisa aponta o potencial estético da visualização das narrativas visuais pelas inteligências artificiais e a ressignificação dessas narrativas a partir dos dados das redes neurais. Na medida em que ampliamos a análise dos exemplos visuais com o uso de inteligências artificiais, entramos em contato com outras características dessas peças gráficas, objetos materiais.

Ao navegar pelos meses dos calendários de 2019, temos uma boa leitura por meio de imagens, um mosaico de linguagens visuais – ilustrações manuais, imagens documentais apropriadas da grande mídia, ilustrações vetoriais digitais e colagens com linguagens remixadas. Lemos os acontecimentos sociopolíticos por meio de outra linguagem. As imagens produzidas e compartilhadas por muitos formam uma narrativa heterogênea, em termos de linguagem visual, mas uníssona em termos de mensagem. Um jogo de linguagem, participação coletiva, adição, apropriação, trocas afetivas, posições políticas, ativismos relacionados a vários temas. Há uma contaminação de um sentido comum, de algo que nos afeta, gerando um senso de necessidade em participar dessa corrente, produzindo conteúdos gráficos, participando desse jogo de linguagem de ler por imagens.

O propósito de criarmos os experimentos gráficos Calendário Dissidente e o Pantone Político tem o objetivo de dar visibilidade às novas linguagens visuais emergentes das redes por meio de novos formatos curatoriais, a partir de pressupostos críticos em relação ao uso das ferramentas tecnológicas e do uso de IA. A subjetividade interpretativa das máquinas inspira novas investigações em relação ao homem-máquina, além de sugerir um campo abrangente a ser explorado por designers, artistas e pesquisadores da imagem em geral.

Galeria – Uso de IA para fins artísticos e curatoriais

 

Esta galeria apresenta as discussões tratadas nesse capítulo por meio referências de obras fotográficas, de net art ou sites específicos de artistas e designers que se utilizam de estratégias de visões computacionais e uso de IAs. Ilustra também algumas das tipologias de imagem contemporânea tratadas nos tópicos Cultura visual e imagem digital e Glossário Imageria.

Os trabalhos também estabelecem um diálogo com os projetos Calendário Dissidente e Pantone Político, são exemplos de como podemos interrogar o uso de visões computacionais a partir de operações de linguagens realizadas com auxílio não-humano, por robôs. Não temos a pretensão de nos aprofundar na análise dessas obras e sim de estabelecer uma conexão com os conteúdos tratados na tese.

Desta maneira, ampliamos o entendimento do leitor acerca de tais práticas, ressaltando a importância da atuação de artistas, designers e pesquisadores como agentes críticos às restrições de leitura e à vigilância das IAs. Esses descobrem brechas para quebrar o paradigma dos processos de aprendizagem default das máquinas, usando as ferramentas para fins criativos e críticos.

Ao reexaminar os experimentos Calendário Dissidente e Pantone Político, no contexto dos trabalhos da galeria e de todo o processo de criação dos classificadores estéticos, enxergamos outras potencialidades dos nossos estudos. São novos modos de aprender a ver e fazer design com auxílio maquínico. Nesse ponto, afirmamos como as estratégias propostas para a pesquisa subvertem os padrões das visões computacionais e às políticas dos aplicativos.

Os resultados das visualizações maquínica sobre as imagens classificadas pelo viés estético, objeto do nosso estudo, apontam como podemos dar visibilidade e inteligibilidade aos direcionamentos algorítmicos das redes sociais; e quais as possibilidades de catalogação, classificação e criação de design de narrativas a partir do uso das IAs. Desta forma, respondem à uma das questões da tese.

 

#vigilância

A ambiguidade das câmeras de controle e vigilância. Filmam o que ninguém vê ou teria acesso. São incorporadas na paisagem como invisíveis, apesar de constituírem aparatos urbanos e tecnológicos. Há outro tipo de vigilância, nas redes sociais, constatada no paradoxo da veiculação e na exposição da imagem de quem quer ser visto (e vigiado) pelos seus seguidores em atividades cotidianas. Um misto de controle e vigilância social e cultural relacionado às questões identitárias e culturais.

 

Série Nests, 2015

Jakub Geltner

Escultura à beira mar. Aarhus, Dinamarca.
Escultura à beira mar. Sidney, Austrália.
Instalação permanente. Chateau Třebešice, República Tcheca.

Fonte: telas capturadas no site do artista (http://www.geltner.cz/).

As instalações urbanas do artista tcheco Jakub Geltner criam uma simbiose entre as câmeras closed-circuit television (CCVT) com o ambiente. Com humor, as obras questionam se existe de fato a separação entre o ambiente artificial e o natural. Ver imagem vigilante, imagem relacional e imagem não-humana.

 

Mass Ornament, 2009

Natalie Bookchin

Captura de tela do vídeo no site da artista
Captura de tela do vídeo no site da artista
Instalação no Centro para Cultura Contemporânea (CCCS). Florença, Itália.

Fonte: telas capturadas no site da artista (https://bookchin.net/projects/mass-ornament/).

Nesta instalação, Natalie Bookchin extraiu e combinou centenas de vídeos do YouTube nos quais as pessoas retratam cenas do seu cotidiano. Ao clipar as cenas lado a lado, a artista gera uma espécie de coreografia, um tipo de videodança realizado com imagens apropriadas para expor uma narrativa sobre os padrões generalizados de comportamento e exposição da intimidade nas redes sociais. A trilha sonora também é reapropriada de dois filmes Gold Diggers of 1933 de Busby Berkeley e Triunfo da Vontade de Leni Riefenstahl, dos anos 30. Ver imagem-dança.

 

#Imagemgenerativa

Imagens geradas por inteligências artificiais através de uma colagem realizada com banco de imagens e por meio de uso de softwares específicos. O resultado final pode ser considerado uma imagem deepfake, uma imagem interpretada, uma imagem genoptica. Ou seja, uma imagem não humana.

 

Zizi Drag, 2019 em andamento.

Jake Elwes

Captura de tela do perfil do Instagram de @zizidrag, criado pelo artista inglês Jake Elwes

O Zizi Project é uma coleção de trabalhos de Jake Elwes na qual é explorada a intersecção entre inteligência artificial e a performance drag. O artista discute os desafios dos drags em explorar diferentes gêneros enquanto as IAs fazem o mesmo, ao criar imagens geradas por meio de ferramentas de deepfake. Neste jogo, Elwes desvela os vieses inerentes ao trabalho de aprendizagem de máquina.
Ver imagem deepfake e imagem genoptica.

 

 

Carte Nationale d’Identité (CNI), 2017

Raphael Fabre

Captura de tela do documento oficial CNI, com a imagem generativa do rosto do artista.

Fonte: tela capturada no site da artista (https://www.raphaelfabre.com/#cni).

Neste trabalho, o artista francês usou software 3D para reconstruir sua face e tirar a Carteira de Identidade francesa com uma foto 3×4 completamente computadorizada. Com o intuito de enfatizar a artificialidade da imagem criada, não usou scanners e optou pelo uso de ferramentas generativas para criar o seu retrato. Fabre critica a banalização, o perigo e as questões éticas do uso desses softwares.

 

 

thispersondoesnotexist.com, 2019

Captura das imagens geradas pelas IAs

Fonte: telas capturadas no site https://this-person-does-not-exist.com/en e https://thispersondoesnotexist.com/image.

O gerador de rostos thispersondoesnotexist.com é uma inteligência artificial alimentada por dois sistemas de redes neurais que competem entre si. A primeira gera algo e a segunda tenta descobrir se os resultados são reais ou gerados pela primeira. O treinamento acaba quando a primeira rede começa a constantemente “enganar” a segunda. É quase impossível reconhecer uma imagem falsa de uma pessoa, embora a colagem realizada pelas IAs com as diferentes faces extraídas do banco de dados do site, às vezes, deixa rastros das montagens, com orelhas desproporcionais, brincos diferentes (como o caso da figura acima) ou recortes imprecisos.

 

 

#visãocomputacional

Treinamento de máquina com imagens e classificadores robóticos com vieses tendenciosos: ideologia, política e preconceito e novas descobertas na subjetividade da interpretação dos robôs.

 

The Normalizing Machine, 2018

Mushon Zer-Aviv

Interação do participante apontando a pessoa “mais normal”.
Cartões dos participantes
Cartelas de tipos fisionômicos desenhados por Alphonse Bertillon para servir como banco de dados para os desenhos de retrato falado, circa 1909.

Fonte: telas capturadas no site do artista (https://mushon.com/tnm/).

Por meio de uma instalação interativa, o artista questiona os métodos de padronização algorítmica dos sistemas de reconhecimento facial. Cada participante é convidado a apontar qual o visual mais normal das faces de quatro painéis compostos com rostos de outros participantes. A imagem da pessoa selecionada é examinada por algoritmos e adicionada a um banco dados, projetado em uma parede com reproduções das pranchas antropométricas do criminologista francês Alphonse Bertillon, pai do retrato falado, cujos desenhos serviram de base para a eugenia. Zer-Aviv define seu projeto como um experimento na área de aprendizagem de máquina e no “preconceito algorítmico”, pois os rostos selecionados são sempre de pessoas brancas ocidentais, padrões de uma sociedade eurocêntrica com tendências discriminatórias. Neste procedimento, faz um contraponto ao trabalho do criador da computação e da inteligência artificial, o matemático inglês Alan Turing, cujo objetivo de pesquisa era buscar as diferenças e não a padronização.

 

 

VFRAME, 2018

Adam Harvey

Demo do algoritmo de identificação de objetos RBK-250
Imagem apresenta a leitura e identificação de fragmentos das bombas pela IA
12 frames de um vídeo definidos pela IA como os mais importantes

Fonte: telas capturadas no site do projeto (https://vframe.io/)

O artista estadunidense, baseado em Berlim, realizou o trabalho com o Arquivo Sírio, uma organização dedicada a documentar crimes de guerra. VFRAME, acrônimo para Visual Forensics and Metadata Extraction, termo também explanado anteriormente por mim no artigo mencionado. Trata-se de um conjunto de ferramentas de visão computacional para a área de direitos humanos. A partir de vídeos captados nas zonas de guerra, o projeto identifica as bombas de fragmentação – que carregam outros artefatos explosivos. Esses, são uma das criações mais cruéis do período nazista e seguem sendo usadas nas guerras do Oriente Médio. O VFRAME usa modelagem 3D e fabricação digital combinados a um software, para criar conjuntos de dados de treinamento de imagem. Operando com visão computacional, o trabalho é o oposto dos fake vídeos e aposta na criação de uma ferramenta para defender os direitos humanos usando IA. Ver imagem multidimensional. 

 

 

Excavating AI: The Politics of Training Sets for Machine Learning, 2019

Kate Crawford e Trevor Paglen

 

A leitura do classificador de imagem do Image Net, rotulando a obra de Magritte na categoria “maçã” Image Net, extraída da pesquisa Excavating AI (CRAWFORD e PAGLEN, 2019).
Página das imagens classificadas como “Viciados em droga” ImageNet, extraída da pesquisa Excavating AI (CRAWFORD e PAGLEN, 2019).

Fonte: telas capturadas no site do projeto (https://excavating.ai/).

Em Excavating AI os artistas e pesquisadores estudam a lógica da escolha das imagens usadas para treinar um sistema de inteligência artificial e como tais sistemas “enxergam” o mundo. Metodologicamente, denominam esse trabalho de arqueologia de datasets, pois escavam todas as camadas dos materiais e catalogam princípios e valores nos quais foram construídos. Utilizam como referência e objeto de análise o site ImageNet, no ar desde 2009, cujo objetivo era mapear todos os objetos do mundo por meio do uso do serviço Mechanical Turk, da Amazon. Este projeto pioneiro antecipa uma questão crucial relacionada à visão computacional: analisar imagens significa lidar com contradições interpretativas, sejam elas relacionadas aos treinadores das máquinas e sua visão subjetiva de mundo, ou às interpretações das máquinas treinadas por humanos.

 

 

From “Apple” to “Anomaly”, 2019

Instalação para o Centro Cultural Barbican, Londres
Trevor Paglen

© Tim P. Whitby/Getty Images

 Nesta instalação Paglen se apropriou de 30.000 imagens extraídas do ImageNet, o banco de dados mais divulgado e disponível ao público. As imprimiu e ordenou pela categorização dada pela inteligência artificial do ImageNet. Ao expor as imagens classificadas pelos nomes dos objetos, lado a lado, o artista apresenta as contradições, preconceitos e viés cultural dos humanos responsáveis pelos treinamentos das IAs.

 

 

Outra 33ª Bienal de São Paulo, 2018

Bruno Moreschi

 

Ação “Registros decodificados: construção do espetáculo” (frame de vídeo) © Ana Cris Lyra
Ação “Registros decodificados: construção do espetáculo” (frame de vídeo) © Ana Cris Lyra
Ação “Registros decodificados: passado oficial” (frame de vídeo) ©Pedro Ivo Trasferetti

Fonte: telas capturadas no site da 33ª Bienal de São Paulo (http://33.bienal.org.br/pt/exposicao-individual-detalhe/5227).

Os vídeos de Bruno Moreschi, artista comissionado para a “Outra 33ª Bienal” (https://outra33.bienal.org.br/), questionam o sistema de arte e os arquivos oficiais de grandes instituições culturais e museológicas. Partindo das gravações das câmeras de segurança e de captações de vídeos, o projeto decodifica e evidencia a relação da inteligência artificial com cenas, objetos e pessoas que normalmente não seriam catalogadas como arquivo da mostra; incorpora a equipe de montagem, seguranças e a equipe da faxina, e discute a interpretação de obras de arte contemporâneas (imagens não identificadas pelas visões computacionais). Trabalhando com sete modelos de inteligências artificiais, o artista edita diferentes narrativas, como os Registros decodificados: construção do espetáculo e Registros decodificados: passado oficial. Para Moreschi, as leituras das IAs, treinadas para identificar alguns padrões, poderiam ser consideradas como erros, porém são amplificações da exposição que trazem outras informações sobre a memória desta. O projeto teve a colaboração interdisciplinar de Gabriel Pereira, Bernardo Fontes, Nina Bamberg e Guilherme Falcão.

 

 

Estudos para enganar a visão de máquina I, 2020

Sérgio Venâncio

 

Capturas de tela do vídeo das experimentações.

Fonte: telas capturadas no site do artista (https://sergiovenancio.art/works/eevm1.html).

O vídeo retrata uma série de experimentações performáticas com o objetivo de enganar ou confundir um sistema de machine learning. Explora situações não previstas durante seu processo de treinamento. As grafias partem de gestos corporais simples e o experimento demonstra como a visão computacional não consegue definir as identidades corpóreas.

 

 

#comhumanos, alémdehumanos

 

Colaboração homem-máquina para trabalhos criativos: uso de aprendizagem de máquina para fins artísticos e estratégias de driblar a máquina

 

Rituais da Complexidade #3, 2021

Fernando Velázquez

Escultura #2 Série Rituais da complexidade
Escultura #2 Série Rituais da complexidade

 

Fonte: telas capturadas no site https://www.zippergaleria.com.br/.

Em Rituais da complexidade, Fernando Velázquez explora o uso da inteligência artificial pela ótica decolonial. Mistura ícones e objetos representativos da cultura africana e europeia em um jogo aleatório de mistura algorítmica. O artista usa classificadores próprios e o resultado é reproduzido em imagens fílmicas e em esculturas, figuras geradas dos encontros das estéticas gregas e negro-africanas. O trabalho interroga as relações binárias de tradição e contemporaneidade, do passado e do futuro disforme no qual a herança eurocêntrica é deslocada para dar visibilidade a outras culturas.

 

 

Bottanica Tirannica, 2022

Giselle Beiguelman

Exemplo de planta cujo nome científico tem viés antissemita
“Errante”, imagem gerada por IA de imagens de todas as epécies de plantas nomeadas vulgarmente como “Judeu errante” em vários idiomas. A lenda Judeu errante associa os judeus ao martírio da via sacra da morte de Cristo desde o século XIII.

 

“Flora Mutandis”, imagem gerada por IA a partir de imagens de espécies de plantas nomeadas com nomes preconceituosos. 

Na exposição Botannica Tirannica, Giselle Beiguelman discute o eugenismo científico a partir das origens da taxonomia imperialista e colonialista das plantas, por meio de imagens, vídeos e jardins de “ervas daninhas”. As instalações destacam os nomes científicos ou vulgares usados na catalogação das espécies botânicas, cujos significados denotam preconceitos étnicos, raciais, antissemitas e machistas.

Acima, a artista apresenta imagens interpretadas por inteligências artificiais. Essas fazem uma varredura dos nomes daquela espécie, gerando uma nova flor. Uma imagem interpretada, um jardim decolonial imaginário.

 

 

A life in flowers, 2019, para Venice Virtual Reality, Bienal de Veneza

Armando Kirwin e Azuma Makoto

Fonte: telas capturadas no site do projeto https://headspacestudio.com/ e da Bienal de Veneza. https://www.labiennale.org/en/cinema/2019/venice-virtual-reality/life-flowers.

A instalação e experiência interativa em realidade virtual funciona através da voz do próprio participante. O projeto combina o trabalho da escultora botânica Azuma Makoto com Armando Kirwin, criador de realidades virtuais. Por meio de IA, os participantes conversam com Azuma sobre a relação entre a vida e as flores e as respostas geram dados, representados em um buquê único para cada participante. Ver imagem porosa e imagem articulada.

 

 

Drawing operations, 2015 em andamento

Sougwen Chung

Fonte: telas capturadas no site da artista (https://sougwen.com/)

O trabalho performático de Chung consiste na pintura participativa entre um braço robótico de um corpo mecânico como uma extensão do corpo da artista. Desta forma a artista e a IA compõem desenhos em movimentos articulados. O processo de trabalho tem como objetivo pensar no ato de desenhar por meio do movimento em conjunto com os dados coletados por um sistema de IA.

Galeria – Design de impacto

Nesta galeria, procuramos reunir algumas referências visuais do campo do design gráfico dissidente. Sem a pretensão de compor uma arqueologia visual e linear, mas com o intuito de ampliar o repertório para o entendimento das imagens-mensagens pelas estratégias do design, fizemos uma edição das pesquisas de Liz Mcquiston (1995; 2015), Chico Homem de Mello (2011; 2012) e Milton Glaser (2017). Além da nossa coleção e curadoria de cartazes que consideramos emblemáticos para ilustrar a importância do cartaz dissidente como peça-gráfica, dispositivo e, simultaneamente, veículo de comunicação. Em um formato despretensioso, esta galeria de cartazes dissidentes busca criar uma ponte entre a influência da tradição da produção de cartazes ativistas impressos desde os anos 60, e a produção atual dos cartazetes das redes, as imagens-mensagens.

ler

Partimos do pressuposto que estamos diante de uma evolução formal do tradicional cartaz ativista, em decorrência da evolução e surgimento de outros meios tecnológicos de produção, mediação e veiculação de narrativas visuais. A pesquisadora e designer estadunidense Liz Mcquiston (2015) nos ajuda a elucidar essa questão. As imagens ativistas ao longo da história constituem uma vasta produção gráfica de cartazes impressos e representam diferentes causas, em contextos globais e locais ao longo do século XX.

Com o advento da internet 2.0, notamos um boom na produção, mediação e circulação de imagens dissidentes, imagens essas que definitivamente nos marcaram com seu “impacto visual”, título do livro de Mcquiston (2015) sobre a criatividade dissidente no século XXI. A autora faz uma edição temática dos cartazes digitais e das imagens produzidas por artistas e designers em resposta a protestos e dissidências políticas e sociais. A imagem do ataque terrorista às torres gêmeas em Nova York, em 11 de setembro, é considerada a grande ruptura do novo século, a nova imagem contemporânea, que circulou em questão de minutos nas mídias de todo o mundo. Esta imagem, de dois aviões sequestrados pelo Al-Qaeda, grupo terrorista islâmico, se chocando com o símbolo do capitalismo tem forte impacto visual e deflagrou uma nova forma de protestos visuais, via imagens digitais pelas mídias televisivas, impressas, sites on-line e e-mails – ferramentas dos anos 90.

A marca do ativismo nos anos 2000 acontece no final da primeira década do século XXI, com as tecnologias emergentes e uso de dispositivos móveis e o compartilhamento das imagens pelas redes sociais, via smartphone. A tecnologia alterou completamente a forma e a linguagem dos protestos e resultou em revoluções como a Primavera árabe (2011), o movimento Occupy Wall Street nos Estados Unidos e na Europa (2011) e o movimento “Passe livre” no Brasil (2013) (Ibid, p. 29-36).

Comparando a produção do design de comunicação da era pré-redes com as novas possibilidades de penetração e velocidade oferecidas pelas mídias atuais, a autora aponta que a questão central é respondermos à pergunta “Is the poster dead?” (O cartaz está morto?), a qual ela prontamente responde:

“O uso do cartaz nunca esteve tão vivo, em vários tamanhos, rabiscados e feitos à mão, ou impresso, eletrônico e impulsionado pela tecnologia móvel dos aplicativos para celulares, e ainda performando seu papel mais importante, o imediatismo das expressões políticas. Os bancos de imagens on-line também emergiram, arquivando e disponibilizando cartazes gerados pela mobilização de protestos sobre desastres naturais e outras crises. Vê-los é como se escutássemos os gritos das manifestações ou como se estivéssemos imersos em uma conversa urgente. O espectador sente a raiva do outro… Mesmo sem conseguir ler o idioma da mensagem escrita” (Ibid, p. 10, tradução nossa).

No Brasil, podemos apontar duas grandes manifestações nacionais nas ruas na última década que repercutiram na produção gráfica ativista. A maior delas, “Passe livre”, ocorreu em junho de 2013 e teve adesão maciça em mais de 500 cidades. Contra o aumento de tarifas de ônibus, reivindicava o transporte coletivo gratuito (quando o pano de fundo era o impeachment – o golpe – que estava em curso para tirar a presidente Dilma). A segunda grande manifestação de repercussão nacional foi a #elenão, contra o voto em Bolsonaro, em 28 de setembro de 2018 no Brasil. Ambas foram pluripartidárias e se destacaram pelo engajamento e participação de coletivos, cidadãos e estudantes. Nesses dois eventos comprovamos um paralelismo quase em tempo real do que acontece nas ruas e nas redes. As estratégias ativistas, os movimentos coletivos e o modus operandi das coberturas de mídia – cada vez menos institucionalizadas – repercutiram nas estéticas das imagens-mensagens produzidas pela pessoa comum/internauta/produtor de linguagem e de fatos noticiosos. Ivana Bentes aborda como essa mídialivrista, produzida por cidadãos dentro do acontecimento, com uma câmera na mão representa novas linguagens e paradigmas comunicacionais (BENTES, 2019). Ver Cultura visual e imagem digital e imagem metonímica, por Grusin (2020).

O movimento das ruas de 2013 tem semelhanças aos acontecimentos nas ruas de outros lugares no mundo, e o crescimento e engajamento dos usuários das redes na criação das imagens mensagens só cresceu desde então. Nossa coleta de dados começou em 2017, como já visto com #lulalivre. Foi somente com a implantação do design code do projeto que conseguimos aferir os números do #elenão.

 

Produção gráfica de cartazes ativistas

A “gráfica da ação”, como define Homem de Mello (2012), é caracterizada por algumas correntes estéticas relacionadas a acontecimentos políticos que marcaram a linguagem visual da produção gráfica ativista. Em uma breve retrospectiva, Mello destaca algumas vanguardas estéticas que influenciaram a produção gráfica do design brasileiro nos anos 60 (e ainda são usadas como citações explícitas nos dias de hoje): os cartazes soviéticos; as manifestações de maio de 1968 (no Brasil e no mundo); os cartazes poloneses relacionados à dissidência dos países do leste europeu; a produção americana dos anos 60 e 70, liderada pelos movimentos negros, feministas e estudantis; e a produção gráfica de Cuba (tendo Che Guevara como o ícone-mártir da revolução). Todos esses movimentos, sem exceção, foram pioneiros em usar técnicas de impressão rápidas e de baixo custo para a reprodução de peças gráficas de grande circulação (MELLO, 2012 p. 244-251). A necessidade de rapidez na produção e circulação podem ser comparadas às ferramentas de design, prontas para usar, nos aplicativos dos celulares. A alta reprodução, velocidade e veiculação das imagens-mensagens, idem.

As ferramentas tecnológicas à época eram manuais e os trabalhos gráficos, produzidos com o uso do stencil, da xilogravura e cordel, da serigrafia, colagens de fotografias e letras manuscritas. O resultado formal dessas peças está intrinsecamente ligado às condições de produção, mediação e veiculação dessas. A prática ativista de produção de cartazes se mantém ativa e se modifica de acordo com as mudanças culturais, sociais e tecnológicas. Com o uso de novas estratégias modernas – na produção, mediação e veiculação da vasta produção gráfica – esses cartazes ganharam novos potenciais estéticos, além de um alcance de circulação sem precedentes.

Também observamos o uso de técnicas manuais de baixo custo para as manifestações das ruas e das redes no Brasil nos dias de hoje. Os cartazes estudantis, produzidos com canetas, pincel e com a técnica de stencil sobre cartolinas e faixas, presentes nas manifestações estudantis como a #15m, de maio de 2019, são bons exemplos desse mix de velocidade e ação. Os trabalhos produzidos e veiculados na #coleraalegria, hashtag criada por um coletivo de artistas, também utilizam a técnica da pintura com tinta acrílica ou gouache sobre o papel e empregam elementos figurativos e vernaculares, ilustrando essa gestualidade espontânea, feita para as ruas e reproduzidas nas redes.

A manifestação por meio desses cartazetes (as imagens-mensagens) ou melhor – a comunicação visual dissidente das redes – também remete à produção dos cartazes ativistas do período pós-guerra (GLASER, 2017). Os aspectos formais dos cartazes, cores, composição, tipografia e a repetição serializada, copiada, imitada, apropriada, também são relevantes para examinarmos a cultura visual das redes como uma arte regenerativa (NAVAS, 2016), inerente aos meios as quais ela é produzida, reproduzida e circulada. Consideramos que os posts das redes sociais são análogos aos “cartazes” impressos ou feitos à mão. Embora os “posts” digitais não circulam nas ruas e sim no fluxo das redes e podem ser repostados e veiculados infinitamente.

A imageria das redes é composta pelo repertório cultural do usuário. Seus ideais e suas lutas são representados por meio de imagens nas quais os índices visuais, ícones, figuras de personalidade, mensagem verbal, ou ilustração figurativa, proporcionam uma identificação não só ideológica, mas estética. São jogos de linguagem.

A questão do gosto e as subjetividades que envolvem o processo de criação dessas peças, mas sobretudo o processo de recepção, vão ser medidas pelo engajamento de uma imagem-mensagem para determinado público, em determinado contexto sociopolítico e temporal. O mesmo ocorre com os cartazes desta galeria.

Como vimos nas imagens classificadas na categoria Apropriação, a edição dos posts cujas imagens principais são apropriadas de ícones da cultura pop, obras de Warhol, Kubrick, para citar alguns artistas, foi feita a partir do olhar do editor. Porém há infinitas apropriações de outros símbolos cujos códigos e léxico de linguagem não puderam ser absorvidos por mim, mulher branca, classe média, 50+, curso superior completo. Porém são absorvidos por outros públicos, e representam a democracia e a potência da comunicação por meio da heterogeneidade da imageria das redes.

O recorte das análises realizadas nesta galeria tem um olhar de alguém que atua no campo das artes visuais, do design e da comunicação. E pretende, com essa breve referência da história do design, contribuir para este campo, apontando novas vertentes relacionadas à evolução do design de comunicação, discutidas ao longo da tese.

 

Fonte: Imagens reproduzidas das seguintes publicações

AIGA EYE ON DESIGN. Disponível em: <https://eyeondesign.aiga.org/psychedelia-satire-solidarity-cubas-revolutionary-posters-showcase-the-countrys-golden-age-of-graphic-design/1-day-of-the-heroic-guerilla-1968-helena-serrano-ospaaal-the-mike-stanfield-collection/>. Acesso em: 05/2020.

VILAS BOAS, Pâmilla. Design revolucionário. Ideia Design, 2022. Disponível em:<https://ideiadesign.online/magazinebook/volume-05/design-revolucionario/> Acesso em: 05/2022

FRYE ART MUSEUM. Disponível em: <https://collection.fryemuseum.org/objects-1/info?query=Portfolios%20%3D%20%223439%22%20and%20Sort_Artist%20%3D%20%22Rodchenko,%20Alexander%22&sort=0>. Acesso em: 05/2020.

FUNDAÇÃO GETULIO VARGAS.Materiais de campanha de Tancredo Neves à presidência da República. Centro de Pesquisa e Documentação de História Contemporânea do Brasil. Disponível em: <https://www.fgv.br/cpdoc/acervo/arquivo-pessoal/tn/audiovisual/materiais-de-campanha-de-tancredo-neves-a-presidencia-da-republica>. Acesso em: 05/2020.

GLASER, Milton; ILIC, Mirko. The Design of Dissent. New York: Gotham Books, 2017.

HOMEM DE MELLO, Chico. Gráfica da ação. In: SACCHETTA. Vladimir (org.). Os cartazes desta história. Instituto Vladimir Herzog, 2012.

ITAÚ CULTURAL.Cartaz do Filme Deus e o Diabo da Terra do Sol. Enciclopédia Itaú Cultural, 2016. <https://enciclopedia.itaucultural.org.br/obra67136/cartaz-do-filme-deus-e-o-diabo-da-terra-do-sol> Acesso em: 05/2020.

LINS, Rico. Marginais Heróis. Rico Lins + Studio. Disponível em: <https://www.ricolins.com/portfolio/marginais-herois/>. Acesso em: 05/2020.

MALLALIEU, ANDY.  An unprecedented exhibition of original Cuban propaganda and iconic graphic design. Creative Boom, 2019. Disponível em: <https://www.creativeboom.com/news/an-unprecedented-exhibition-of-original-cuban-propaganda-and-iconic-graphic-design/> Acesso em: 05/2020.

MCQUISTON, Liz. Graphic agitation: Social, Political Graphics since the Sixties. London: Phaidon Press, 1995.

MCQUISTON, Liz. Visual Impact: creative dissent in the 21st Century. London: Phaidon Press, 2015.

MEMORIAL DA DEMOCRACIA. Finalmente, eleições diretas para presidente. Disponível em: <http://memorialdademocracia.com.br/card/finalmente-eleicoes-diretas-para-presidente>. Acesso em: 05/2020.

MUSEUM OF THE CITY OF NEW YORK. AAPI Month at MCNY. Disponível em: <https://www.mcny.org/aapi-month-mcny>. Acesso em: 05/2022.

STRECKER, MÁRION. Por que homenagear bandidos. Museu de Arte Moderna do Rio de Janeiro, 2020. Disponível em: <https://mam.rio/obras-de-arte/por-que-homenagear-bandidos/> Acesso em: 12/2020.

VICTORIA & ALBERT MUSEUM. Disponível em: <https://collections.vam.ac.uk/item/O76004/1905-the-road-to-october-poster-kulagina-valentina/> Acesso em: 05/2020.

Paradigmas estéticos para classificar imagens informacionais

Ao fazer a curadoria das imagens do Calendário Dissidente, editando uma produção de mais de 800.000 posts ativistas no Instagram, nota-se que há uma poética singular nas imagens produzidas. Para analisar essa imageria com características peculiares, estudamos algumas abordagens metodológicas a fim de propor uma estratégia que fosse eficaz e coerente para ser empregada numa pesquisa sobre design gráfico contemporâneo. Era claro que o volume de informação demandava braços e olhos maquínicos e a criação de parâmetros estéticos para catalogação e visualização de imagens não seria encontrada em um software de prateleira ou pelas visões computacionais oferecidas pelas chamadas Big Techs, como o Google e Meta.

Iniciamos este processo com uma análise qualitativa a partir de um processo cognitivo – a a edição das seis categorias mais representativas das estéticas das redes. As amostras das narrativas apresentadas neste ponto do trabalho elucidam a relevância dessas peças gráficas e apontam para problemas relativos ao arquivamento dessa produção efêmera. Assim, sobressai uma questão: como arquivar para classificar e como classificar para arquivar?

 

Categorias estéticas das imagens dissidentes

Depois de mais de um ano acompanhando o fluxo diário de postagens de imagens dissidentes, percebeu-se quais os traços principais que caracterizavam essas imagens. Como apresentado anteriormente, as categorias sugeridas procuraram organizar esses posts a partir de paradigmas estéticos pertencentes ao campo de design gráfico: critérios formais de composição, uso de tipografia, desenhos vetoriais, colagens e montagens muito específicas, com sobreposição de linguagens e uso de imagens documentais apropriadas da mídia jornalística. São elas: 1. Factual; 1.1. Meme (subcategoria de factual); 2.Ilustração Digital; 3. Tipografia Digital; 4. Ilustração manual; 5. Escritas vernaculares (escrita manual e/ou tipografia vernacular); 6. Apropriação.

Na análise cognitiva desse grande conjunto de imagens, organizadas pelas hashtags, foram observados alguns padrões estéticos, algumas tendências e a necessidade de classificar essa produção, à luz de outros parâmetros formais. A primeira classificação, resultou nessa taxonomia de seis categorias estéticas.

Os parâmetros utilizados nessa classificação se baseiam na natureza da figura predominante do post. Se é majoritariamente composto por uma ilustração digital ou manual, ou por uma fotografia documental, por exemplo. Para as peças tipográficas, observamos se a linguagem verbal é o elemento central e se esta é composta por fontes digitais ou fontes manuais, caligráficas ou feitas à mão. Abaixo esquematizamos como a metodologia de coleta de dados, catalogação e edição desse conjunto de imagens utilizou-se dos seguintes procedimentos:

  1. O uso da “#” precedido da palavra-chave para a visualização de dados: a legenda da imagem contemporânea;
  2. Captura de imagens do Instagram pelo software Stogram, usado para download de todas as imagens postadas no Instagram pelas hashtags escolhidas;
  3. Criação de parâmetros estéticos e categorias de tipos de imagem para classificar as imagens capturadas;
  4. Uso de aprendizagem de máquina supervisionada para otimizar e ampliar a classificação quantitativa de imagens com uso de rotuladores (labels) capazes de reconhecer milhares de imagens dentro das seis classificações estéticas usadas pela autora como dados (features) para o treinamento supervisionado. O resultado dessa etapa da pesquisa está detalhado em Aprendizagem de máquina e subjetividade.

 

Modelos de classificação

Há uma dificuldade em incorporar novos modelos arquivísticos para banco de imagens digitais. Já apontamos a relevância do colecionismo e do arquivamento de imagens pelos próprios artistas, pelos produtores de linguagem e por grupos que não dependem das grandes nuvens para arquivar sua produção (BEIGUELMAN, 2021; VICENTE, 2014; QUARANTA, 2014), como o caso do Calendário Dissidente.

Sob o ponto de vista museográfico ou de instituições culturais que arquivam fotografias e outros materiais iconográficos, Meneses (2003) critica as lacunas na categorização da História da Fotografia nos bancos de dados institucionais. Um campo de atuação bastante diverso, cujos arquivos ainda não separam imagens familiares das imagens industriais, de publicidade, pornografia, imagens de segurança, moda. São áreas de produção de imagens distintas, com discursos completamente diferentes. O mesmo acontece na História do Cinema pois estão descobertas dos acervos públicos e particulares (Ibid, 1999).

Atualmente a maioria desses acervos disponibilizam parte de suas coleções para pesquisa on-line nos respectivos sites institucionais, ou mediante uma pesquisa agendada no banco de dados. Nota-se que há um esforço das fundações privadas como Getty Images, fundada pelo empresário norte-americano Paul Getty, que doou o maior aporte financeiro para uma instituição de arte. No Brasil, o Instituto Moreira Salles (IMS), fundado pela família Moreira Salles, detém o maior acervo de fotografias do Brasil, aberto à pesquisadores. Nessas coleções, constatamos que as classificações ainda seguem os critérios de autoria, data ou o tema da imagem. A natureza da imagem ainda não é objeto de classificação dessas práticas institucionais no campo da fotografia. Já na pintura, vemos acervos museológicos organizados por tipos; aquarelas, gravuras, desenhos, escultura. Existem algumas coleções privadas e institucionais específicas, como pinturas do Brasil Colônia e Império, coleções de caricaturas e cartografias, como a Coleção Brasiliana do Itaú, mas os critérios de categorização de imagens ainda obedecem a uma estrutura museológica tradicional.

Nesse contexto, concordamos com Meneses (2003) de que é importante contextualizar a realidade social na qual a imagem foi produzida para analisá-la e classificá-la. Os elementos classificatórios de uma imagem nem sempre estão nela, mas no contexto, na reação e na interação com o público. Ou seja, as análises classificatórias dos bancos de dados de instituições museológicas estão atreladas a metodologias sobre Iconografia/Iconologia de Panofsky ou de uma semiótica historicizada, que dificultam o estudo dos enunciados da imagem ou suas trajetórias:

 “Aos objetos visuais não convém a ideia positivista de documento (ainda que de origem): documento é aquilo capaz de fornecer informações a uma questão do observador, qualquer que seja sua natureza tipológica, material ou funcional. É preferível, portanto, considerar a fotografia (e as imagens em geral) como parte viva de nossa realidade social. Vivemos a imagem em nosso cotidiano, em várias dimensões, usos e funções. O emprego de imagens como fonte de informação é apenas um dentre tantos (inclusive simultaneamente a outros) e não altera a natureza da coisa, mas se realiza efetivamente em situações culturais específicas, entre várias outras. A mesma imagem, portanto, pode reciclar-se, assumir outros papéis, ressemantizar-se e produzir efeitos diversos” (MENESES, 2003, p. 22-23).

O argumento acima reforça o motivo pelo qual decidimos criar outros parâmetros estéticos para a análise das imagens-mensagens dissidentes. A dificuldade prática de criação de repositórios visuais, já citados, reforça o quanto a prática de classificar e arquivar peças gráficas digitais ainda é incipiente e representa um desafio no campo do design de comunicação.

 

Treinamento da máquina

A classificação cognitiva das imagens foi empregada para o set de imagens usadas para o treinamento da máquina. Vale destacar que o fenômeno da repetição de imagens que possuem o padrão de determinada categoria é recomendado para o reconhecimento algorítmico.

 

  1. Factual:

As imagens da categoria Factual são compostas por fotografias documentais relacionadas a fatos ou personagens. Pode ter intervenções de texto. São trabalhos caracterizados pela precariedade da composição e da colagem, devido à velocidade com que o material é produzido para ser veiculado. O que importa é a participação ativa na rede, quase em tempo real.

1.1 Meme:

A categoria Meme é uma subcategoria do factual. Porém, há uma elaboração na mensagem, normalmente em tom mais satírico/humorístico. Esses posts são caracterizados por imagens reapropriadas da mídia (emissoras de TV ou jornais on-line), são compostos por uma faixa superior e/ou inferior preta com textos aplicados e que se propagam na rede e tornam “virais” com mais facilidade. Voltaremos aos “memes”, tópico que merece ser aprofundado, pois o termo é amplamente usado para caracterizar diversos tipos de postagens replicantes nas redes.

  1. Ilustração digital:

A categoria Ilustração digital é representada por uma grande variedade de linguagens e sintaxes visuais, frequentemente bastante elaboradas. Podem ser ilustrações vetoriais, muitas vezes bidimensionais (figurativas ou abstratas), colagens digitais com usos de fotografia e de desenhos à mão, misturados e digitalizados. Essa categoria representa a maioria das imagens-mensagens, provavelmente porque a linguagem digital compila as práticas de edição dos aplicativos disponíveis nos softwares dos aplicativos, onde é possível retrabalhar imagens de diferentes naturezas, em uma colagem e um remix de referências. Trataremos disso adiante.

  1. Tipografia digital:

Os posts tipográficos digitais representam as imagens-mensagens compostas por linguagem estritamente verbal. Os elementos principais são frases, extratos de música, perguntas, reprodução de trechos de notícias digitais. Na maioria das vezes, essa imagem é produzida com as fontes default oferecidas no próprio aplicativo;

  1. Ilustração manual:

A categoria Ilustração manual é representada por desenhos feitos à mão, charges, quadrinhos, trabalhos assinados por ilustradores ou não.

  1. Escritas vernaculares:

Essa categoria concentra os posts, cartazes de papel ou faixas, feitos à mão, e ainda, trabalhos com letras manuscritas, letras recortadas, uso de stencil. Alguns posts são compostos por uma escrita caligráfica ou por uma tipografia vernacular. São peças gráficas que fazem referência à linguagem visual da cultura popular brasileira. Segundo Priscila Farias, o termo vernacular (ou vernáculo) deriva da expressão latina verna ou vernaculus, e foi originalmente usada para significar “nativo”, especialmente, “nativo de um lugar específico” (FARIAS, 2011, p. 4-5). No caso da tipografia vernacular, são notados significados distintos para o uso do termo, a depender da tradição tipográfica e da cultura de cada lugar [Sidenote: 12. Leia mais sobre as diferenças entre a tipografia vernacular e escritas manuais ou caligráficos em Aprendendo com as ruas: a tipografia e o vernacular, de Priscila Lena Farias. In: BRAGA, Marcos (org.) (2011). O papel social do design gráfico: 163-183. São Paulo: Editora Senac São Paulo.] . Nos países da América Latina, os elementos denominados vernaculares passaram a ser incorporados no contexto do design gráfico e da tipografia como práticas de design desenvolvidas a despeito das escolas de design modernistas, principalmente por artistas anônimos, ligados ao comércio. Placas pintadas à mão e impressos efêmeros (tais como cartazes e embalagens) são exemplos típicos de “escrita manual” e representam o design gráfico vernacular. Com o intuito de representar o espírito de um lugar, essas letras são fontes de inspiração para designers, na criação de tipografias vernaculares (digitais) contemporâneas, explica a autora. Nos países com tradição tipográfica (Europa e estados Unidos) o vernacular está vinculado ao pastiche – mistura de estilos clássicos, fora de moda – e dão um tom de pastiche ou nostalgia aos artefatos gráficos, à arquitetura e à tipografia (Ibid, p. 5-7).

  1. Apropriação:

Posts nos quais há uma apropriação explícita da imagem de um cartaz, de uma série da Netflix, de uma página de quadrinhos ou de jornal, de uma obra de arte ou de uma fotografia de autores consagrados.

A ideia de propor classificadores próprios para analisar as imagens evidencia a diversidade estética produzida e compartilhada no Instagram, além de possibilitar a investigação de linguagens visuais regionais, vinculadas à cultura local e a linguagens globais. Será que essa diversidade representa culturalmente a produção gráfica local? Quais influências são locais, quais são globais?

As manifestações nas redes reforçam a importância do arquivamento da produção gráfica veiculada no Instagram, para discutir-se a linguagem visual dessas peças gráficas; se há uma homogeneidade de estilos; se a linguagem remixada, característica da cultura digital das redes, é predominante; se há características específicas da produção ativista brasileira em relação ao resto do mundo.

Nessa linha, os modelos dos classificadores poderão ser disponibilizados como programas de código aberto, ampliando a extensão da pesquisa sobre o uso assistido de inteligência artificial na atividade de edição de imagens e de narrativas dissidentes. Foram construídos com softwares livres (creative commons) e a partir de códigos “de prateleira” (scripts disponíveis e compartilhados nas libraries do Python). Ver Aprendizagem de máquina e subjetividade.

 

Categorização estética, em números

A fim de criar uma amostra diversificada, capturamos e categorizamos as imagens veiculadas nos Instagram entre o primeiro e o segundo turno das eleições (de 5 de outubro a 5 de novembro de 2018), o período mais crítico da polarização política. Classificamos 141.873 imagens relacionadas a cinco hashtags ativistas, dentro das cinco categorias descritas abaixo:

Fonte: dados extraídos do software criado para a classificação de imagens desta pesquisa.

A classificação, primeiro cognitiva, e posteriormente realizada pela visão computacional dos classificadores, explicada em detalhes no tópico Paradigmas estéticos para classificar imagens informacionais, ilustrou a diversidade e a riqueza dessas imagens e, sobretudo, a dificuldade de separá-las em categorias tão estanques, do ponto de vista analítico. Foi preciso investigar outros critérios para a análise semântica dessa produção de imagens à luz do design de comunicação, a partir da releitura do diagrama de Julier (2006).

 

Seleção de amostras para classificação maquínica

Devido à variedade de estilos e linguagens das imagens-mensagens e os desdobramentos possíveis nas análises individuais e formais de cada peça, decidiu-se focar nas narrativas visuais mais significativas sob o ponto de vista do design gráfico de comunicação. Essas peças gráficas são as representadas pelas ilustrações digitais, ilustrações manuais, tipografias digitais, imagens vernaculares e imagens cuja apropriação é explícita.

Nomeamos a categoria de letras e tipos manuais como Escritas vernaculares, a fim de contemplar peças gráficas onde a linguagem verbal é predominante, mas não se enquadra estritamente no campo da tipografia vernacular (fontes digitais desenhadas por designers) ou da escrita manual ou caligráfica. Descartamos as imagens ficcionais, pois essas apresentam características predominantemente fotográficas, documentais e que podem ser interpretadas por critérios mais comunicacionais e não à luz do design.

Os memes, reconhecidos como os grandes protagonistas das redes, também foram descartados, apesar da sua importância na história da memória gráfica da política brasileira. Essa categoria representa uma nova vertente comunicacional, uma produção de comunicação de massa, feita por qualquer cidadão engajado nos temas dos acontecimentos diários. As montagens com imagens e textos em tons satíricos, replicadas e reapropriadas infinitas vezes, cuja origem e autoria são impossíveis de ser rastreadas, poderiam ser classificadas como posts dessa categoria. No entanto pela sua composição mais rústica, satírica e vinculada às imagens apropriadas da grande mídia jornalística, a análise desses posts, pela óptica do design de comunicação, fugiria do foco do projeto, interessado justamente em filtrar novas vertentes estéticas e linguagens visuais dos posts dissidentes.

Outro dado importante, no que diz respeito ao treinamento das máquinas e criação dos classificadores de imagens com IA, é a subjetividade das informações textuais dos posts meméticos, e a impossibilidade do robô em interpretar as nuances da linguagem. Portanto, não chegamos a criar um classificador de imagem dessa subcategoria.

Vale lembrar que originalmente o termo “meme” existe antes da internet. Cunhado pelo cientista Richard Dawkins (1976) é baseado na teoria evolucionista de Darwin para definir uma unidade de transmissão da informação que se propaga de cérebro para cérebro por meio de um processo que pode ser chamado, em sentido amplo, de imitação. No artigo Memes, educação e cultura de compartilhamento nas redes sociais, Andrea Silva (2018) traça um paralelo da definição científica baseada na biologia evolucionista com os memes da comunicação digital. Os desdobramentos deste último nas redes são inegáveis. O autor destaca três características, resumidas abaixo:

(i) mutação – quando o meme é alterado na medida em que é replicado pelos usuários da rede social;

(ii) seleção natural – nem todos os memes permanecem ativos na rede e nem todos são viralizados;

(iii) hereditariedade – um meme modificado, que sofre variação do original. “O meme é usado para se referir a conteúdos de caráter viral replicados diversas vezes, em determinados nichos culturais” (FONTANELLA, 2007, apud SILVA, 2018, p. 4).

No campo da comunicação e novas mídias, incluindo design, jornalismo e ciências políticas, há uma ampla bibliografia abordando aspectos significativos dos memes. Integrantes do Laboratório de Pesquisa em Comunicação, Culturas Políticas e Economia da Colaboração (coLAB) da Universidade Federal Fluminense criaram o projeto e um museu virtual #museudememes.

A partir de uma ampla coleção de memes, em diversas categorias, pode-se ter uma ideia da amplitude do uso dessa linguagem, para além do uso político. Observa-se que as características descritas por Dawkins e a comparação dos princípios biológicos de “replicadores” com os memes das redes evoluíram. Segundo os pesquisadores do Colab, coordenado pelo Prof. Dr. Victor Chagas “hoje, quando nos referimos a memes, não estamos mais pensando em um ‘replicador cultural’ ou uma ‘unidade de transmissão de informação’, mas em uma linguagem midiática. E é a partir dessa perspectiva que esse fenômeno passa a ser observado por uma série de pesquisadores oriundos do campo das humanidades digitais” [Sidenote: 13. Conteúdo disponível no site: https://museudememes.com.br/. Acesso em abril, 2022.] .

A categoria Escritas vernaculares também apresenta uma ampla variedade de expressões gráficas que merecem destaque no campo do design de comunicação. No entanto, nessa categoria, a classificação maquínica dessas imagens geraram um número considerável de erros. Abaixo reproduzimos os destaques dessa produção:

Imagens capturadas da #coleraalegria, classificadas como vernaculares pela sua construção formal, na qual o uso da escrita manual, pinceladas e uso de stencil confere uma linguagem personalizada e remete à cartazes e trabalhos artísticos de maio de 1968.
Imagens capturadas do perfil de Militão Queiroz, também visualizadas nas #designativista e #elenão. Foram classificadas como Escritas vernaculares pelo uso da tipografia digital vernacular que alude a um estilo de cartazes dos anos 60, popularmente difundidos pela publicidade americana. O vernacular remete à cultura caligráfica dessas peças.
Cartazes realizados por coletivos e cidadãos mobilizados pelo ativismo a favor da moradia digna, liderada por Preta e Carmem, do Movimento Sem Teto (MST), líderes também da Ocupação 9 de julho. Os trabalhos foram veiculados sob a #coleraalegria.

A categoria Apropriação também é carregada de subjetividade e depende da análise do editor e da interpretação humana para ser classificada. As imagens apropriadas não poderiam ser reconhecidas pelos robôs devido à subjetividade de linguagens e dados culturais e etnográficos, mas foram incorporadas na pesquisa por representarem uma forte vertente de linguagem experimental no campo da ilustração digital.

Apropriação de referências

Obra de Andy Warhol, 1967

A silhueta em alto-contraste de Marilyn Monroe, serigrafada em várias opções de cores, é trocada pela imagem de Marielle. O ícone da mulher do cinema e sex symbol dos anos 60 é substituído pelo ícone da mulher brasileira que representa diversos ativismos, como antirracismo, protagonismo feminino, LGBTQIA+.

Capa da revista Times − The woman of the year, 2020

Reapropriação da capa original com a ilustração de Marielle, confundindo se de fato a personagem, morta em março de 2018, foi eleita pela publicação como a mulher do ano.

Cartaz de <i>Deus e o diabo na terra do sol</i>, filme de Glauber Rocha

A estrutura da composição do post é a mesma do cartaz desenhado por Rogério Duarte, peça gráfica que marcou o cinema novo brasileiro e a resistência cultural em 1964. A figura de Marielle está presente no lugar de Lampião, ambos ícones da resistência do povo brasileiro.

A imagem de Angela Davis – líder do ativismo negro americano nos anos 70

A figura do símbolo da luta pelos direitos dos negros e das mulheres nos Estados Unidos no início dos anos 70, membro do partido comunista Black Panthers, é associada à imagem de Marielle, líder ativista carioca, vereadora e representante das mulheres, dos negros, dos homossexuais e dos menos favorecidos no Brasil.

Orange is the new black, série Netflix

A série é parodiada no caso envolvendo “os laranjas”, candidatos fantasmas, do partido de Bolsonaro, a uma vaga de Deputado Federal.

Laranja mecânica, filme de Stanley Kubric, 1971

O cartaz icônico foi usado como referência para ilustrar o caso dos laranjas no esquema das rachadinhas, coordenado por Fabrício Queiroz, o ex-assessor do Senador Flávio Bolsonaro.

O silêncio dos inocentes, filme de Jonathan Demme, 1991

Outra apropriação para representar o mesmo tema dos laranja, desta vez usando o cartaz do filme O silêncio dos inocentes, de Jonathan Demme.

Retrato de Barack Obama, desenhado pelo ilustrador e ativista Shepard Fairey, 2008

 O cartaz que marcou a primeira campanha de Barack Obama nas eleições presidenciais é usado como referência de linguagem de ilustração vetorial e também de composição dos posts das figuras políticas de Bolsonaro e Marielle.

Retrato de Stalin

Um meme, uma paródia, no qual a estética do design de comunicação da Revolução Russa é remixado com bom humor em uma série de posts relacionados à uma suposta “União Soviética da América Latina”, a URSAL, partido fictício criado por internautas.

Retrato de Hitler, autor desconhecido, 1940

A comparação entre o ditador alemão e Bolsonaro nos níveis políticos renderam centenas de memes, e ilustrações. O topete do penteado de Hitler se assemelha ao corte de cabelo do brasileiro. O designer gráfico e ilustrador Eduardo Foresti sintetizou os traços do rosto de Hitler, utilizando do grafismo da expressão “ele não” para compor o nariz, os olhos e a boca e o bigode da figura.

Capa do disco The dark side of the moon de Pink Floyd, 1973

 

O prisma, figura central da capa desenhada por Storm Thorgerson é substituído pelo logotipo da empresa Vale do Rio Doce, responsável pela tragédia da barragem de Mariana, rompida em janeiro de 2019.

Há um aspecto antropofágico no visual dessas imagens-mensagens que se apropriam da música, das artes visuais, do cinema e das séries de TV no streaming. O jogo de adição, multiplicação e de subtração dos elementos visuais dos posts suscitam associações formais e constituem uma estética presente nas redes: a estética remix, como vimos com Navas (2016) em Narrativas visuais no Instagram.

Consideramos a categoria “apropriação” uma das mais emblemáticas para a pesquisa, pois evidencia a tendência de apropriação estética de diversas referências visuais provenientes de diferentes fontes. Essa prática do copy and paste, característica da cultura visual digital das redes, envolve uma grande complexidade de tipos de imagens e linguagens, exige um repertório cultural do espectador, não sendo possível classificá-las a partir de metodologias de visão computacional. Detalharemos o processo de construção dos classificadores, suas limitações e a subjetividade da interpretação das IAs adiante. Antes, porém, discutiremos os resultados do uso de outros métodos de análise de imagem, por meio de um viés mais semântico.

Análise semântica pela Cultura do design

Com o objetivo de aprofundar o vocabulário estético das imagens das redes por um viés mais semântico e multidisciplinar, buscamos outras metodologias, ancoradas na linha de estudos da cultura visual e visões sistêmicas e interdisciplinares.

Este segundo vetor analítico parte do diagrama Domínios da cultura do design, concebido pelo designer e pesquisador Guy Julier (2006). E propõe uma releitura, a fim de ampliar os quesitos analíticos desta imagem complexa e informacional [Sidenote: 14. Este tema também é tratado no artigo Releitura do diagrama “Domínios da Cultura do Design” para a análise das imagens-mensagens dissidentes do Instagram, publicado nos anais do 10º Congresso Internacional de Design da Informação (CIDI), 2021.] . A linha de estudos da cultura do design (JULIER, 2006) busca complementar alguns atributos relacionados à análise da imagem, apresentando uma nova camada interpretativa à teoria da cultura visual (MIRZOEFF, 1999) – amplamente adotada no campo da iconologia no período pré-internet – aplicada em inúmeros estudos da produção artística e cultural desde o final dos anos 1970. Essa teoria foi atualizada e gerou derivações por meio do trabalho de outros pesquisadores, como Meneses (2003) e Boylan (2020). Assim, o foco principal de tais investigações está nos atributos visuais da imagem estática – composição, estrutura, perspectiva, signos e interpretação semiótica, linguagem verbal.

No artigo From visual culture to design culture, Julier (2006) faz uma revisão crítica à análise de imagem por um viés puramente “visual”, apontando o contexto informacional e social. Neste caso, a fruição estética do espectador opera como elemento de análise essencial na contemporaneidade. O autor reconhece, entretanto, a importância de questões tratadas antes por Mirzoeff (1999), como a repercussão da “virada visual” da sociedade ocidental moderna no campo do design; a relação entre o consumo de massa e a vasta produção e circulação de imagens em meados do século XX, após a segunda guerra e com o avanço industrial das reprodutibilidades técnicas. Tais imagens, de natureza mais comunicacional e comercial, apresentavam outras indicações visuais provenientes das artes e da ciência. Por isso, os novos meios de produzir e veicular arte para um mercado crescente e amador passou a exigir, desde então, mais apuro visual das peças gráficas. Ambas gradativamente mais elaboradas devido às atualizações de possibilidades de produção gráfica serializada.

O paralelo entre a evolução da linguagem visual e o desenvolvimento das possibilidades técnicas permeia a história do design, na qual a tecnologia estimula experimentações gráficas, resultando no surgimento de novas estéticas. A questão da interdependência entre evolução tecnológica e mudança de hábitos do usuário, produtor, distribuidor e consumidor de imagem e experimentações gráficas, é central para nós. As estéticas emergentes das redes e dos acontecimentos das ruas acompanham a evolução da sociedade interativa à sociedade participativa (HARVEY, 2013). E esta passagem é percebida e vivenciada por meio das imagens-mensagens. Para Julier (2006) a interdependência de tecnologias visuais, mídias convergentes e experiências simultâneas – a mesma informação visual é gerada e distribuída para plataformas diversas como câmeras celulares, de webcams, TV LED, etc. – são pontos fundamentais para entendermos a imagem digital.

Diagrama Domínios da cultura do design, de Guy Julier (2006)
Nesse diagrama, Julier (2006) incorpora o pensamento do historiador do design Victor Margolin, para quem o artefato material (ou a peça gráfica) é um objeto agregador de contexto social deve ser analisado a partir das condições dos meios de produção, das atividades e dos serviços que o envolvem (1995). A partir desta afirmação, Julier se propõe compreender, através de múltiplos artefatos da cultura do design, a dinâmica e os efeitos das relações materiais e imateriais que são articuladas por diferentes atores (designers, consumidores). As imbricações entre as relações materiais e imateriais estão sugeridas pela intersecção dos conjuntos, abrindo a outras possibilidades.

A releitura desse diagrama se deu a partir da observação do núcleo central, no qual os três domínios estão inter-relacionados (Circulação, Valor e Prática). Enxergamos um caminho interessante para uma análise semântica por este viés sistêmico. Assim, propomos uma adaptação, criando uma nomenclatura para as quatro intersecções do diagrama original, considerando estes como pontos fundamentais:
a) circulação da imagem-mensagem;
b) experiência do usuário;
c) contextualização social;
d) memória afetiva e gráfica.

 

A cultura do design e as imagens das redes: uma releitura do diagrama de Julier.

A nomenclatura proposta é baseada nos conceitos originais do autor (2006). Adaptamos os termos e nomeamos as intersecções desses domínios com o objetivo de oferecer subsídios para a leitura sistêmica das imagens-mensagens das redes.

Podemos associar o domínio Circulação aos atributos relacionados à reprodutibilidade técnica da peça gráfica. No ambiente digital das redes, a reprodutibilidade é infinita, pois as postagens são repostadas pelos usuários e deslocadas para outros contextos, diferentes daqueles em que foram originalmente criadas para circular. Como vimos no tópico #ativismo: das ruas para as redes, o uso de estratégias de tagueamentos provoca um deslocamento e novas possibilidades de inserção de uma mesma imagem em diferentes narrativas. Essa imagem está em constante transformação e sujeita à interação e interpretação do usuário, à sua experiência da “visualidade” do fluxo das imagens nas redes. A estética da narrativa, assim como a estrutura visual da imagem e o seu entendimento, parece oscilar de acordo com essas combinações de dados e de ações colaborativas por parte dos espectadores-autores-artistas participativos (PAUL, 2011). Os recursos tecnológicos dos próprios aplicativos nos quais as imagens circulam – o Instagram, no presente caso – também motivam e “seduzem” o usuário a produzir e editar imagens no próprio aplicativo, onde é possível usar uma série de filtros que influenciam a estética “fast food” de certos posts e permitem o acesso e participação de todo o público da rede na produção estética ativista.

 

Participação do usuário

Na análise das imagens-mensagens, a participação do usuário, seu engajamento, likes e repostagens com novas palavras-chaves, representa uma parte fundamental no diagrama, na intersecção entre Circulação e Prática (figura acima). As questões relacionadas à interação do espectador levantam outros fenômenos igualmente relevantes, como a diluição do autor, a apropriação de imagens de outras fontes e os jogos de linguagem. São outros regimes de visibilidade, como pode ser visto por meio de outros autores do campo da filosofia, da história da arte e da artemídia, como Rancière, Didi-Huberman, Grau, Grusin, entre outros, no Glossário Imageria.

 

O domínio da Prática considera a ação e a recepção dos artefatos materiais. Contempla todos os criativos que concebem sua arte para circular nas redes: designers, artistas, cidadãos que, envolvidos com os acontecimentos políticos, criam estratégias de linguagem para se comunicarem por meio da imagem. Para nós, este domínio também inclui a atividade do usuário do Instagram, que se identifica com a causa e com a estética do card, se apropria da imagem, acrescenta-lhe novas informações ou elementos visuais e volta a postá-la. Essa prática do receptor faz com que ele se torne o ator de uma nova ação – ação essa que contribui para a estética desses posts com acréscimos de frases, ilustrações ou apenas novos significados à medida que são deslocados e colocados em circulação em um outro contexto. Como vimos com Navas (2016), a adição de imagens de diversas fontes, em umremix de imagens apropriadas, caracteriza a prática da produção estética para as redes.

 

Novas estéticas

A estratégia de colagem, justaposição de dados temporais e apropriação explícita de imagens ocorre desde a pop arte e foi amplamente apropriada pelo movimento punk no final dos anos 1970, ganhando força novamente no mundo digital pela facilidade do acesso às citações iconográficas na web. As novas formas de produção de linguagem, a justaposição e fusão de elementos visuais de diferentes fontes dão origem às fake images, imagens ficcionais. Colaboração e coletividade caracterizam esse processo criativo, exemplificado pela prática ativista de movimentos coletivos organizados em torno de hashtags temáticas como “ele não”, “me too”, “marielle presente”, “fora garimpo fora covid”, “aquecimento global”, “vidas negras importam”, para citar apenas algumas.

Essa produção dissidente é entendida como uma prática estética, uma produção de linguagem que responde aos anseios de criadores, consumidores/espectadores e cidadãos informatizados que participam e se comunicam por meio da rede Instagram.

 

Contexto sociopolítico

No domínio Valor, podemos analisar todo o contexto sociopolítico no qual essas imagens-mensagens são criadas. O lado mais antropológico da análise deste tipo de imagem não está inscrito, não se “vê”, mas está implícito nos seus signos pictóricos, verbais ou formais. Cabe mencionar que Julier (2006) critica o ocularcentrismo da cultura visual de Mirzoeff (1999), que, apesar de considerar o contexto sociocultural, se limita a analisar estritamente o que se vê, se abstendo de interpretações interdisciplinares. Nesse domínio, constatamos a construção de uma identidade coletiva e a rede como ambiente propício para levantes ativistas. São valores individuais e coletivos, que expressam a ancestralidade, a cultura e a origem do artista/autor do card, assim como suas afinidades políticas, estéticas e sociais.

 

Memória

É no cruzamento dessas das dimensões Valor e Prática que conseguimos interpretar aspectos ligados à memória da imagem – seja a memória de acontecimentos factuais e históricos e de personalidades icônicas relacionadas a esses fatos, seja a memória afetiva do espectador, evocada pela imagem e relacionada às experiências pessoais. Além disso, há a associação semântica e visual que fazemos com outras peças de design gráfico que marcam nosso imaginário, apresentadas no tópico Narrativas visuais no Instagram.

Incluir a memória em análises imagéticas nos permite agregar o componente subjetivo e fenomenológico destacado por Mirzoeff (1999) e Beiguelman (2019), que pode estar associado a outras simbologias e experiências afetivas. A memória também influencia quem faz a análise do objeto (o pesquisador) ou quem cria a peça gráfica. E afeta o receptor, quem vê e consome a imagem.

 

Identidade e novas estéticas

Denominamos o coração do diagrama como a imagem-mensagem, constituída pelas intersecções entre os domínios e subdomínios apresentados. As linguagens visuais emergentes nas redes são marcadas pelo uso da ilustração vetorial, da colagem de fotografias e de desenhos manuais, além da apropriação de imagens documentais de outros períodos históricos para representar temas afins. Veremos exemplos dessas imagens-mensagens a seguir.

 

Análise das Imagens-mensagens

Os paradigmas trazidos por Julier (2006) nos permite fazer uma análise semântica sistêmica. Há uma série de fatores não explícitos no objeto material analisado. A tal respeito, o designer e pesquisador catalão Henri Jardí (2014) propõe o gesto de pensar com as imagens, adicionando outros quesitos à leitura de ilustrações digitais. Para tanto, o autor se utiliza da visão ampliada de ícones, índices e símbolos, definida a partir dos conceitos semióticos de Peirce (2000).

As relações entre signo e objeto permeiam as leituras de como vemos peças gráficas como cartazes na paisagem urbana e nas redes, cotidianamente. A ilustração, em relação a fotografia, possui índices mais baixos de iconicidade e depende de uma série de características que a torne identificável como determinado objeto (JARDI, 2014, p. 7). Nas peças de design de comunicação denominadas aqui como imagens-mensagens, nos deparamos com diversas estratégias visuais, textuais e formais, contendo uma mistura de linguagens que nos inspira a amplificar a análise da imagem da rede de uma forma plural e sistêmica.

A contribuição de ambos os autores orientou a nossa análise semântica e contextual aplicada em cinco imagens-mensagens caracterizadas como “ilustração digital”. Como vimos no tópico anterior, o uso de aprendizagem de máquina pôde ampliar quantitativamente a coleta de dados e a classificação de imagens, sendo a “Ilustração digital” a categoria estética predominante. Este resultado contribuiu para esta etapa de análise qualitativa e corresponde a um dos achados da pesquisa: a ilustração digital pode ser considerada a categoria mais representativa das estéticas emergentes das redes, pela lente do design.

Apresentaremos a seguir um exercício de leitura de cinco peças gráficas. Essa pequena amostra levou em consideração a diversidade de linguagens e experimentações gráficas que essas contêm – quão diversa pode ser a solução formal de uma ilustração digital. A combinação de diferentes técnicas (colagem, traços manuais digitalizados, uso de fotografias e patterns) e o uso da linguagem verbal na composição formal dessas peças representam a potência das novas estéticas emergentes nas redes. Além disso, as imagens foram extraídas de diferentes hashtags e representam o design de comunicação de diferentes causas ativistas.

Imagem capturada da hashtag #elenao, publicada em 17 de outubro de 2018. Autor: Eduardo Foresti @foresti.

 

Na figura acima, a imagem capturada da hashtag #elenao, publicada em 17 de outubro de 2018, representa a onda de extrema direita bolsonarista. A bandeira do Brasil invertida serve de carapuça, uma remissão explícita aos capuzes cônicos usados pelos membros da Ku Klux Klan, organização norte-americana de supremacistas brancos. [Sidenote: 15. Ku Klux Klan é uma organização terrorista norte americana criada por supremacistas brancos em 1865, depois da Guerra Civil, com o objetivo de perseguir e assassinar negros. A organização chegou a ter mais de 2 milhões de membros nos anos 1920 e é atuante até hoje, embora o movimento tenha se transformado em outros grupos radicais (Silva, 2022).] O uso da técnica de colagem – os olhos de Bolsonaro recortados de uma publicação impressa em preto e branco (com uma retícula particular às imagens reproduzidas de jornais) – realça o contexto factual e documental do cartazete. O deslocamento do uso da bandeira com outra função reforça a estratégia de jogos linguísticos mais sofisticados, presentes em outras imagens-mensagens nas quais a bandeira é um signo empregado de forma a expressar outros significados que vão além do sentido imediato. Esse modo de representação é conhecido como retórica visual. Alterou-se o contexto no qual a bandeira é usada habitualmente para modificar seu significado literal de um símbolo do conjunto da peça gráfica. No caso desta imagem, precisamente, podemos dizer que ela é uma metonímia. A figura (bandeira) é usada para modificar o significado literal de um signo, substituindo por outro elemento visual (chapéu/capuz) com o qual passa a ser relacionado (Jardi, 2014). Ver imagem metonímica. A apropriação de um símbolo nacional, usado de ponta cabeça, contribui para o impacto visual da imagem: “quando escolhemos um determinado símbolo para expressar uma mensagem, devemos ter certeza de que conhecemos o âmbito cultural no qual se movem aqueles a quem nos dirigimos”, alerta Jardi. É provável que muitos leitores não compreenderam a metáfora do capuz cônico relacionando-a com o posicionamento político racista e nazista do presidente Bolsonaro.

A relação entre Imagem e design e a interpretação dos signos visuais acontecem de forma inconsciente. Pode ser percebida em camadas. Outra associação possível a esta figura remete ao símbolo do chapeuzinho triangular feito de papel nas brincadeiras infantis nos anos 70, período da ditadura, imortalizado na música “marcha soldado cabeça de papel”. São novos significados que surgem em um outro nível de leitura. São novos significados que surgem em outras camadas de leitura.

Imagem capturada das hashtags #mariellepresente e #designativista, publicada em 14 de março de 2019. Autor: Cris Vector @crisvector.

A figura acima foi capturada pelas hashtags #mariellepresente e #designativista e traz o retrato de Marielle. Segue a mesma linguagem do cartaz que marcou a campanha de Barack Obama nas eleições americanas em 2008, desenhado pelo ilustrador e ativista Shepard Fairey. Esta peça gráfica é usada como referência de linguagem de ilustração e a estrutura da composição segue o mesmo padrão de diversos cartazes ilustrados com retratos de grandes personalidades políticas. A área inferior é destinada à linguagem verbal. Nesse caso, utilizaram-se letras da categoria display, condensadas e em caixa-alta, disponíveis no template do Instagram. O uso da pergunta em cartazes é uma estratégia usada desde os cartazes dos anos 60, como ilustrado na galeria Design de impacto. A frase se dirige ao receptor, provoca e evoca a participação. A imagem viralizou e foi apropriada em milhares de outros posts sobre Marielle.

Este estilo de ilustração vetorial na qual o volume se dá por camadas de gradientes e sombras é um estilo marcante na rede. Cris Vector, um dos ilustradores que se destacou nas redes pela sua habilidade e precisão de detalhes, também representa uma vertente importante do design da rede na qual a combinação de imagem e linguagem verbal se funde em uma única composição.

Imagem capturada da hashtag #desenhospelademocracia, publicada em 16 de outubro de 18. Autor: Bijari @bijari.

A figura acima faz uma paródia da frase “mais amor, por favor”, letra de música sobre violência nas ruas da banda Preto no Branco (2016), a qual utiliza-se da linguagem verbal como elemento principal. O card explora tipograficamente questões binárias e faz parte de uma série de imagens ativistas cujo design é explicitamente inspirado no design gráfico dos cartazes tipográficos suíços. O estilo suíço é conhecido pela valorização do uso da tipografia sem serifa, como a Univers, a fonte democrática desenhada pelo designer suíço e professor da Bauhaus Adrian Frutiger em 1957, no pós-guerra. A tipografia Univers consiste em um sistema numérico bidimensional com diversos pesos e estilos de fontes, ampliando as possibilidades das classificações tradicionais (light, regular e bold).

A interferência digital das marcas de tiro na palavra “arma” representa a ação da violência das armas de fogo e pode ser percebida em um segundo momento. A peça gráfica mescla linguagens tradicionais do cartaz ativista com a contemporaneidade da ilustração digital. O jogo de escalas dos dizeres “menos e mais” e as palavras “armas e amor” contribui na composição dos elementos da peça, trazendo um ritmo à leitura, apresentada em dois níveis.

Imagem capturada da hashtag #designativista, publicada em 15 de fevereiro de 2019. Autor: Gladson Targa @gladsontarga.

A imagem-mensagem acima faz uso da ironia para tratar do racismo e da brutalidade do assassinato de um jovem negro de 19 anos, morto pelo segurança do Hipermercado Extra na Barra da Tijuca, Rio de Janeiro, naquele dia. A peça gráfica se apropria da estrutura e da linguagem tipográfica dos cartazes de ofertas de produtos em supermercados e lojas populares, utilizando uma tipografia vernacular para o “anúncio”. Utilizando uma linguagem visual direta mais popular e, portanto, mais acessível, essa peça se insere em símbolos de determinada “conotação” (JARDÍ, 2014). A ilustração é facilmente compreendida e se refere à venda, como se a carne preta não valesse nada. Esse lugar-comum da ilustração tem uma amplitude relacionada ao âmbito cultural de determinado cenário, compreendido, nesse caso, globalmente.

Imagem capturada da hashtag #designativista, publicada em 19 de abril de 2019, data comemorativa do Dia do Índio. Autor: Mavi Morais @moraismavi.

A figura acima é um bom exemplo das múltiplas linguagens utilizadas pelos artistas gráficos: a figura central é uma apropriação de uma fotografia em preto e branco de um índio (autor desconhecido/não fornecido), recortada e retrabalhada, com uma colagem de outros elementos fotográficos alegóricos, como o cocar e as bananeiras que compõem o cenário. Essas figuras adicionadas e somadas são explícitas e representam o estereótipo do contexto cultural local. O fundo é composto por uma ilustração vetorial, uma estampa de padronagem étnica indígena, adicionando mais um índice visual.

É interessante observar que a leitura dessa imagem pelas visões computacionais dos nossos classificadores gerou uma leitura ambígua. O robô também não consegue identificar os elementos de múltiplas linguagens que compõem a imagem. A interpretação pelo modelo de rede neural pelo MMD Critic (KIM et al. 2016) gera uma “imagem crítica”, como podemos ver em Aprendizagem de máquina e subjetividade.

Ao propor a releitura do diagrama de Julier – interpretando os elementos analíticos da cultura do design e atribuindo novos significados possíveis às intersecções do diagrama – estabeleceram-se parâmetros para o estudo das imagens que circulam nas redes sociais. Neste caso, o diagrama foi adaptado para ancorar os aspectos mais subjetivos e contextuais relacionados às imagens dissidentes do Instagram. Tais imagens, lidas pela lente do design de comunicação, careciam de uma análise interdisciplinar que abarcasse outros aspectos inerentes a esses artefatos gráficos.

A releitura deste diagrama acrescenta novas chaves interpretativas e sugere a possibilidade de uma leitura das peças gráficas que vão além dos aspectos formais e visuais. Essa abordagem procura discutir os signos invisíveis perceptíveis pelo criador/emissor e pelo receptor. São elementos simbólicos a serem decifrados a partir do repertório de cada um. Ela não exclui outras metodologias de análise semiótica, mas assume a imbricação dos campos no qual produzimos e consumimos design hoje, oferecendo outros subsídios para o entendimento desses artefatos gráficos.

 

A tela e o tempo presente

Ao fazer o exercício analítico dessas cinco imagens a partir dos pré-requisitos apresentados, notamos que essa abordagem sistêmica escapa dos quesitos propostos pelas análises gráficas mais tradicionais, pensadas a partir de uma concepção formal e estática, com um grid preestabelecido – herança dos dogmas projetuais do design moderno. A releitura do diagrama de Julier (2006) possibilita irmos além, pois notamos que numa mesma peça gráfica é possível identificar um emaranhado de tempo de influências visuais e estilísticas, plasmadas em uma mesma imagem de formato reduzido.

Essas criações podem ser consideradas uma peça em constante transformação, devido à participação do usuário e sua circulação (com legendas/hashtags que os deslocam nas redes). À luz de práticas de produção gráfica dissidentes, representam uma evolução cultural, contextual e tecnológica dos cartazes dissidentes produzidos mundialmente em outros períodos da história.

Na galeria Design de impacto oferecemos um breve panorama dessa arqueologia de narrativas dissidentes através de cartazes criados por meio de técnicas distintas de produção e reprodução. Essas peças gráficas nos ajudam a refletir sobre o quanto a tecnologia e a facilidade de produção e uso de ferramentas de criação e edição, disponíveis nos smatphones ou nos computadores, impactam na estética das redes.

Ao olhar essas imagens pela cultura do design, verificamos que o uso de múltiplas linguagens, colagens, apropriações e releituras remixadas são pensadas e articuladas para veicularem em uma superfície plana e bidimensional: a tela luminosa do celular.

Essa materialidade e luminosidade da tela também interfere na recepção da imagem, no modo em que a olhamos. E de certa maneira, restringe nossos sentidos hápticos promovidos pelas texturas das serigrafias, stencils, tintas e colagens impressas sobre a interface material do papel. Como vimos com Paul (2011) e Menkman (2020), a tela é um elemento que interfere como mediadora da luz da imagem digital. E as plataformas de redes sociais definem alguns quesitos de resolução que alteram a essência da peça gráfica original. São novas políticas e novos modos de ver, que independem da relação homem-objeto.

De todo modo, a conversão da visualidade dos cartazes da galeria Design de impacto para a tela também funciona. Temos acesso a peças gráficas raras, produzidas em momentos históricos delicados e em lugares distantes. Com a digitalização, esses cartazes estão aqui, reproduzidos, plasmados e padronizados na mesma superfície luminosa.

A tela e o hábito do usuário de olhar para as imagens no Instagram em um contínuo scroll vertical também influenciam a experiência estética e, de certa forma, favorece esse emaranhamento das apropriações de imagens, como vimos com a fotografia de Angela Davis e com a obra de Warhol. É como se a tela fixasse essas imagens em um eterno tempo presente, mas que tende a desaparecer no próximo movimento de seu polegar.

A imagem-mensagem é efêmera e, nesse sentido, seu vocabulário estético tende a seguir esse mesmo comportamento cíclico. Esta é uma questão sobre a a qual não se pode afirmar uma resposta, apenas apontar caminhos.