Cientistas do Facebook tentam entender próprios algoritmos

Buscar

Cientistas do Facebook tentam entender próprios algoritmos

Buscar
Publicidade

Mídia

Cientistas do Facebook tentam entender próprios algoritmos

Jornalista e pesquisador Grzegorz Piechota conseguiu ter acesso a patentes e entender funcionamento de curadoria automatizada da plataforma


11 de setembro de 2016 - 15h59

Piechota-INMA-Congress

Grzegorz Piechota, head de inovação da Gazeta Wyborcza e integrante do conselho do Inma (Crédito: Divulgação)

O jornalista Grzegorz “Greg” Piechota trabalha há mais de 20 anos no jornal polonês Gazeta Wyborcza. Surgido no fim dos anos 1980, o diário se manteve em sintonia com as atualizações tecnológicas, demandas de leitores e novos formatos de mercado, garantindo um lugar de destaque entre os quality papers europeus. Hoje, Greg trabalha numa das áreas estratégicas para manter o jornal nesse caminho, como head de inovação do grupo. Além disso, é pesquisador convidado da Fundação Nieman, em Harvard, e parte do conselho da International News Media Association (Inma), pela qual esteve em São Paulo em agosto apresentando insights de seu estudo “Evaluating Distributed Content in the News Media Ecosystem”. Por ocasião de sua visita, Greg falou à edição 1727 de Meio & Mensagem, que circula em 12 de setembro, sobre as principais soluções para publishers tradicionais manterem-se relevantes no contexto atual de produção e consumo de notícias. Veja, a seguir, trechos de seus comentários sobre como o Facebook, em especial, trouxe disrupção ao mercado e seus achados a respeito do funcionamento dos algoritmos da plataforma e seus sistema de distribuição de publicações.

Greg_Piechota350Arthur_Nobre

(Crédito: Arthur Nobre)

Meio & Mensagem — O público médio ainda se interessa por notícias e, principalmente, por consumir esse conteúdo em plataformas móveis?
Grzegorz Piechota — Varia de país para país e de meio para meio. Mas em tese, entre as pessoas que ainda dedicam algum tempo a mídias tradicionais, gastam de 15 a 50 minutos diários nisso, na média de 2015, e o consumo de conteúdo noticioso em mobile é de quatro minutos, por exemplo. Comecei a pesquisar casos de publishers de sucesso em engajamento online e, mesmo esses, que conseguem reter a atenção de leitores por, digamos, dez minutos ao longo do dia, é ainda muito pouco se comparado com plataformas como o Facebook, na qual os usuários nos EUA gastam em média 44 minutos. Os números no Brasil são ainda maiores, não sei especificamente do Facebook, mas o usuário brasileiro gasta cerca de 3h18 minutos diários em plataformas sociais, segundo dado deste ano da We Are Social. De todas as mídias do gênero, o Facebook tem maior share de alcance, de 31%. E 72% dizem consumir notícias dessas plataformas, contra a média global de 46%, então esse conteúdo ainda tem muitos leitores, sim.

Página de uma das patentes de algoritmos do Facebook descobertas por Grzegorz Piechota (Crédito: Reprodução)

Página de uma das patentes de algoritmos do Facebook descobertas por Grzegorz Piechota (Crédito: Reprodução)

Por quê o Facebook tem tamanho impacto no hábito de consumir notícias?
Diversas tecnologias têm impacto em mercados tradicionais e o Facebook é só um exemplo, aplicado a consumo de conteúdo. São empresas que não empregam especialistas daquela área e trazem disrupção ao mercado. O Uber, por exemplo, é a maior rede global de táxis, mas eles não têm nenhum taxista, só colaboradores autônomos. O Airbnb é a maior rede de hospedagem, mas não têm nenhum hotel, nenhum imóvel. Há o Google e outras empresas que operam dessa forma, não é exclusivo a conteúdo. É um paradigma econômico do qual jornais e televisão fazem parte. Essas mídias produziam para as massas, se elas quisessem consumir ou não, e cresciam conforme sua audiência escalava. Nessa nova economia, as pessoas produzem para as pessoas. Num Uber, todo mundo pode ser um motorista e um usuário. No YouTube você pode só assistir, mas também pode produzir um vídeo e publicar. Há muito mais interações entre essas pessoas e as plataformas só estão organizando. Por isso não empregam esses especialistas, investem seu tempo em tirar o atrito entre sua plataforma e seus usuários.

Mas a plataforma não é tão autônoma. A tecnologia faz curadoria de conteúdo.
O Facebook cria, por exemplo, intersecções entre o que as pessoas gostam de ver e sobre o que mais estariam aptas a engajar. Fazem essa conexão e vão coletando todos os dados. E geralmente melhoram os resultados sobre os dados que conseguiram. Estão focados em facilitar esse consumo e coletar os dados. O fato de isso trafegar numa rede ajuda a crescer. Mas com 1,7 bilhão de usuários, o Facebook não consegue, simplesmente, verificar toda a rede e fazer essas conexões manualmente. Os algoritmos entram nisso para funcionar como filtros e distribuidores dos conteúdos que aparecem no News Feed. Há 50 milhões de páginas de publishers, marcas, comércios e entidades, que produzem conteúdo, publicam, anunciam, informam seus serviços e produtos… Reunindo o que essas empresas e os usuários fazem é muito conteúdo. Para distribuir tudo isso são precisos os algoritmos. Para cada usuário, cada vez que se abre o Facebook há 1.500 histórias esperando por ele. Os algoritmos tentam reduzir isso para 300. Mas a maioria das pessoas, para ser honesto, só vai ver os dez primeiros de sua lista e menos de 10% dos usuários vai clicar na décima notícia.

É, na verdade, um sistema muito complexo, que mesmo o Facebook já não entende mais completamente como cresceu, e possui hoje um time de 30 cientistas de dados só para tentar compreender como funcionam os algoritmos que eles mesmos criaram

É possível determinar exatamente como esses algoritmos trabalham?
Não exatamente, mas descobri uma forma de estudá-los. Encontrei o nome dos cientistas de dados que registraram as patentes de algoritmos do Facebook – houve mais de cem registros nos Estados Unidos – analisei seu conteúdo e tentei entender como produziram o design geral. Claro, não permite saber diversas coisas, inclusive se realmente usam o que patentearam. Mas se registraram, é porque deduziram que tinha valor o suficiente para ser protegido. Foi possível observar, por exemplo, que não há um ranking de postagens universal, mas sim listagens individuais. Imagine uma reportagem da Folha de S.Paulo sobre o impeachment. O Facebook não decide se é bom ou não, mas se é parte da conversa ou não. Cada item vai ser avaliado segundo usuários individuais. Uma mesma história pode ter milhões de rankings diferentes, dependendo da pessoa que a visualizou. Mas se eu sou um fã da Folha e você compartilhou essa história, é mais provável que eu veja essa postagem também. A afinidade entre usuários é importante – um casal deve ver conteúdos mais similares que dois amigos e assim por diante. Também tentam prever como você reagirá à postagem: se você comenta textos políticos, esse texto da Folha deve ser ainda mais indicado, pois você segue o jornal, é meu amigo e faz comentários. Há ainda um indicador chamado Publisher’s Reputation, que ajuda a analisar em diversos níveis o quanto um post é interessante para sua timeline, incluindo a separação entre conteúdo de veículos e anunciantes. Tentam encaixar pluralidade, para não te empurrar cinco postagens sobre impeachment de cinco amigos diferentes, mesmo sabendo que você gosta de política. Vão escolher um, e vão levar aqueles filtros em consideração.

Publicações pessoais não entram nessa equação?
Sim, os algoritmos também se esforçam em saber quais desses conteúdos te agradam segundo suas publicações e analisando a importância de eventos, como um nascimento de criança, um casamento, um aniversário. Você pode preencher uma série de informações em seu perfil, como sua data de nascimento e seu time preferido, mas mesmo que você não o faça, eles vão tentar determinar pelo conteúdo com o qual interage ou compartilha. Por meio da análise de padrões, vão tentar inferir idade, gênero, classe social, interesses, afiliações, nível de educação etc. É, na verdade, um sistema muito complexo, que mesmo o Facebook já não entende mais completamente como cresceu, e possui hoje um time de 30 cientistas de dados só para tentar compreender como funcionam os algoritmos que eles mesmos criaram.

A íntegra desta reportagem está publicada na edição 1727, de 12 de setembro, exclusivamente para assinantes do Meio & Mensagem, disponível nas versões impressa e para tablets iOS e Android.

Publicidade

Compartilhe

Veja também

  • BBB 25 receberá apenas inscrições em duplas

    BBB 25 receberá apenas inscrições em duplas

    Globo anuncia que as inscrições para a temporada do reality no próximo ano serão feitas apenas por duas pessoas que tenham um laço afetivo

  • Disney une Disney+ e Star+ em um só streaming em junho

    Disney une Disney+ e Star+ em um só streaming em junho

    Nova plataforma terá seções das marcas Disney, Pixar, Marvel, Star Wars e National Geographic, além de novos planos de assinatura