Hauptinhaltsblöcke
Kurs: Introdução à análise de dados on-line na pesquisa em Comunicação | ABERTO | | USP Extensão
-
Boas-vindas a você que começa o curso Introdução à Análise de Dados On-Line na Pesquisa em Comunicação. A preocupação central é formar pessoas com interesse em realizar pesquisas na internet.
Há duas formas de oferta. Em turmas de indivíduos matriculados e outra livre, autoinstrucional. Apenas a primeira oferecerá a certificação. A metodologia do curso, baseada na aprendizagem social, enfatiza a interação ativa com o ambiente e com as demais pessoas, de modo a fortalecer o desenvolvimento de uma atitude investigativa.
O curso possui sete módulos, cada um com duas atividades, além de um trabalho conclusivo. Os dois primeiros módulos oferecem um enquadramento geral da discussão. Os quatro módulos seguintes possuem atividades que se voltam aos interesses de cada um. O último módulo discute a questão da ética na pesquisa com dados digitais.
A proposta geral é que você realize reflexões e práticas que o capacitem a entender o papel dos dados digitais numa investigação.
Bons estudos.
Informado por pressupostos da pedagogia social, como a centralidade nos processos educativos do aprender a ser, o curso tem o objetivo de introduzir quem participa em discussões e práticas que envolvem o uso de dados on-line na pesquisa social, particularmente no campo da comunicação. No vídeo acima, é feita uma breve exposição sobre o conteúdo e o desenvolvimento dos trabalhos para a realização do curso. Você pode ver a página com Perguntas Frequentes [FAQ], o Código de Conduta, ter acesso ao PDF com a íntegra do curso e consultar todas as Referências do curso.
-
Módulo 7
Ética em pesquisa com dados on-line
-
Objetivos de aprendizagem:
- Conhecer aspectos básicos ligados à ética na pesquisa e especificidades da investigação com dados on-line nesse contexto
- Refletir sobre práticas éticas em situações controversas envolvendo a pesquisa digital
- Perceber caminhos de aprofundamento de estudos dos temas do curso
- Revisar o que foi aprendido
- Conhecer aspectos básicos ligados à ética na pesquisa e especificidades da investigação com dados on-line nesse contexto
-
Temas gerais
A ciência objetiva o bem social, por isso preocupações éticas devem nortear seus procedimentos. Em pesquisas, isso significa incorporar o tema desde a elaboração das perguntas à publicização de resultados. As investigações que utilizam métodos digitais, em sentido amplo ou restrito, possuem questões éticas parecidas àquelas que não envolvem tecnologias e o ambiente da rede. Entretanto, há especificidades que merecem atenção.
Pontos centrais da ética na pesquisa envolvendo seres humanos são expostos na Lei nº 14.874, de 28 de maio de 2024, que instituiu o Sistema Nacional de Ética em Pesquisa com Seres Humanos. A Lei, em seu Art. 3, destaca as seguintes exigências éticas e científicas para as pesquisas com seres humanos:
“I - respeito aos direitos, à dignidade, à segurança e ao bem-estar do participante da pesquisa, que deverá prevalecer sobre os interesses da ciência e da sociedade;
II - embasamento em avaliação favorável da relação risco-benefício para o participante da pesquisa e para a sociedade;
III - embasamento científico sólido e descrição em protocolo;
IV - condução de acordo com protocolo aprovado pelo CEP;
V - garantia de competência e de qualificação técnica e acadêmica dos profissionais envolvidos na realização da pesquisa;
VI - garantia de participação voluntária, mediante consentimento livre e esclarecido do participante da pesquisa;
VII - respeito à privacidade do participante da pesquisa e às regras de confidencialidade de seus dados, garantida a preservação do sigilo sobre sua identidade;
VIII - provimento dos cuidados assistenciais necessários em casos que envolvam intervenção;
IX - adoção de procedimentos que assegurem a qualidade dos aspectos técnicos envolvidos e a validade científica da pesquisa;
X - condução da pesquisa em plena compatibilidade com as boas práticas clínicas”.Os riscos de prejuízo a pessoas e grupos envolvidos em pesquisas são diversos. Ao mesmo tempo, o balanço entre riscos e benefícios é complexo, pois nem sempre quem pesquisa tem clareza sobre os potenciais danos de sua investigação. Desse modo, reflexões cuidadosas ao longo do processo de pesquisa se impõem.
Um aspecto central da ética na pesquisa é o âmbito metodológico, pois, como nota um autor, quem conduz a investigação, geralmente, irá interferir na vida dos participantes da pesquisa e isso pode, de algum modo, ferir a dignidade dessas pessoas. O mesmo estudioso observa que
“Não existe ‘risco zero’. Todo e qualquer método pode ser prejudicial para o sujeito da pesquisa, pois um mero questionário pode, por exemplo, desencadear angústias imprevisíveis em quem o responde. Quiséssemos o ‘risco zero’, não faríamos pesquisa (e nem entraríamos em qualquer interação humana!). Todavia, há métodos que, mais do que outros, apresentam claramente riscos” (p. 275). -
Controvérsias específicas da pesquisa digital
Um autor observa, com propriedade, que há três aspectos que geram reflexões e preocupações específicas em relação à ética na pesquisa on-line:
1. A compreensão entre o que é público ou privado;
Usualmente, interações sociais em locais públicos podem produzir dados de pesquisa. Isso não exime quem pesquisa de preocupações éticas, mas a distinção tradicional entre ambientes off-line públicos (ruas, praças, praias etc.) e privados colocava um limite claro entre uma situação com menos formalidade na regulação da pesquisa e outra diferente.
No entanto, o contexto on-line problematiza a distinção rígida entre essas esferas. As pessoas que utilizam a internet e as redes sociais, ainda que interajam ou façam publicações em modo “público”, costumam expressar preocupação sobre como o que produzem será utilizado por outros indivíduos.
Portanto, é importante refletir sobre o uso de dados pessoais da internet, mesmo que, em tese, sejam públicos. É nessa linha que vai, por exemplo, o documento com Diretrizes Éticas da Association of Internet Researchers (AoIR). Autoras influentes na discussão do assunto defendem, assim, localizar as questões éticas nos contextos específicos das investigações, em
“uma abordagem baseada em casos que reconheça e considere as tensões éticas como conflitos com considerações legais, disciplinares, institucionais e culturais .... Ao colocar questões éticas de forma consistente e refletir sobre o processo de pesquisa, quem investiga irá equilibrar melhor suas diferentes obrigações” (p. 204).2. A necessidade e a forma de obtenção do consentimento livre e esclarecido;
e
A noção de “consentimento informado” decorre da ética médica e, com o tempo, passou a ser parte central da ética da pesquisa de diversas disciplinas quando as investigações envolvem seres humanos. Geralmente, o uso de um Termo de Consentimento Livre e Esclarecido (TCLE) operacionaliza o conceito na prática. Conforme define a Lei nº 14.874, ele é o “documento no qual é explicitado o consentimento livre e esclarecido do participante da pesquisa, ou do seu responsável legal, de forma escrita, com todas as informações necessárias, em linguagem clara e objetiva, de fácil entendimento, para o completo esclarecimento sobre a pesquisa da qual se propõe participar” (Art. 2º, LIII).
O modo como se dá o aceite deste termo, na maior parte das vezes, evidencia uma diferenciação entre a pesquisa off-line e a que utiliza o ambiente digital, pois, como nota uma estudiosa:
“Enquanto a ética tradicional da pesquisa envolvendo seres humanos geralmente envolve o contato face a face entre quem pesquisa e o indivíduo pesquisado, permitindo que ocorra uma conversa, a tecnologia elimina esse contato, diluindo significativamente a capacidade de quem solicita o consentimento de avaliar a autonomia, a competência e a compreensão de quem poderá consentir, e destas pessoas de entender as minúcias da explicação”.
A Resolução CNS Nº 510/2016 nota que o processo de consentimento ou assentimento livre e esclarecido pode acontecer em qualquer fase da pesquisa. O momento em que isso ocorre depende da pesquisa, pois, embora o receio de não obter o consentimento após terem sido feitas observações seja compreensível, há também o risco de que essa solicitação possa perturbar e enviesar o contexto de pesquisa, como o de algum grupo on-line. Assim, o momento em que o pedido será feito é uma decisão que envolve ponderação. Entretanto, em pesquisas de levantamento utilizando a internet como meio de coleta de dados, a praxe tem sido explicar textualmente a pesquisa, mostrando os termos de consentimento (veja exemplos de TCLEs desse tipo), que deve ser aceito antes do início efetivo da coleta de dados.
Por outro lado, nem sempre é possível obter o consentimento informado de um número grande de pessoas, como ocorre na pesquisa com big data. A tendência internacional tem sido tratar esses dados a partir de agregações das informações e sem que exista possibilidade de identificação individual de qualquer pessoa. A Resolução mencionada, no parágrafo único de seu Art. 1, dispensa a necessidade de registro e avaliação por Comitês de Ética para pesquisas desse tipo, abonando essa prática.
Essa opção, de maneira geral razoável em relação à pesquisa com dados existentes, é controversa na investigação científica que envolve a manipulação de participantes. O notório experimento realizado no Facebook, em 2012, com cerca de 700 mil usuários da plataforma com o objetivo de avaliar o “contágio emocional”, a partir da alteração do que elas viam em seu feed, é um exemplo. A publicação do artigo provocou ultraje público e críticas no campo científico, em particular pela inexistência de algum tipo de consentimento das pessoas. Embora a empresa tenha alegado que a pesquisa cumpria suas regras, foi apenas quatro meses depois desse experimento que os termos de uso do Facebook foram alterados, passando a incluir a informação sobre a coleta de dados das pessoas que usam o serviço para estudos científicos.
3. A garantia de anonimato e confidencialidade.
Por vezes, quem faz a investigação obtém dados sem identificação, anônimos, por exemplo, ao coletar dados a partir de um questionário on-line que não solicita isso, nem quaisquer informações indexicais. Mas é frequente que se saiba quem forneceu os dados. Então, é preciso torná-los anônimos, ou seja, não associados a uma pessoa, para proteger a privacidade de quem colaborou.
No entanto, no contexto digital, isso é também problemático, na medida em que citações literais podem ser rastreadas, por exemplo, quando inseridas em buscadores da internet que apontam suas fontes. Por isso, quando a identificação de quem participou da pesquisa for indesejável, o uso de citações diretas ou informações e dados, como fotos e imagens, que permitam identificar pessoas deve ser evitado. Na etapa de publicação de resultados, para garantir o sigilo de quem deu informações, é comum o uso de pseudônimos ou identificações genéricas.
A confidencialidade dos dados está relacionada também à manipulação e compartilhamento dos dados brutos, por isso quem faz a pesquisa deve estabelecer procedimentos que protejam a identidade dos participantes nessas ocasiões.
Vale notar que pessoas e instituições públicas não requerem, de maneira geral, as mesmas preocupações relacionadas às dimensões de anonimato e confidencialidade na pesquisa científica que indivíduos comuns.
Veremos, a seguir, como as preocupações discutidas têm gerado propostas de quadros de referência reflexivos para ajudar a tomada de decisões éticas durante pesquisas no ambiente digital.
Introdução à Análise de Dados On-Line
Exemplos de Termos de Consentimento Livre e Esclarecido no contexto on-line
É interessante notar os diferentes formatos dos TCLEs, mas com a preocupação básica de informar quem irá participar da investigação a respeito da natureza dela.
-
Enquadramentos reflexivos
Quadros de referências ou guias sobre questões éticas podem favorecer opções contextualizadas nas investigações envolvendo a mídia digital. Há algumas propostas convergentes sobre o tema, como as de Williams et al. (2017), Townsend e Wallace (2016) e Fuchs (2018).
A primeira proposta recomenda que, durante a investigação, sejam feitas considerações sobre o modo de publicação de determinado conteúdo (público ou não) e as características do produtor (indivíduo público ou não, vulnerável ou não). A partir daí, quem pesquisa deve decidir se irá solicitar a autorização para o uso do conteúdo na investigação e mesmo se deverá utilizar esse material no trabalho.
O guia de Townsend e Wallace (2016), por sua vez, localiza as questões éticas num contexto amplo, sugerindo a reflexão sobre três dimensões principais:
- Os termos e condições da plataforma foram consultados?
- As diretrizes da disciplina acadêmica, dos agentes de fomento, legais ou institucionais relevantes foram consultadas?
- Quem utiliza a mídia social pode esperar razoavelmente ser observado por estranhos?
- Os participantes da pesquisa são vulneráveis (crianças ou adultos vulneráveis, por exemplo)?
- Quem utiliza as mídias sociais será anonimizado nos resultados publicados?
- Será possível publicar ou compartilhar a base de dados?
Em linha com as propostas anteriores, Fuchs (2018) discute particularmente os dilemas éticos relacionados aos estudos qualitativos, recomendando uma ética de pesquisa on-line crítico-realista. A discussão do autor, no trabalho, significativamente intitulado “Caro Sr. Neonazista, Você Pode Me Dar Seu Consentimento Informado para que Eu Possa Citar Seu Tweet Fascista?”, exemplifica a proposta.
Desse modo, o dilema exposto é equacionado a partir do argumento de que, quando alguém publica algo usando hashtag, numa mídia social, se engaja numa discussão pública, portanto, sabe que o que publicou será lido por outras pessoas, e até deseja isso, não possuindo expectativa de privacidade. Assim, o uso desse dado, sem pedido de autorização, seria abonado. Ao mesmo tempo, o autor nota que, mesmo utilizando conteúdo produzido por pessoas desconhecidas (não personalidades públicas), anonimiza os dados.
A seguir são mostrados alguns “estudos de caso”, retirados do trabalho de Townsend e Wallace (2016), com situações de pesquisa que demandam decisões e suas propostas de encaminhamento ético.
Contexto
Alguém deseja estudar narrativas pró-legalização do uso da maconha. Os dados serão coletados a partir do Twitter, portanto são dados públicos abertos. A pesquisa será feita com a coleta de dados, postagens, publicadas com as hashtags #cannabis, #legalize e #ismokeit, durante os últimos 7 dias.
Preocupações
De saída, o assunto é sensível porque se refere a uma atividade ainda ilegal no Reino Unido. Em segundo lugar, pode haver usuários com menos de 18 anos de idade contribuindo para o debate. Por isso, quem faz a pesquisa deve trabalhar de modo a tratar os dados adotando procedimentos de proteção do anonimato.
Encaminhamento ético
Quem pesquisa decide que os dados são públicos, porque são postados no Twitter (plataforma na qual a configuração padrão para postagens é pública); a maioria dos perfis são públicos e podem ser vistos e seguidos por qualquer um. Além disso, o uso de hashtags implica que os usuários estão interessados em contribuir em uma comunidade ou debate e, portanto, esperam um número ainda maior de pessoas vendo seus dados. O tema é sensível, e pode haver dados de menores, assim, há risco considerável de danos. A autoria decide que convém acessar os dados e apresentar resultados a partir de dados agregados, mas não é correto publicar um conjunto de dados (proibido pelo Twitter de qualquer forma) ou republicar citações diretas que levarão pessoas interessadas ao perfil do usuário, comprometendo o anonimato. Quem faz a pesquisa apresentará, portanto, citações parafraseadas (removendo os identificadores) para refletir os temas que surgirem, e fornecerá detalhes sobre como os dados da pesquisa podem ser replicados. Algumas citações diretas podem ser usadas com o consentimento informado do usuário da plataforma, mas o pesquisador sabe que deve tomar medidas para garantir que o usuário tem mais de 18 anos de idade.
Contexto
Uma pesquisadora deseja explorar os temas dominantes nas publicações de mídia social de atletas olímpicos em seus perfis de mídia social. Os perfis são públicos e normalmente têm centenas de milhares de seguidores. As plataformas sob escrutínio incluem Twitter e Facebook.
Preocupações
A pesquisadora pode considerar estas postagens públicas, e é ético publicar seus dados textualmente?
Encaminhamento ético
É razoável que a pesquisadora considere estes dados públicos, porque o esportista está publicando em um perfil público com o objetivo de divulgar sua conta de forma mais geral e com a intenção de alcançar o maior número de pessoas possível. Nesse caso, também é razoável que a pesquisadora republique esses dados – o esportista tem uma grande expectativa de que (um grande número de) estranhos estarão vendo seus dados e, de fato, isto é frequentemente desejado. Portanto, é pouco provável que os dados sejam sensíveis. Também dado o tamanho de seu público, é pouco provável que o pesquisador represente um dano potencial ao esportista, além de qualquer risco potencial que ele coloque sobre si mesmo. As citações podem ser republicadas em sua forma original.
Contexto
Um pesquisador conduz uma análise crítica do discurso de uma base de dados de tweets usando as hashtags #DonaldTrump; #TrumpTrain; #VoteTrump2016; #AlwaysTrump; #MakeAmericaGreatAgain ou #Trump2016. Os tweets são analisados a fim de descobrir como os apoiadores do Trump argumentam em prol de seu candidato no Twitter.
Preocupações
Podemos considerar estes dados públicos? Há algum problema de sensibilidade ou risco de dano? Precisamos buscar o consentimento informado antes de citar estes tweets diretamente?
Encaminhamento ético
Os apoiadores do Trump usam estas hashtags para alcançar um público amplo e convencer outras pessoas a votar em Trump. Portanto, é razoável supor que tais tweets tenham caráter público: os autores esperam e querem ser observados por estranhos a fim de defender um ponto de vista político que eles querem que outros leiam. O pesquisador pode, portanto, citar diretamente tais tweets sem ter que obter o consentimento informado. No entanto, é uma boa prática apagar as IDs dos usuários comuns, que não são eles mesmos figuras públicas.
-
Teilnehmer/innen müssenEine Bewertung erhalten
Leio o artigo “Towards an Ethical Framework for Publishing Twitter Data in Social Research”, de Matthew L Williams, Pete Burnap e Luke Sloan, e arraste e solte as palavras que fazem sentido em relação ao fluxograma apresentado.
-
Comitês de Ética e LGPD
No contexto brasileiro, como já observado, a Lei nº 14.874, de 28 de maio de 2024, instituiu o Sistema Nacional de Ética em Pesquisa com Seres Humanos. Os Comitês de Ética em Pesquisa (CEP) possuem papel central nesse Sistema, sendo responsáveis por avaliar projetos. No Parágrafo único de seu Art. 1, a Resolução CNS Nº 510/2016, dirigida especificamente às ciências sociais e humanas, informa os casos em que as investigações não precisam ser registradas e avaliadas por CEPs:
Quem elabora uma proposta de investigação deve ter em mente essas exceções para avaliar se seu projeto de pesquisa envolvendo seres humanos deve ser submetido a um CEP. Ao mesmo tempo, é importante saber que a Lei nº 14.874 estabelece, em seu Art. 14, que a “análise ética de pesquisa, realizada pelo CEP, com emissão do parecer, não poderá ultrapassar o prazo de 30 (trinta) dias úteis da data de aceitação da integralidade dos documentos da pesquisa, e essa aceitação, ou sua negativa, deverá ser feita pelo CEP em até 10 (dez) dias úteis a partir da data de submissão”. Um parâmetro como esse deve, portanto, ser levado em conta no planejamento e cronograma de investigações que requeiram avaliação.“I - pesquisa de opinião pública com participantes não identificados;
II - pesquisa que utilize informações de acesso público, nos termos da Lei n o 12.527, de 18 de novembro de 2011;
III - pesquisa que utilize informações de domínio público;
IV - pesquisa censitária;
V - pesquisa com bancos de dados, cujas informações são agregadas, sem possibilidade de identificação individual; e
VI - pesquisa realizada exclusivamente com textos científicos para revisão da literatura científica;
VII - pesquisa que objetiva o aprofundamento teórico de situações que emergem espontânea e contingencialmente na prática profissional, desde que não revelem dados que possam identificar o sujeito; e
III (sic) - atividade realizada com o intuito exclusivamente de educação, ensino ou treinamento sem finalidade de pesquisa científica, de alunos de graduação, de curso técnico, ou de profissionais em especialização.
§ 1 o Não se enquadram no inciso antecedente os Trabalhos de Conclusão de Curso, monografias e similares, devendo-se, nestes casos, apresentar o protocolo de pesquisa ao sistema CEP/CONEP;
§ 2 o Caso, durante o planejamento ou a execução da atividade de educação, ensino ou treinamento surja a intenção de incorporação dos resultados dessas atividades em um projeto de pesquisa, dever-se-á, de forma obrigatória, apresentar o protocolo de pesquisa ao sistema CEP/CONEP.”
Outra legislação relacionada à regulação da pesquisa é a Lei Geral de Proteção de Dados Pessoais (LGPD). Devido à redação ambígua, há certa controvérsia se ela se aplica diretamente à investigação científica conduzida em instituições sem fins lucrativos. Porém, existe alinhamento claro entre o espírito da Lei e certas regras preconizadas com relação às práticas tradicionais da ética na pesquisa. Além disso, a própria Lei nº 14.847 faz referência à LGPD, em particular, no que diz respeito à proteção e ao anonimato de dados pessoais das pessoas que participam de pesquisas (ver Artigo 69).
Na LGPD, a noção de “tratamento de dados” é definida como:
“toda operação realizada com dados pessoais, como as que se referem a coleta, produção, recepção, classificação, utilização, acesso, reprodução, transmissão, distribuição, processamento, arquivamento, armazenamento, eliminação, avaliação ou controle da informação, modificação, comunicação, transferência, difusão ou extração” (Art. 5, inciso X).Tendo em vista a discussão prévia, as preocupações éticas do pesquisador devem estar em todas essas etapas.
-
Conclusão e desenvolvimentos
Neste curso, abordamos conceitos relacionados aos dados on-line e à pesquisa digital, bem como estratégias de coleta, tratamento e análise de dados. A natureza introdutória da formação fez com que o conteúdo se limitasse a algumas abordagens, se preocupando em desenvolver um lastro para aprofundamento futuro de quem realizaria o curso.
Foram indicados materiais para avanços posteriores que podem corresponder a uma primeira etapa de novos estudos. No entanto, outras dimensões podem ser sugeridas. Nesse sentido, duas podem ser recomendadas, desde já: uma de teor específico e outra de caráter geral, sendo que ambas podem colaborar para tornar alguém mais competente na pesquisa envolvendo dados on-line.
A geral é a contínua leitura crítica de pesquisas e discussões que envolvam dados e métodos digitais, pois isso favorece o desenvolvimento do senso crítico e científico quanto aos dados. As revistas científicas de comunicação apresentam, quase sempre a cada edição, trabalhos assim, e os livros organizados por Silva e Stabile (2016), Silva et al. (2018) reúnem muitos estudos e discussões metodológicas interessantes.
Outras leituras válidas, nessa perspectiva, são o trabalho de Lopes e Freire (2015), discutindo implicações de ferramentas, métricas e monitoramento de conteúdos produzidos por fãs em redes sociais e, no âmbito dos métodos digitais, o de Rogers (2019), abordando as possibilidades de uso de métricas alternativas para estudar o engajamento social em questões problemáticas, no que chamou de “análise crítica”.
A sugestão mais restrita está ligada ao fortalecimento de uma atitude reflexiva frente aos instrumentos técnicos de coleta, organização e análise de dados. Como argumentam van Es et al. (2021), as ferramentas fazem um trabalho epistêmico, de modo que suas premissas e adequação para fins de pesquisa precisam ser avaliadas criticamente. Isso envolve, entre outros pontos, a busca por conhecimento sobre as características, as limitações e o papel que elas exercem no desenvolvimento da pesquisa. É preciso evitar uma atitude acrítica e ingênua sobre a influência que os instrumentos exercem sobre os dados obtidos a partir deles e sobre o processo de investigação como um todo.
Um provável desenvolvimento das ferramentas, por sinal, deverá ser a associação com softwares de inteligência artificial, o que já foi vislumbrado, embora de maneira tímida, em determinados momentos desta formação. Mas essa é uma área que deve crescer e que exigirá também reflexividade na adoção por parte de quem faz pesquisas.
-
Teilnehmer/innen müssenEine Bewertung erhalten
Revise o conteúdo, respondendo às perguntas deste recurso de aprendizagem.
-
Despedida
Parabéns a você que está quase concluindo o curso Introdução à Análise de Dados On-Line na Pesquisa em Comunicação. Agora que quase tudo já foi dito e feito, só nos resta torcer para que você faça um bom trabalho conclusivo e que aproveite a formação em prol de suas futuras pesquisas.
Pedimos que você, por favor, preencha o formulário de avaliação do curso, pois ele será um instrumento para que possamos aperfeiçoar futuras edições dessa formação.
Muito obrigado.
-
Ao términar o curso, responda essa pesquisa avaliando sua experiência. Observação: as respostas são anònimas.
-
REAs de aprofundamento
-