Chiudi banner

2022-10-22 20:20:11 By : Ms. Catherine Fang

Grazie per aver visitato nature.com.Stai utilizzando una versione del browser con supporto limitato per CSS.Per ottenere la migliore esperienza, ti consigliamo di utilizzare un browser più aggiornato (o disattivare la modalità compatibilità in Internet Explorer).Nel frattempo, per garantire un supporto continuo, stiamo visualizzando il sito senza stili e JavaScript.Dati scientifici volume 9, numero articolo: 643 (2022 ) Citare questo articoloI dati dei social media offrono una ricca risorsa per i ricercatori interessati alla salute pubblica, all'economia del lavoro, alla politica, ai comportamenti sociali e ad altri argomenti.Tuttavia, la scala e l'anonimato significano che i ricercatori spesso non possono ottenere direttamente dagli utenti il ​​permesso di raccogliere e analizzare i loro dati sui social media.Questo articolo applica il principio etico di base del rispetto per le persone di considerare le percezioni degli individui sugli usi accettabili dei dati.Confrontiamo le percezioni degli individui sugli usi accettabili di altri tipi di dati sensibili, come le cartelle cliniche e gli identificatori individuali, con le loro percezioni sugli usi accettabili dei dati dei social media.Il nostro sondaggio su 1018 persone mostra che le persone considerano i propri dati sui social media moderatamente sensibili e concordano sul fatto che dovrebbero essere protetti.Gli intervistati generalmente sono d'accordo con i ricercatori che utilizzano i loro dati nella ricerca sociale, ma preferiscono che i ricercatori esprimano chiaramente i vantaggi e cerchino il consenso esplicito prima di condurre la ricerca.Sosteniamo che i ricercatori devono garantire che la loro ricerca fornisca benefici sociali degni dei rischi individuali e che devono affrontare tali rischi durante tutto il processo di ricerca.I ricercatori hanno utilizzato i dati dei social media in una miriade di modi e con mezzi diversi.Ad esempio, Twitter, Facebook, Instagram, Reddit e Wikipedia sono le prime cinque piattaforme utilizzate dai ricercatori sui social media per la raccolta di dati1.Il lavoro precedente enumera anche i diversi modi in cui i ricercatori acquisiscono i dati dei social media, incluso il web scraping utilizzando Python o R, servizi come NVivo, Discovertext, NodeXL, TAGS, IFTTT, Social Feed Manager, Zapier, Hydrator, WebRecorder.io, API della piattaforma e persino screenshot1,2.Gli strumenti per fornire l'accesso ai dati dei social media si stanno evolvendo.Ad esempio, all'inizio del 2022, Twitter ha rilasciato la sua API senza codice, consentendo ai ricercatori di accedere ai dati di Twitter senza la necessità di avere competenze di programmazione.I dati di Twitter sono ora più accessibili per una più ampia gamma di ricercatori per studiare argomenti come il capitale sociale3, le agende politiche4, l'economia del lavoro5 e la salute pubblica6.Allo stesso modo, il lancio dell'API Twitter Academic ha notevolmente ampliato la portata dei dati di Twitter che i ricercatori possono utilizzare, consentendo anche l'accesso all'archivio completo dei tweet precedentemente disponibile solo tramite la versione Enterprise.La maggiore disponibilità dei dati rende le questioni etiche sull'uso dei dati dei social media per la ricerca ancora più urgenti.Ad esempio, i ricercatori dovrebbero raccogliere dati sui social media?Se sì, quando e come dovrebbero utilizzarlo i ricercatori?Legalmente, gli utenti dei social media concedono ampi permessi per l'utilizzo dei loro dati quando accettano i termini di servizio (TOS) delle piattaforme.Tuttavia, gli utenti spesso non leggono o non comprendono i TOS7, potrebbero non considerare i propri dati come pubblici8 e potrebbero non rendersi conto che i ricercatori fanno parte di quel pubblico9,10.Il lavoro precedente ha rilevato che gli utenti preferiscono effettivamente concedere il consenso esplicito all'utilizzo dei propri dati nella ricerca nonostante accettino TOS8, e il loro atteggiamento verso l'uso accettabile dei dati dipende fortemente dal contesto e dagli obiettivi della ricerca11.In che modo i ricercatori sui social media possono conciliare la capacità legale di utilizzare i dati dei social media e la loro pronta disponibilità con le preferenze degli individui sui loro dati sui social media utilizzati per la ricerca?Un principio di base nella ricerca chiamato rispetto per le persone può portare chiarezza su come i ricercatori possono pensare alle pratiche etiche di utilizzo dei dati dei social media.Il rispetto per le persone12 richiede che i ricercatori orientino le loro pratiche intorno alle percezioni individuali degli usi accettabili dei dati.Il rispetto per le persone è spesso affrontato attraverso processi di consenso informato che ottengono il permesso esplicito delle persone di utilizzare i loro dati.Il consenso esplicito serve a informare le persone dell'opportunità di ottenere dati su di loro raccolti per la ricerca e di esprimere le loro preferenze sulla raccolta dei loro dati accettando o rifiutando la partecipazione.Sebbene i ricercatori riconoscano che il consenso informato è una considerazione, insieme al bilanciamento di rischi e benefici e alla protezione degli individui13, i processi di consenso esplicito con gli utenti dei social media sono spesso impossibili.La portata e l'anonimato dei social media significano che i ricercatori spesso non possono suscitare direttamente le percezioni degli individui sugli usi accettabili dei dati che generano sui social media.Un'eccezione è il progetto Documenting the Now, che ha creato etichette "Social Humans" per allegare autorizzazioni di utilizzo esplicite a contenuti e analisi dai social media14.Le etichette Social Humans mirano a colmare il divario tra le autorizzazioni legali concesse dagli utenti quando accettano i TOS delle piattaforme e i desideri dei creatori di contenuti.Tuttavia, questo metodo deve ancora essere ampiamente adottato, il che significa che anche i permessi di utilizzo espliciti come le etichette Social Humans non possono guidare efficacemente i ricercatori su come garantire che rispettino le preferenze degli individui sull'uso dei loro dati.Per capire come possiamo realizzare il rispetto per le persone nel particolare contesto della ricerca sui dati sui social media, guardiamo a studi sulle percezioni degli utenti sugli usi accettabili di altri tipi di dati sensibili ma ampiamente disponibili.Il lavoro precedente ha rilevato che gli utenti dei dati dei social media considerano i propri dati dei social media in modo simile a come pensano ai tipi di dati sensibili ampiamente riconosciuti15,16 come i file degli elettori17, i tabulati dei cellulari18 e i sondaggi su larga scala19.Il confronto delle percezioni sull'uso accettabile dei dati dei social media da parte degli individui con questi altri tipi di dati sensibili ci offre l'opportunità di imparare dalle migliori pratiche esistenti sul rispetto delle persone oltre al consenso esplicito sviluppato per supportare i dati sensibili.Il nostro studio di indagine affronta quindi le seguenti domande di ricerca:RQ1: In che modo le percezioni dei partecipanti sull'utilizzo dei dati dei social media accettabili si confrontano con altri tipi di dati sensibili su di loro?RQ2: In che modo le percezioni dei partecipanti sull'uso accettabile dei dati dei social media sono correlate all'analista dei dati, al loro scopo per l'utilizzo dei dati e alle percezioni della sensibilità?Rispondere a RQ1 ci consente di valutare la sensibilità relativa dei dati dei social media e di capire se altri tipi di dati sensibili sono un contesto appropriato da cui cercare saggezza su come i ricercatori possono avvicinarsi all'uso dei dati dei social media.Rispondere a RQ2 ci consente di chiarire la sensibilità e le relazioni di altre variabili per un uso accettabile.Insieme, le risposte a queste domande forniscono spunti per i ricercatori sui social media sulle migliori pratiche da seguire quando si lavora con i dati dei social media per garantire il rispetto delle persone.Il lavoro precedente sostiene che la disponibilità delle persone a condividere i propri dati personali è una funzione di: sensibilità ai dati, chi utilizzerà i dati (analista di dati), cosa gli utenti sperano di ottenere e chi altro trarrà vantaggio dall'utilizzo dei dati (scopo di utilizzo dei dati) , quali dati verranno utilizzati (tipo di dati) e caratteristiche personali della persona che condivide i dati (caratteristiche di condivisione dei dati).Le seguenti sottosezioni esaminano ciascuno di questi fattori.La sensibilità ai dati descrive quanto rischioso una persona percepisce condividere i propri dati.Il lavoro precedente sulla disponibilità dei consumatori a condividere i dati con i marketer15,16 identifica quattro tipi di rischio che possono essere particolarmente importanti per la caratterizzazione dei dati da parte delle persone come sensibili: rischio monetario, psicologico, fisico e sociale.La percezione di una persona di quanto sia sensibile un tipo di dati, o di quanto rischio percepisce di correre condividendo quel tipo di dati, può informare quanto quella persona potrebbe essere disposta a condividere i propri dati.Tuttavia, sebbene questa correlazione sia implicita nella letteratura di marketing, l'esistenza e la qualità di questa relazione devono ancora essere valutate empiricamente.Inoltre, il fatto che una persona caratterizzi i dati su se stessa come sensibili non è una caratteristica fissa, ma piuttosto può cambiare a seconda dei contesti in cui i dati potrebbero essere utilizzati e delle caratteristiche personali di chi condivide i dati15,16.Sapere chi utilizzerà i propri dati determina la percezione di un utilizzo accettabile da parte di coloro che condividono i dati.Le persone tendono a trovare l'uso dei dati dei propri social media da parte di analisti di dati noti più accettabile rispetto ad analisti di dati sconosciuti.Mentre gli utenti dei social media cercano di limitare chi vede e utilizza i propri dati solo al pubblico previsto, i loro dati sono ancora spesso visti da un pubblico imprevisto o sconosciuto10.Quando le persone vengono a sapere che questi segmenti di pubblico non intenzionali, tra cui i ricercatori, utilizzano i loro dati, tendono a trovare questo uso meno accettabile che se i loro dati venissero utilizzati dal pubblico previsto20.Oltre agli analisti di dati noti rispetto a quelli sconosciuti, altre identità di analisti di dati possono influenzare ulteriormente la percezione di un uso accettabile da parte degli utenti.Ad esempio, Gilbert e colleghi11 hanno chiesto agli intervistati di valutare l'adeguatezza dell'uso dei loro dati personali di Facebook per la ricerca in base alla disciplina che li utilizza.Hanno scoperto che gli intervistati erano più preoccupati per gli studi in informatica, studi di genere e psicologia che utilizzavano i loro dati rispetto agli studi in scienze della salute.Uno studio correlato sulla ricerca sulla salute pubblica del Regno Unito mostra che i partecipanti erano molto più disposti a condividere i propri dati personali per la ricerca da parte del Servizio sanitario nazionale del Regno Unito che con una società commerciale21.A parte il pubblico previsto in modo esplicito, le persone si sentono più a proprio agio con i loro dati utilizzati dai ricercatori sanitari rispetto ad altri analisti.Nel complesso, se un analista di dati è conosciuto o sconosciuto ea quale disciplina o dominio professionale è affiliato può influenzare la percezione individuale di un uso accettabile.La letteratura suggerisce che le percezioni degli individui sull'uso accettabile variano anche a seconda degli scopi di utilizzo dei dati come la ricerca sanitaria o il marketing.Ad esempio, uno studio sulla ricerca sulla salute pubblica del Regno Unito ha rilevato che quando ai partecipanti è stato detto che richiedere il consenso potrebbe portare a pregiudizi di selezione e avere un impatto negativo sulla ricerca sulla salute pubblica, i partecipanti erano più disposti a condividere i propri dati senza il consenso esplicito21.Sia per i dati sanitari21,22,23 che per i dati dei social media11,24, la misura in cui i partecipanti ritengono che la condivisione dei propri dati contribuirà a uno scopo che andrà a beneficio della società influisce sul modo in cui ritengono accettabile l'uso dei propri dati.Oltre ai vantaggi pubblici, è più probabile che le persone trovino accettabile l'uso dei dati quando offre vantaggi personali come sconti o servizi personalizzati.I ricercatori che studiano le conversazioni pubbliche sulle controversie sulla privacy hanno scoperto che molti interlocutori considerano se stessi e i propri dati come un "prodotto" che le aziende a scopo di lucro utilizzano allo scopo di fare soldi, e in cambio ricevono alcuni servizi digitali, un vantaggio personale25.I Discussants hanno ritenuto accettabile questo tipo di finalità di utilizzo dei dati.In un altro esempio, uno studio sull'uso dei dati dei social media da parte dei giornalisti suggerisce che più gli utenti dei social media vogliono sentirsi ascoltati, più è probabile che trovino accettabile l'uso dei loro dati da parte dei giornalisti.I vantaggi personali derivanti dalla ricezione di servizi digitali e dal "sentirsi ascoltati" hanno mediato le percezioni degli individui sull'accettabilità delle diverse finalità di utilizzo dei dati26.Oltre allo scopo di utilizzo generale (ad esempio, per la ricerca sulla salute pubblica, per il marketing, per la sensibilizzazione del pubblico, ecc.), la comprensione da parte delle persone di come verranno utilizzati esattamente i dati dei social media influisce anche sulla loro percezione del loro uso accettabile.Quando i partecipanti sanno quali metodi di analisi e misure di sicurezza dei dati utilizzeranno i ricercatori, si sentono meglio quando i loro dati vengono utilizzati per la ricerca22.Fiesler e Proferes25 hanno scoperto che le persone che hanno indicato di capire come sarebbero stati utilizzati i propri dati sui social media, anche per la ricerca, erano meno preoccupati per il loro utilizzo rispetto a coloro che non erano a conoscenza di come i propri dati sarebbero stati successivamente utilizzati.In generale, quando alle persone viene chiesto esplicitamente il permesso e capiscono quale ricerca verrà condotta (ad esempio, lo scopo dell'uso dei dati), di solito acconsentono che i loro dati sui social media possano essere utilizzati nella ricerca8,11.Oltre a chi utilizzerà i loro dati e per quali scopi, i condivisioni si preoccupano di quali dati specifici verranno utilizzati.Due studi hanno esaminato la volontà dei consumatori statunitensi di condividere diversi tipi di informazioni con i marketer15,16.Utilizzando un sondaggio rappresentativo a livello nazionale, hanno scoperto che gli intervistati erano altrettanto riluttanti a condividere il numero di carta di credito, i dettagli del conto finanziario e le informazioni sulla patente di guida (identificatori univoci o chiavi direttamente legate a un individuo specifico), come se condividessero i propri social profilo di rete, immagine del profilo e informazioni sui propri amici o familiari.Gli intervistati hanno anche considerato il loro profilo sui social media più sensibile, o rischioso da condividere, rispetto ai dati demografici di base come altezza, luogo di nascita e occupazione, dati che, se collegati ad altri dati, possono aumentare il rischio che un individuo specifico possa essere identificato.Quando hanno chiesto agli intervistati di valutare l'adeguatezza degli usi dei loro dati personali per la ricerca per tipo di dati, i ricercatori hanno scoperto che gli intervistati erano più preoccupati per i ricercatori che usavano le loro foto e video, i dati sulle abitudini sessuali, i dati sulle preferenze e i comportamenti e i post su loro amici o familiari11.Questi studi mostrano che le persone valutano la rischiosità e l'accettabilità della condivisione di vari tipi di dati sui social media in modo diverso.La ricerca riporta che la percezione dell'uso accettabile dei dati varia anche in base alle caratteristiche personali di chi condivide i dati.Ad esempio, gli studi rilevano che la fiducia delle persone nelle istituzioni, un tipo di analista di dati, influisce sul fatto che gli individui siano d'accordo con quelle istituzioni che utilizzano i loro dati sui social media8,11,27.Sia per i dati sanitari21,22,23 che per i dati dei social media11,24, la fiducia delle persone nei ricercatori in generale influisce anche sul modo in cui ritengono accettabile l'uso dei loro dati.Gli studi trovano risultati contrastanti riguardo agli effetti sulle caratteristiche demografiche sulla percezione di un uso accettabile.Ad esempio, Fiesler e Proferes8 hanno scoperto che le caratteristiche demografiche non hanno alcun effetto statisticamente significativo sull'atteggiamento degli intervistati nei confronti dei dati di Twitter utilizzati in vari tipi di ricerca.Al contrario, Gilbert, Vitak e Shilton11 hanno dimostrato che sesso, età, livello di istruzione e frequenza di utilizzo dei social media hanno effetti significativi sull'atteggiamento degli individui nei confronti dei dati di Facebook utilizzati in vari tipi di ricerca.Uno studio comparativo sulle percezioni di sensibilità in Brasile e negli Stati Uniti ha rilevato che le percezioni variano in base al paese di residenza di un individuo (ad esempio, Brasile o Stati Uniti) e l'età influisce sulla sua disponibilità a condividere i dati personali16.Altri hanno anche riportato effetti significativi per sesso e livello di istruzione sulla disponibilità a condividere i dati nel loro sondaggio negli Stati Uniti15.Infine, la letteratura mostra che atteggiamenti preesistenti nei confronti della privacy8 possono influenzare la percezione di un uso accettabile.Queste caratteristiche di condivisione dei dati possono mediare gli effetti dell'analista dei dati, lo scopo di utilizzo dei dati e il tipo di dati sulle percezioni degli individui sull'uso accettabile.Nel complesso, le percezioni degli utenti dei social media sul fatto che l'utilizzo dei propri dati sia accettabile può essere mediata da quanto percepiscono come sensibili i propri dati, dall'analista dei dati, dallo scopo dell'utilizzo dei dati, dal tipo di dati e dalle loro caratteristiche personali.Questa rete di fattori modella le sfide che i ricercatori devono affrontare per bilanciare il rispetto per le persone con esigenze di ricerca.Il nostro studio attinge dalle conoscenze delle borse di studio esistenti sui dati sensibili e sull'uso accettabile per conoscere in modo specifico come le persone si sentono riguardo all'uso dei dati dei loro social media rispetto ad altri tipi di dati che le persone hanno indicato come sensibili a loro come i record sanitari21 e la posizione28.Per comprendere le percezioni dei partecipanti sull'uso accettabile dei dati dei social media, abbiamo intervistato 1018 persone attraverso i panel di Qualtrics e Mechanical Turk29.La tabella 6 offre statistiche descrittive riassuntive sul nostro campione.Abbiamo utilizzato analisi statistiche per identificare i modelli nelle risposte al sondaggio, in particolare per quanto riguarda (a) la sensibilità degli identificatori online degli individui rispetto ad altri identificatori personali e (b) se i partecipanti percepiscono o meno un particolare analista di dati utilizzando un tipo specifico di dati per un lo scopo è accettabile o meno.La sezione 5 fornisce ulteriori dettagli sulla progettazione del nostro sondaggio, sulle variabili e sulle tecniche di analisi.Affrontiamo ogni domanda di ricerca nella sua sezione di seguito.In ogni caso, abbiamo fornito i modelli di regressione di best fit.Abbiamo calcolato il modello misto di collegamento cumulativo (CLMM) utilizzando il pacchetto ordinale in R30 per confrontare la sensibilità relativa di una chiave ai propri dati sui social media - il proprio nome visualizzato - con altri tipi di chiavi simili a dati potenzialmente sensibili sugli individui (ad esempio, la patente di guida codice fiscale o codice fiscale).Confrontiamo anche la sensibilità del proprio nickname con dati che in aggregato potrebbero essere legati all'identità di un individuo specifico (es. razza, peso).I nostri risultati, presentati nella Tabella 1 e nella Fig. 1, mostrano che un nome sullo schermo è più sensibile dei dettagli demografici come razza (OR = 0,36, p <0,001), religione (OR = 0,50 p <0,001) e peso (OR = 0,47 p < 0,001), ma meno sensibile di identificatori come il numero di patente di guida (OR = 4,67, p < 0,001) o dati della propria storia medica (OR = 4,46, p < 0,001).La figura 2 mostra anche che gli individui hanno mostrato maggiori variazioni nella sensibilità del loro nome visualizzato online rispetto ad altri tipi di dati come impronte digitali o anamnesi che possono anche fornire accesso ai dati sui loro comportamenti.Grafici di violino che mostrano la distribuzione, la mediana e i quartili per la sensibilità di vari tipi di dati in cui 10 = "molto sensibile".Grafico dell'odds ratio dove DV = "è ok" su ogni analista di dati, tipo di dati, combinazione di scopi.La tabella 1 indica anche che gli intervistati che erano uomini e quelli con maggiore fiducia nelle istituzioni avevano meno probabilità di trovare il loro nome sullo schermo online sensibile.Gli intervistati di Qualtrics che avevano maggiori problemi di privacy digitale, più comportamenti sulla privacy, non erano né neri né bianchi, erano eterosessuali, più anziani, più istruiti e/o avevano un reddito più elevato avevano maggiori probabilità di trovare il loro nome sullo schermo online sensibile.Abbiamo calcolato una regressione logistica a effetti misti (MELR) utilizzando la funzione glmer di lme431 per capire se gli intervistati hanno indicato che una particolare combinazione di analista di dati, tipo di dati e scopo era accettabile.In questo modello, la variabile dipendente era se gli intervistati rispondevano "sì" a una domanda specifica e le domande erano l'unico effetto fisso.Abbiamo incluso effetti casuali per rispondente e fonte (Qualtrics o Mechanical Turk).Il coefficiente per gli effetti casuali della fonte era quasi zero, indicando che le differenze tra i soggetti basate sulla fonte potevano essere quasi interamente spiegate dalle altre variabili che abbiamo valutato nel nostro modello.Abbiamo anche incluso controlli demografici e scale per le nostre domande su fiducia, problemi di privacy digitale e comportamenti in materia di privacy.Secondo le analisi ANOVA, il modello di migliore adattamento non includeva la sensibilità come predittore.I risultati (vedi Tabella 2 indicano che gli intervistati hanno trovato solo una combinazione chiaramente inaccettabile (cioè, un rapporto di probabilità significativamente più basso):Va bene per i giornalisti usare i post che hai cancellato dai social media in una storia su disastri naturali?Nel complesso, gli intervistati hanno affermato che era più accettabile utilizzare i propri dati sui social media rispetto ad altri tipi di dati (cfr. tabella 3).Tuttavia, gli intervistati hanno generalmente trovato che i ricercatori accademici che utilizzano i dati dei social media su di loro sono accettabili ad eccezione di due scenari (nessuna differenza significativa tra accettabile e non accettabile):immagini che hai caricato sui social media per addestrare il software di riconoscimento facciale?metadati delle tue foto nei social media per creare una mappa pubblica dei giardini di peonie nella tua zona?Gli intervistati con punteggi più alti sulla scala del problema della privacy digitale erano meno propensi a concordare sul fatto che l'uso dei loro dati fosse accettabile (OR = 0,892).Coloro che avevano punteggi di fiducia istituzionale più elevati (OR = 1,041) e punteggi di comportamento alla privacy (OR = 1,112) avevano maggiori probabilità di indicare che l'utilizzo dei propri dati era accettabile.Tra i nostri controlli demografici, solo gli intervistati etero (OR = 0,265) e quelli più anziani (OR = 0,618) avevano meno probabilità di rispondere che era accettabile l'utilizzo dei loro dati.Gli uomini erano significativamente più propensi rispetto alle donne e ad altre identità di genere (OR = 1.980) a dire che era accettabile l'utilizzo dei loro dati.Anche gli individui di razze diverse da Bianco e Nero (OR = 2,116) avevano maggiori probabilità di trovare accettabile l'uso dei propri dati.Non abbiamo osservato effetti significativi per il livello di reddito.Abbiamo anche adattato un modello in cui abbiamo compresso il nostro tipo di dati e le variabili di scopo in categorie.Secondo le analisi ANOVA, abbiamo scoperto che il modello migliore includeva il tipo di dati, lo scopo d'uso, l'analista dei dati, le scale comportamentali e i dati demografici, ma non la sensibilità come predittori degli intervistati che trovavano l'uso dei dati dei loro social media da parte dei ricercatori accettabile per la ricerca sociale/comportamentale.In questo modello, presentato nella Tabella 3 e nella Fig. 2, utilizziamo ricercatori accademici, dati sui social media e ricerca sociale come categorie di riferimento rispettivamente per analista di dati, tipo di dati e scopo.Abbiamo incluso un effetto casuale per l'intervistato e un altro per la fonte (Qualtrics o Mechanical Turk).La varianza tra le sorgenti era quasi zero, indicando che le differenze tra le sorgenti potevano essere quasi interamente spiegate dalle altre variabili che abbiamo valutato nel nostro modello.La tabella 3 mostra che gli intervistati accettavano più che i loro dati venissero utilizzati per la ricerca sociale che per generare interventi o ricerche sul mondo naturale.Abbiamo riscontrato modelli simili tra le variabili di controllo (fiducia, privacy digitale, comportamento sulla privacy e dati demografici) in entrambi i nostri modelli.Gli individui preoccupati per la privacy digitale (ad es. esitano a fornire informazioni quando richiesto) avevano meno probabilità di accettare l'utilizzo dei loro dati.Gli individui che generalmente si fidano delle istituzioni e dei governi hanno accettato che i loro dati venissero utilizzati da queste entità.Le persone che si sono impegnate in comportamenti più protettivi della privacy (ad esempio, rimuovendo i cookie dal proprio browser Web, cercando modi per controllare quali e-mail ricevono) erano più propensi ad accettare che i loro dati potessero essere utilizzati.Riteniamo che le informazioni su quanto una persona consideri sensibile il proprio nome utente online non fornisca informazioni statisticamente significative su quanto ritengono accettabile una combinazione di dati, utente e scopo.I nostri risultati suggeriscono che le persone generalmente accettano che i ricercatori accademici utilizzino i dati dei social media e che i nomi delle schermate online sono meno sensibili di molti altri tipi di dati, inclusi identificatori individuali come numeri di patente e anamnesi, ma più sensibili di altezza, peso, razza e religione.Gli individui hanno indicato che i ricercatori accademici che utilizzavano i loro dati erano accettabili in più scenari rispetto ai giornalisti o alle società di social media che lo facevano.Allo stesso modo, il lavoro precedente sul fandom di Internet indicava una maggiore fiducia per i ricercatori che per le aziende private e i giornalisti32.Un'implicazione dei nostri risultati è che i ricercatori sui social media possono sfruttare le competenze e le pratiche dei ricercatori che utilizzano altri tipi di dati sensibili o moderatamente sensibili come le cartelle cliniche.Tuttavia, una potenziale limitazione del nostro studio e di Gilbert's11 è che i nostri strumenti di indagine hanno comunicato chiaramente l'utente, i dati e lo scopo.In tal modo, gli strumenti potrebbero essere stati sufficientemente specifici da consentire agli utenti di trovare questi scenari accettabili;se avessimo chiesto più in generale ai ricercatori sui social media che utilizzavano i loro dati, potrebbero non essere stati così accettati.Di seguito affrontiamo i risultati sulla sensibilità comparativa dei dati dei social media e le relazioni tra sensibilità e utilizzo accettabile dei dati.Il lavoro precedente sull'uso dei dati dei social media nella ricerca11,25 esamina i dati dei social media da soli piuttosto che nel contesto di informazioni personali private e/o sensibili.Il nostro strumento di indagine ci ha permesso di confrontare i rapporti degli individui sulla sensibilità di diversi tipi di dati in modo da poter capire come i dati dei social media siano simili (o dissimili da) altri dati spesso utilizzati nella ricerca.Osservando un tipo specifico di dati sui social media - il proprio nome utente online o la "chiave" per accedere ai propri dati sui social media, simile al proprio nome "offline", gli intervistati suggeriscono che il loro nome visualizzato online è più sensibile delle caratteristiche demografiche (ad es. la propria razza) e meno sensibili rispetto ad altri dati di identificazione personale che possono essere collegati a un individuo e al suo comportamento (es. numero di patente).Gli intervistati hanno anche riscontrato che gli identificatori online sono meno sensibili della salute mentale e delle cartelle cliniche.C'era anche una maggiore variazione nelle percezioni degli intervistati sulla sensibilità del loro nome visualizzato online rispetto ad altri tipi di dati come impronte digitali o anamnesi che potrebbero anche fornire l'accesso ai dati sui loro comportamenti.Questa variabilità può indicare incertezza tra gli individui o una vera variazione nel nostro campione e il lavoro futuro potrebbe tentare di verificare questa distribuzione e le sue cause.Per valutare la percezione dell'uso accettabile dei dati dei social media rispetto ad altri tipi di dati sensibili ampiamente utilizzati, abbiamo confrontato i dati dei social media con esempi come i dati del telefono cellulare e i file degli elettori che comportano vari rischi di reidentificazione.Rispetto a questi altri tipi di dati sensibili, gli intervistati si sentivano più a proprio agio con l'utilizzo dei dati dei social media e meno a proprio agio con l'utilizzo dei dati sulla posizione del proprio cellulare.Questa scoperta risuona con il lavoro precedente sui dati sulla posizione, sostenendo che le persone si aspettano la privacy anche in pubblico28 e questa aspettativa si estende ai dati raccolti automaticamente come la posizione catturata dai telefoni cellulari e dai social media.Relativamente ai dati dei social media, gli intervistati erano anche meno propensi a concordare sul fatto che sia accettabile utilizzare il file del loro elettore o i filmati delle loro telecamere di sicurezza.Sebbene i file degli elettori siano ampiamente utilizzati nella ricerca in scienze politiche33,34, i ricercatori hanno compiuto sforzi importanti per proteggere le aspettative sulla privacy dei condivisioni di dati, comprese le tecniche di mitigazione del rischio di divulgazione come l'aggregazione per evitare di rivelare informazioni di identificazione personale.Abbiamo scoperto che la sensibilità non è un buon predittore del fatto che le persone ritenessero accettabile per i ricercatori utilizzare i dati dei social media.Questo risultato è alquanto inaspettato data la letteratura precedente che suggeriva che la sensibilità media un uso accettabile16.Una possibile spiegazione è che lo "screen name online" non è un utile esempio di dati sui social media su cui chiedere informazioni.È possibile, ad esempio, che gli intervistati non capiscano a quanti dati è possibile accedere quando è noto il proprio nickname online (ad esempio, la cronologia dei tweet o la cronologia dei commenti su Reddit, che possono rivelare altri tipi di dati sensibili come religione, salute mentale stato, ecc.).Un'altra spiegazione è che per altri tipi di dati, la sensibilità può prevedere un uso accettabile, ma per i dati dei social media, l'uso accettabile è una funzione dell'analista dei dati, del tipo di dati e dello scopo dell'uso dei dati11.Per quanto riguarda l'analista di dati, il tipo e lo scopo d'uso, i nostri risultati fanno eco ai risultati precedenti che indicano che gli utenti accettano che i loro dati sui social media vengano utilizzati nella ricerca quando viene loro detto chi li utilizzerà e per quale scopo8,11.I nostri intervistati erano generalmente più disposti ad accettare che i ricercatori utilizzassero i loro dati rispetto alle società di social media o ai giornalisti (vedi Tabella 2).Ci aspettiamo che questo modello sia valido perché gli utenti sono in grado di immaginare meglio i benefici della ricerca.Data la crescente sfiducia nei confronti dei giornalisti negli Stati Uniti35,36, non sorprende che i nostri intervistati non abbiano accolto con favore i giornalisti che utilizzano i loro dati.In linea con la ricerca precedente sull'uso dei dati sensibili nella ricerca sanitaria27 e nel marketing16, i nostri intervistati si sentivano più a loro agio nel condividere i dati con i ricercatori che cercavano di produrre benefici sociali e comprensione che con le aziende a scopo di lucro che utilizzavano i loro dati per scopi simili.Alla luce di questi risultati, piuttosto che guardare a dati altrettanto sensibili per una guida sulle pratiche di rispetto per le persone con i dati dei social media, la nostra ricerca ci indica i dati i cui analisti hanno chiaramente comunicato i vantaggi dei loro scopi di utilizzo e coltivato la fiducia tra i potenziali condivisi.In effetti, sia per la nostra indagine che per quella di Gilbert et al.11, articolare esplicitamente gli scenari di utilizzo dei dati può guidare gran parte dell'accettazione espressa dagli individui.Nei nostri risultati, gli uomini erano più propensi a riferire che i ricercatori potevano utilizzare i loro dati senza un'autorizzazione esplicita e che la maggior parte degli usi dei loro dati erano accettabili.Ricerche precedenti correlate sulla disponibilità degli individui a condividere i dati con gli esperti di marketing hanno rilevato che la sensibilità era una funzione dei controlli sulla privacy percepiti e del contesto culturale come i valori della mascolinità e l'orientamento a lungo termine16.L'importanza dei valori della mascolinità (ad esempio, "È più importante per gli uomini avere una carriera professionale che per le donne") nel prevedere la sensibilità può spiegare perché abbiamo osservato differenze tra uomini e altre identità di genere.Le donne e i membri delle minoranze di identità di genere affrontano maggiori rischi quando si impegnano nei social media;37,38 tali rischi possono portarli a essere più conservatori nelle loro convinzioni sulla condivisione dei dati.Come sottolineano Mikal e colleghi39, dobbiamo considerare attentamente chi può rinunciare all'uso dei social media pubblicamente ogni volta che pensiamo ai dati dei social media.Abbiamo anche scoperto che gli anziani e gli intervistati eterosessuali si oppongono all'uso dei loro dati senza esplicito consenso quando gli viene chiesto informazioni sulla ricerca in generale.In un altro studio, Dym e Fiesler32 hanno scoperto nel loro sondaggio sui dati delle comunità di fandom online - spazi a maggioranza LGBTQ - e sul loro utilizzo nella ricerca che meno del dieci percento degli intervistati ha usato i propri nomi reali nel fandom online.È possibile che gli utenti LGBTQ utilizzino strategie di protezione della privacy come pseudonimi per disconnettere i loro nomi visualizzati online dalle loro identità offline, rendendo i loro nomi visualizzati meno sensibili.È anche possibile che i membri di gruppi demografici emarginati siano più disposti a condividere i propri dati perché cercano l'inclusione o perché considerano inutili gli sforzi per evitare la sorveglianza.Benjamin40 fornisce una discussione approfondita degli impatti differenziali della sorveglianza tra i gruppi razziali, per esempio.I nostri risultati hanno due implicazioni per realizzare il rispetto per le persone nella ricerca sui social media.In primo luogo, quando possibile, i ricercatori dovrebbero ottenere il consenso informato dagli utenti dei social media per utilizzare i loro dati nella ricerca.Tuttavia, se i ricercatori utilizzano i dati solo da quelle persone che hanno fornito un'autorizzazione esplicita e che generalmente accettano che i loro dati vengano utilizzati nella ricerca, i loro dati probabilmente distorceranno maschi, più giovani, più istruiti e meno etero.Sebbene la distorsione nei dati non possa essere eliminata e non sia intrinsecamente negativa, i dati dei social media distorti dal punto di vista demografico limitano la loro utilità per gli studi a livello di popolazione.Poiché gli individui sono generalmente più a loro agio con la ricerca a livello di popolazione che con la ricerca a livello individuale8,20, questa tensione è particolarmente importante da considerare per i ricercatori.soc.ris.ris.soc.Sci.Sono.Sci.soc.Sci.ris.ris.soc.soc.Sci.Articolo ADS CAS Google Scholarris.soc.Sci.