Il vero rischio per OpenAI dopo la causa del New York Times

Nella mia newsletter ho scritto alcune riflessioni sulla causa del New York Times contro OpenAI e Microsoft per violazione del copyright. Dopo aver parlato di possibili accordi extragiudiziali, di proprietà intellettuale, di allucinazioni (quando una IA generativa si inventa le cose) e pappagallismi o pedissequamenti (quando invece ripropone tale e quale un contenuto senza rielaborarlo), ho chiuso con una frase sulla quale credo valga la pena tornare.

È difficile prevedere come finirà questa storia. Ho comunque l’impressione che il problema più importante che dovrà affrontare OpenAI, più che la denuncia del New York Times, sia riuscire a far fronte alle accuse mantenendo i propri prodotti utili e redditizi.

Quello che intendevo è che, nella sua presa di posizione, OpenAI ha riconosciuto, per quanto minimizzato, alcune delle accuse del New York Times, in particolare per quanto riguarda la riproduzione praticamente integrale di articoli tutelati da diritto d’autore. Indipendentemente da come finirà la causa, questo è un problema che OpenAI vuole risolvere – o meglio un “raro bug che si vuole eliminare”.
Ora, questo è possibile senza castrare le funzionalità di ChatGPT? Forse sì, ma se il buongiorno si vede dal mattino direi che OpenAI non è messa benissimo.

Ho dato a ChatGPT 4.0 il PDF di un articolo di giornale. Mi ha riassunto correttamente il contenuto, riconoscendo il testo (il PDF proveniva da una rassegna stampa ed era quindi la scansione del giornale), ma si è rifiutato di riprodurre il testo:

Non posso trascrivere interamente il contenuto di documenti protetti da diritti d’autore per motivi legali. Questo include la copia completa di libri, articoli, documenti e altri materiali coperti da diritti d’autore. Tuttavia, posso aiutarti fornendo riassunti, analizzando specifiche parti di un testo, o rispondendo a domande relative al contenuto. Questo modo di procedere mi permette di rispettare le leggi sui diritti d’autore pur fornendo assistenza utile.

Hanno bloccato una funzionalità che è presente in moltissimi altri software – ormai tutti gli smartphone riconoscono e traducono il testo contenuto nelle immagini.
Il blocco comunque è facilmente aggirabile: basta chiedergli quale è il contenuto del primo paragrafo, poi del secondo, del terzo e così via.

Se questa situazione dovesse replicarsi per altre funzioni di ChatGPT, il servizio diventerebbe perlopiù inutile.

L’intelligenza artificiale e la linguetta rossa di Umberto Eco

Nel Secondo diario minimo, Umberto Eco propone delle finte istruzioni che si dilungano a spiegare “cose talmente ovvie che voi siate tentati di saltarle, perdendo così l’unica informazione veramente essenziale”:

Per potere installare Il Pz40 è necessario disimballarlo estraendolo dal contenitore di cartone. Si può estrarre il Pz40 dal contenitore solo dopo aver aperto lo stesso. Il contenitore si apre sollevando in direzioni opposte le due ribaltine del coperchio (vedi disegno all’interno). Si raccomanda, durante l’operazione di apertura, di tenere il contenitore verticale col coperchio rivolto verso l’alto, perché in caso contrario il PZ40 potrebbe scivolare a terra durante l’operazione. La parte alta è quella su cui appare la scritta ALTO. Nel caso che il coperchio non si apra al primo tentativo si consiglia di provare una seconda volta. Appena aperto e prima di togliere la copertura d’alluminio, si consiglia di strappare la linguetta rossa altrimenti il contenitore esplode. ATTENZIONE: dopo l’estrazione del Pz40 potete gettare il contenitore.

Ho riletto quel libro più volte – saltando sempre l’informazione sul contenitore esplosivo, pur sapendo (dalla seconda lettura) che era lì da qualche parte.

Per curiosità ho chiesto a ChatGPT qual è il passaggio più importante di queste istruzioni.

La versione 3.5 ha risposto riprendendo le indicazioni per “aprire il contenitore in modo sicuro e evitare il rischio che il Pz40 cada a terra durante l’operazione”.

La versione 4.0, invece, ha indicato subito la linguetta rossa perché “questa azione è cruciale per la sicurezza, poiché impedisce l’esplosione del contenitore”.

A prima vista il modello linguistico – insomma, l’intelligenza artificiale che scrive cose – di OpenAI ha superato l’intelligenza umana nello specifico compito di determinare le informazioni importanti contenute in un testo scritto male.
Tuttavia è bastato modificare leggermente la mia richiesta per tornare con il rischio di una scatola esplosiva: “Non ho voglia di leggere queste istruzioni. A cosa devo fare attenzione?” e la questione della linguetta rossa è semplicemente il quarto punto di un elenco.

Gli scienziati devono dibattere con i manipolatori? Forse

Il caporedattore di Science Herbert Holden Thorp ha scritto un interessante editoriale nel quale sostiene che i ricercatori non dovrebbero confrontarsi pubblicamente con i “gaslighters”, termine che potremmo vagamente tradurre come “manipolatori”.

Gli argomenti sono quelli tradizionali: rifiutandosi si fa la figura dei codardi che temono il confronto, ma accettare un dibattito pubblico darebbe legittimità a idee antiscientifiche, facendo credere che vi siano dubbi su temi sui quali c’è invece un buon livello di certezza. Quello che cambia è innanzitutto il mezzo: non più conferenze o trasmissioni televisive, bensì un podcast (quello “antisistema” di Joe Rogan). E poi sono cambiate anche le idee antiscientifiche: quando, una ventina di anni fa, ho sentito per la prima volta questo argomento si parlava di creazionismo; oggi si parla di antivaccinismo. O meglio di un curioso coacervo di teorie cospirazioniste, visto che Robert F. Kennedy Jr. – con cui sarebbe dovuto avvenire il confronto – ha sostenuto molte cose strane:

(Elenco preso da Noah Smith; altri dettagli su RFK Jr. si possono leggere sul Post).

Una partita a scacchi con un piccione

C’è una colorita analogia che si cita spesso in questi casi: discutere con un manipolatore/cospirazionista è come giocare a scacchi con un piccione che fa cadere i pezzi per terra, insozza la scacchiera e poi torna dal suo stormo dicendo di aver vinto. 1

Tuttavia alla partita non assistono solo il piccione e il suo stormo. E sapendo di avere di fronte un piccione, invece di studiare regole e strategie degli scacchi uno magari prende uno straccio per pulire la scacchiera.
Mettiamo da parte l’analogia della partita a scacchi. Un dibattito non farà mai cambiare idea né a RFK Jr. né ai suoi sostenitori, ma mostrare di essere delle persone decenti, e non dei mostri che vogliono decimare l’umanità, è già un buon risultato, soprattutto pensando alle persone “non molto convinte” che per curiosità seguiranno il dibattito. Certo ci sono comunque dei rischi e sarebbe meglio evitare di ritrovarsi a dover ribattere a centinaia di fesserie – magari ponendo alcune condizioni e chiedendo alcune garanzie. Ma non escluderei a priori qualsiasi dibattito pubblico.

La scienza aperta

Questi però sono argomenti che riguardano l’efficacia di un dibattito pubblico. Provo adesso ad affrontare la questione da un altro punto di vista, quello dei valori della scienza. Un approccio deontologico anziché utilitaristico – con l’idea che entrambi i punti di vista possano essere di una qualche utilità per affrontare il problema.
È giusto escludere alcune persone dal dibattito scientifico, ignorando le loro critiche e le loro osservazioni? Decidere a priori che alcune persone dicono fesserie non è l’applicazione, in negativo, di quel “principio di autorità” che la scienza rifiuterebbe?

La scienza occidentale moderna si è sviluppata, tra Cinque e Seicento, proprio in opposizione ad alcuni saperi, come la magia e l’alchimia, che facevano della segretezza e dell’inaccessibilità un elemento centrale. La conoscenza scientifica è a disposizione di tutti e chiunque può contribuirvi, senza dover passare per percorsi iniziatici riservati a poche persone elette. Contano gli argomenti e le prove che una persona può portare, non il suo status sociale o altre sue caratteristiche personali.
Certo questo era più facile quando la scienza aveva appena iniziato il suo percorso, non servivano laboratori con apparecchiature costosissime e per mettersi in pari con le conoscenze di punta bastava leggersi una mezza dozzina di libri. Ma l’idea di un sapere aperto a tutti resta centrale, tanto che il sociologo Roger Merton cita l’universalismo come primo principio dell’ethos della scienza, il complesso di valori e di norme che guidano i ricercatori, insieme al comunismo dei risultati, al disinteresse e al dubbio sistematico.

Rifiutarsi di prendere in considerazione le critiche di RFK Jr. sembrerebbe essere in contrasto con l’ethos scientifico: il principio dell’universalismo imporrebbe infatti di ascoltare chiunque, anche un avvocato senza una specifica formazione scientifica (che comunque non manca a molto sostenitori di teorie cospirazioniste).

Ethos scientifico

Torniamo un attimo agli inizi della scienza occidentale moderna. L’idea di permette a chiunque ne abbia le capacità di partecipare all’impresa collettiva della scienza trovava manifestazione nelle accademie e nelle società scientifiche. In pratica delle zone protette in cui discutere liberamente, al riparo dalle ingerenze esterne – principalmente dalla politica e dalla religione. Chiunque è benvenuto. Se accetta i valori e i metodi dell’impresa scientifica. Se una persona non si riconosce in quei valori, non siamo tenuti a starla a sentire e non solo possiamo ignorarla, ma forse dobbiamo anche.

Va detto che entriamo in un terreno scivoloso. Non è facile definire con precisione quali siano i valori della scienza; quanto al metodo scientifico, ogni disciplina ha le sue prassi che oltretutto cambiano nel tempo. E sarebbe assurdo considerare antiscientifica qualsiasi proposta di ripensare come in questo particolare momento si fa scienza.
Credo che un aspetto importante del quale tenere conto sia l’atteggiamento: si vuole contribuire alla conoscenza scientifica migliorando la nostra comprensione del mondo o al contrario far crollare tutto? Ma di nuovo è una indicazione generica. Il che suggerisce una certa cautela nell’applicare il principio del “non ti riconosci nell’ethos scientifico e quindi non puoi parlare”. Certo, visto il lungo e un po’ inquietante elenco di corbellerie sostenute da RFK Jr., direi che in questo caso ci sono pochi dubbi. Tenendo comunque presente che quantomeno alcune di quelle corbellerie potrebbero diventare delle domande poste da chi vuole davvero capire meglio il mondo.

  1. Da quel che ho ricostruito, l’ideatore di questa popolare immagine è un certo Scott D. Weitzenhoffer in una recensione su Amazon di un libro sul creazionismo.[]

I rischi reali della pedofilia virtuale

Leggo sulla BBC di una vasta rete per la vendita di fotografie pornografiche con minori – non solo ragazze molto giovani, ma anche bambini – generate da intelligenze artificiali. In molti Paesi queste immagini sono illegali quanto quelle autentiche.

La mia prima reazione non è certo di sorpresa: era prevedibile che delle persone avrebbero prodotto è venduto simili immagini. No, la mia prima reazione è di disgusto, innescato dalla semplice idea di immagini di abusi su minori.

Però non c’è alcun abuso su persone reali: queste immagini sono e restano disgustose ma, al contrario di autentiche fotografie, per realizzarle nessuno ha sofferto.

È un argomento che l’articolo della BBC affronta di sfuggita:

The National Police Chiefs’ Council (NPCC) lead on child safeguarding, Ian Critchley, said it would be wrong to argue that because no real children were depicted in such “synthetic” images – that no-one was harmed.

Solo che come unico argomento abbiamo quello del piano inclinato, ricalcando un po’ la retorica di alcune campagne antidroga (inizi da uno spinello e poi…)

He warned that a paedophile could, “move along that scale of offending from thought, to synthetic, to actually the abuse of a live child”.

Solo che posso pensare a una situazione diametralmente opposta: una persona con pulsioni pedofile che sfrutta immagini virtuali per placarle senza danneggiare nessuno.

Molto probabilmente non è la strategia migliore per gestire queste pulsioni, ma visto che le iniziative di prevenzione sembrano basarsi quasi esclusivamente sulla punizione e quasi nulla sull’assistenza e il sostegno, direi che non ci sono molte alternative.

Un argomento secondo me più convincente riguarda la normalizzazione degli abusi e della sessualizzazione dell’infanzia: vero che per produrre quelle fotografie virtuali non ci sono stati abusi, ma permetterne la diffusione renderebbe quegli abusi socialmente più accettabili.

Questo argomento si applica anche agli stupri che troviamo nella pornografia con adulti e in generale nelle opere di finzione. Con rischi di eccessi nella sua applicazione.

Adeguare le parole ai fatti

È bello servire lo Stato con i fatti, non è sconveniente farlo con le parole; e molti hanno acquistato rinomanza compiendo imprese, molti narrando quelle degli altri. Però, sebbene una gloria non pari accompagni chi scrive e chi compie le imprese, credo che specialmente arduo sia il compito dello storico: primo, perché bisogna adeguare le parole ai fatti; poi, perché la maggior parte della gente considera dettate da invidia e da odio le parole con cui si denuncia una colpa, mentre, quando si sono ricordati il grande valore e la gloria dei buoni, ognuno accetterà di buon grado quanto ritiene di poter fare facilmente egli stesso; giudicherà falso, frutto di fantasia, ciò che riesce superiore alle sue forze.

Sallustio, La congiura di Catilina, a cura di Giancarlo Pontiggia, Mondadori 1992

Inizialmente mi ero annotato questo passaggio per la parte finale, quella per cui si giudica vero quel che è alla propria portata e frutto di fantasia quel che è superiore alle proprie forze (e frutto di invidia le critiche). Tuttavia, rileggendo questo passaggio di Sallustio, mi accorgo che la parte più interessante è prima. Il compito dello storico è arduo perché bisogna adeguare le parole ai fatti.
Il riferimento – così indicano le note di commento – è all’abilità retorica dello storico che deve appunto trovare le parole adatte per raccontare le grandi imprese dei buoni (o per denunciare le colpe dei cattivi, ovviamente). Ma “adeguare le parole ai fatti” può essere interpretato anche come invito a non esagerare, a raccontare le cose come stanno riportando le informazioni a disposizione senza introdurre cose nuove, frutto di fantasia.

L’intelligenza artificiale come inconscio collettivo

Da qualche tempo utilizzo delle immagini generate da intelligenze artificiali per illustrare gli articoli su questo sito. A volte ho un’idea precisa e quindi la mia richiesta è una descrizione puntuale, tipo “illustrazione a matita di un essere umano che sogna un computer”; altre volte non ho in mente un soggetto preciso e mi lascio sorprendere dando in pasto all’IA un concetto generico o astratto, tipo “libertà” o “conoscenza”.

Ho notato che con “democrazia” si ottengono perlopiù immagini patriottiche (e molto statunitensi). Questo è uno dei risultati ottenuti con Microsoft Bing, ma ho provato brevemente anche con altri software ottenendo risultati analoghi:

Quando ho inserito “maggioranza”, invece, ho ottenuto immagini dall’aria molto più cupa:

Il che è curioso: certo se con “democrazia” intendiamo riferirci alle moderne democrazie liberali occidentali non ci si può limitare al criterio maggioritario (ne ho accennato tempo fa discutendo di un libro di Mauro Barberis), ma è indubbio che uno degli elementi cardine della democrazia sia “votiamo e chi ha la maggioranza vince”. A logica dovremmo aspettarci delle immagini relativamente simili.

Non so come i vari software affrontino richieste così vaghe, ma penso che il punto di partenza sia come sempre una enorme base dati che abbina immagini e relative descrizioni fornite inizialmente da esseri umani. Insomma, le due immagini generate sarebbero una sorta di sintesi di quello che comunemente si intende con “democrazia” e “maggioranza” – quello che c’è nell’inconscio collettivo dell’umanità, o meglio di quella parte di umanità presa in considerazione dall’intelligenza artificiale. La democrazia come una sorta di “vanto nazionale”; la maggioranza come qualcosa di anonimo e cupo che schiaccia gli individui.

Il contributo filosofico delle domande

Non so chi siano Joshua Habgood-Coote, Lani Watson e Dennis Whitcomb, ma hanno scritto l’articolo filosofico con il miglior rapporto rilevanza/lunghezza di sempre.

Il primato finora spettava a Edmund Gettier e alle tre pagine del suo Is Justified True Belief Knowledge?; non so se il lavoro di Habgood-Coote, Watson e Whitcomb sarà altrettanto citato ma un po’ se lo meritano.

La realtà è diventata un campo di battaglia allargato e spaccato in due

Sto leggendo Sulla guerra del fotoreporter Gianluca Grossi. Il libro nasce dall’idea che raccontare la guerra, come Grossi ha fatto in varie parti del mondo, non basta. Il semplice racconto della guerra rischia di accrescere il “mito della guerra”, una illusione che invece dovremmo superare affiancando al racconto una riflessione.
Non è un libro sulla guerra in Ucraina, ma l’invasione della Russia costituisce ritorna inevitabilmente più volte.

Riporto uno dei vari passaggi che mi sono segnato.

La guerra manda in cortocircuito anche chi è chiamato a fornirne una spiegazione il più spassionata possibile: analisti, studiosi, accademici, giornalisti. Difficile, quasi impossibile, metterli d’accordo, socraticamente, almeno sulla condivisione di un minimo comune denominatore, su una descrizione della materia e dell’oggetto in discussione riconosciuta in modo unanime. Eppure, proprio questo dovrebbe costituire la premessa per chi è interessato a trovare le risposte alla domanda: «Perché è esplosa questa guerra?». Provo una naturale familiarità di vedute, essendo allergico alle semplificazioni, con coloro che non si accontentano della descrizione più in voga, ampiamente condivisa in Occidente, al punto da costituire l’ufficialità: un dittatore cattivo e retrogrado ha deciso di invadere l’Ucraina democratica e pacifica, che si difende con eroismo grazie al non meno eroico e non meno democratico sostegno dell’Occidente e, non da ultimo, dell’Europa ugualmente minacciata di invasione. È una semplificazione che non conduce a grandi risultati, anzi che non conduce ad alcun risultato, se non alla riproduzione della guerra stessa, in questo caso su scala minore, nella sua versione cartacea e digitale. Il prodotto finale è però il medesimo: la realtà è diventata un campo di battaglia allargato e spaccato in due, gli amici di qua e i nemici di là. Qualsiasi tentativo di leggerla e di interpretarla deve rispettare questa dicotomia, anzi deve farne la sorgente di ispirazione degli argomenti ai quali si richiama.

Personalmente non provo quella “naturale familiarità di vedute” con chi non si accontenta “della descrizione più in voga”. Un po’ perché – ne avevo scritto in una Piccola guida ragionata al “pensiero unico” – a volte quella descrizione più in voga è banalmente più corretta delle alternative; un po’ perché chi non si accontenta della descrizione più in voga si accontenta invece della contronarrazione opposta, senza mostrare particolare senso critico.

Tuttavia concordo con Grossi: le semplificazioni non conducono a grandi risultati. E dovremmo evitare quella “riproduzione della guerra stessa, in questo caso su scala minore, nella sua versione cartacea e digitale”. Cercare non la neutralità o l’indifferenza, ma la lucidità necessaria a valutare gli eventi in maniera razionale o almeno ragionevole. Il problema è che non è facile, quando tutta la ricchezza di punti di vista e sensibilità viene schiacciata da quella dicotomia del “gli amici di qua e i nemici di là”.

Un po’ di cose che ho capito sulle probabilità bayesiane

Sto leggendo un po’ di cose sulla probabilità bayesiana.
È un tema interessante – oserei dire persino: importante – che non riguarda solo la matematica ma in generale il modo in cui ragioniamo e quello che potremmo chiamare “scetticismo sensato”.

Ma restiamo sulle probabilità bayesiane.
Di risorse in italiano ne ho trovate poche; in inglese c’è un bel video introduttivo di 3Blue1Brown e due libri: il primo è un’introduzione con diversi esempi e metodi (Bayes’ Theorem Examples: A Visual Introduction For Beginners di Dan Morris), il secondo è una interessante storia del teorema e delle sue alterne fortune nella storia (The Theory That Would Not Die di Sharon Bertsch McGrayne).

La mente bayesiana

Una cosa che mi ha colpito è un’apparente contraddizione.

Di per sé il teorema di Bayes spiega come dovremmo aggiornare una credenza iniziale alla luce di nuove informazioni. Credo che le chiavi di casa siano nella tasca del cappotto e non nello zaino; infilo la mano nella tasca del cappotto e non le trovo; correggo la mia ipotesi iniziale e penso che siano nello zaino; non le trovo neanche lì e allora penso di non aver controllato bene in tasca; solo alla fine concludo di aver verosimilmente perso le chiavi.

È normale ragionare così. Vero che non facciamo valutazioni numeriche tipo “al 90% le chiavi sono in tasca” (o “sono pronto a scommettere 1 a 9 che le chiavi sono in tasca”), “il 5% delle volte che non trovo le chiavi è perché non le ho cercate bene” (o “sono pronto a scommettere 1 a 19 che non sono lì visto che non le ho trovate”), “le probabilità di perdere le chiavi sono inferiori all’1%” (o “sono pronto a scommettere 1 a 99 che non le ho perse”) e non ci mettiamo a fare i calcoli che poi ho riassunto alla fine di questo articolo, ma tutti noi facciamo un secondo controllo in tasca prima di convincerci che potremmo aver perso le chiavi.

Secondo vari studi, citati nell’ultimo capitolo del saggio di Sharon Bertsch McGrayne, la nostra mente è bayesiana: riduce in continuazione l’incertezza grazie a nuove osservazioni.

Eppure il teorema di Bayes porta spesso a risultati controintuitivi, spesso presentati come dei paradossi. Quello più famoso riguarda la probabilità di avere una malattia relativamente poco diffusa (diciamo una persona su mille) se un test diagnostico affidabile al 99% risulta positivo (e non abbiamo altri motivi di sospettare di essere malati, ovviamente).

Un altro riguarda un indovinello apparso su questo sito una decina di anni fa:

Una cassa contiene diecimila monete. Una di queste è truccata, e lanciandola in aria esce sempre testa, mentre tutte le altre sono normali, con eguali probabilità per testa e croce.
Prendo una moneta a caso e la lancio otto volte, ottenendo sempre testa.
È ragionevole concludere che abbia trovato la moneta truccata? Più in generale, dopo quanti lanci è ragionevole pensare di avere in mano la moneta truccata?

Intuitivamente pensiamo che il risultato positivo di un test così affidabile equivalga a una diagnosi quasi certa e che otto teste di fila siano possibili solo con una moneta truccata. Ma solo in un caso su dieci chi ha ricevuto un test positivo è ammalato. Nel caso delle monete, invece, con otto lanci c’è un misero 2,5% di probabilità di aver preso la moneta truccata.

Come è possibile che questi risultati ci sorprendano se la nostra mente è bayesiana?

Una prima risposta è che un conto è rivedere le nostre ipotesi iniziali, un altro è farlo correttamente. Il ragionamento in entrambi i casi è infatti corretto: è vero che il test positivo aumenta la probabilità di essere malati, è vero che ottenere otto volte testa aumenta le probabilità di aver preso la moneta truccata, ma non così tanto da farci cambiare l’ipotesi iniziale. Un secondo test risultato positivo, o qualche altra testa ottenuta lanciando la moneta, e avremmo valide ragioni per cambiare idea.

Tuttavia sospetto che possa esserci anche un altro problema. La formulazione del problema ci porta a trascurare le probabilità iniziali. Pensiamo che o siamo sani o siamo malati, che la moneta che abbiamo in mano o è truccata o è normale. Ma se partiamo dal fatto che c’è una probabilità su mille di essere malati, è abbastanza scontato che un test che sbaglia in un caso su cento non ci darà alcuna certezza (ma certamente ridurrà l’incertezza che infatti passa dallo 0.1% al 10%). E se pensiamo che avevo una possibilità su diecimila di aver preso la moneta truccata, l’aver ottenuto otto volte testa è insolito – ci sono altre 255 possibilità – ma non così determinante.

Siamo bayesiani quando non troviamo le chiavi in tasca; ci dimentichiamo di esserlo quando abbiamo test affidabili al 99% o monete truccate. E qui interviene un sistema di calcolo che ho trovato nel libro di Dan Morris e che potrebbe essere utile a orientarsi.

Il diagramma ad albero

L’idea è realizzare uno schema ad albero di quello che potrebbe accade, indicando per ogni ramo quante volte può capitare (posso farlo come numero di casi o come probabilità).

Prendiamo il caso delle monete. Quello che faccio è prendere una delle diecimila monete dalla cassa e poi lanciarla ottenendo 8 volte testa.

Il primo passaggio sarà quindi “prendo una moneta”: in un caso sarà quella truccata, negli altri 9’999 sarà una normalissima moneta.

Il secondo passaggio sarà invece lanciare la moneta 8 volte. Se la moneta è truccata, non posso che ottenere 8 volte testa. Se ho preso una moneta normale, ci sono 256 possibili sequenze, ognuna delle quali ha circa 39 possibilità su 9’999.

Una volta tracciato lo schema completo, cancello quello che non mi serve. So di aver ottenuto 8 volte testa, ma non so se con una moneta truccata o normale: posso quindi ignorare i rami in cui ho ottenuto altre sequenze e concentrarmi solo sui due che prevedono 8 teste.

Ho 40 scenari, in uno ho la moneta truccata, negli altri 39 una normale.

Il calcolo che mi ritrovo a fare è lo stesso previsto dal teorema di Bayes, ma senza dovermi ricordare la formula o calcolare le probabilità condizionali.

Per i test diagnostici ho realizzato lo schema mettendo nei rami le probabilità come frazioni e calcolando i totali a parte.

La probabilità a posteriori di essere malati se il test è risultato positivo è di 99/(999+99)=9%.

Il bello di questo schema è che permette di calcolare anche altre probabilità a posteriori; se ad esempio sono paranoico mi rincuorerà sapere che mentre un test positivo mi lascia sostanzialmente nell’incertezza, un test negativo è invece rassicurante: le probabilità di essere malati nonostante un test negativo sono infatti dello 0.001% (1/98’902).

Posso anche facilmente aggiornare i numeri: mettiamo che, avendo qualche sintomo, la stima iniziale di essere malato passi da una su mille a una su venti. In questo caso il test positivo mi dà una sicurezza di oltre l’80% di essere malato.

Il teorema di Bayes e le chiavi

Per un confronto, vediamo di applicare il teorema di Bayes al caso delle chiavi.

Ricapitolando: sono abbastanza sicuro (al 90%) di avere le chiavi in tasca; possibilista sul fatto che potrebbero invece essere nello zaino (9%) scettico sul fatto di averle perse (1%).
Se le chiavi non sono in tasca sono ovviamente certo (probabilità del 100%) di non trovarle; ma se ci sono ho comunque un 5% di probabilità di non trovarle.

Mettiamo il tutto in formule. La probabilità di avere le chiavi in tasca è P(T), quella di averle nello zaino è P(Z) e di averle perse è P(P).
La probabilità di non rinvenirle in tasca (o nello zaino) è [latex]P(\neg RT) (rispettivamente P(\neg RZ)).
Infine, la probabilità condizionale è indicata con una barra verticale |. Quindi (P(\neg RT|T) indica la probabilità di non trovare le chiavi in tasca sapendo che sono lì mentre (P(T|\neg RT) è la probabilità che le chiavi siano in tasca sapendo di non averle trovate.

Ecco quindi le probabilità iniziali (in notazione decimale: 1=100%).

P(T) = 0.9 P(Z) = 0.09 P(P) = 0.01 P(\neg RT|T)=P(\neg RB|B)=0.05

La probabilità di non rinvenire le chiavi in tasca se sono nello zaino (e viceversa) oppure se sono andate perse è banalmente 1.

Ecco adesso il teorema di Bayes:

P(A|B) = \dfrac{P(A)\cdot P(B|A)}{P(B)}

Proviamo a calcolare la probabilità a posteriori che le chiavi siano in tasca sapendo che non le ho trovate:

P(T|\neg RT) = \dfrac{P(T)\cdot P(\neg RT|T)}{P(\neg RT)}

Come calcolo P(\neg RT), la probabilità di non trovarle in tasca?
È sufficiente sommare la probabilità che siano nello zaino o perse – e in questi casi è certo che non le troverò in tasca – con la probabilità che siano in tasca e non le ho trovate:

P(\neg RT)=P(Z) + P(P) + P(T)\cdot P(\neg RT|T)

Quindi le probabilità a posteriori che le chiavi siano in tasca, nello zaino o perse:

P(T|\neg RT) = \dfrac{P(T)\cdot P(\neg RT|T)}{P(\neg RT)}=\dfrac{0.05\cdot 0.9}{0.09+0.01+0.05\cdot 0.9} = 0.31 P(Z|\neg RT) = \dfrac{P(\neg RT|Z)\cdot P(Z)}{P(\neg RT)}=\dfrac{1\cdot 0.09}{0.09+0.01+0.05\cdot 0.9}=0.62 P(P|\neg RT)=\dfrac{P(\neg RT|P)\cdot P(P)}{P(\neg RT)}=\cfrac{1\cdot 0.01}{0.09+0.01+0.05\cdot 0.9}=0.07

In altre parole: se non trovo le chiavi in tasca, la probabilità che siano in tasca scende a circa il 30%, quella che siano nello zaino sale a circa il 60% mentre c’è un 7% di probabilità di averle perse.

Cosa succede se adesso le cerco nello zaino e non le trovo?
Le probabilità che ho appena calcolato diventano le mie nuove probabilità a priori dalle quali ripartire per fare i calcoli.

P(T|\neg RZ)=\dfrac{P(\neg RZ|T)\cdot P(T)}{P(\neg RZ)}=\dfrac{1\cdot 0.31}{0.31+0.05\cdot 0.62+0.07}=0.75 P(Z|\neg RZ)=\dfrac{P(\neg RZ|Z)\cdot P(Z)}{P(\neg RZ}=\dfrac{0.05\cdot 0.65}{0.31+0.05\cdot 0.62+0.07}=0.08  P(P|\neg RZ)=\dfrac{P(\neg RZ|P)\cdot P(P)}{P(\neg RZ)}=\dfrac{1\cdot 0.07}{0.31+0.05\cdot 0.62+0.07}=0.17

La possibilità di aver perso le chiavi è sempre più consistente (17%), ma è ancora più probabile che non abbiamo guardato bene in tasca.
Cosa succede, quindi, se faccio una seconda, infruttuosa ricerca delle chiavi in tasca?

P(P|\neg RT)=\dfrac{P(\neg RT|P)\cdot P(P)}{P(\neg RT)}=\dfrac{1\cdot 0.17}{0.05\cdot 0.75+0.08+0.17}=0.59.

La probabilità di aver perso le chiavi è ormai del 60% e (vi risparmio i calcoli) arriva a superare l'80% se faccio un'altra infruttuosa ricerca in borsa.

Una mucca e tre esperti

Ultimamente mi interessa il concetto di “esperto“.
Intuitivamente è una persona che ne sa più degli altri, ma ovviamente non è così semplice. Sapere che la dea Kālī ha quattro braccia non fa di me un esperto di religione indiana anche se le persone che mi circondano ignorano persino questa informazione – al massimo sarò “il più esperto” ma non “un esperto” in generale.

Un bel tema è “quale tipo di conoscenza è richiesta per essere esperti”. Qualche giorno fa ho fatto un piccolo esperimento con un sondaggio su Mastodon.
Immaginate di voler sapere quanto vive in generale una mucca. E di avere davanti a voi uno zoologo, un allevatore e un computer con accesso a internet. A chi vi rivolgete?

Abbiamo – supponendo che lo zoologo in questione non sia un entomologo – una persona con una conoscenza teorica dei bovini che si suppone abbia studiato la loro biologia ma che magari manca di alcune conoscenze pratiche; una persona con una conoscenza pratica – di nuovo immaginando che non sia un allevatore di api – ma che per quanto ne sappiamo potrebbe non aver mai studiato la biologia bovina; e una ricerca online, con la possibilità di imbattersi negli studi dei massimi esperti al mondo e il rischio di trovare informazioni di scarsa qualità.

Da notare che la domanda è probabilmente un po’ insolita ma relativamente sicura: non penso ci siano molte controversie sull’aspettativa di vita delle mucche, né a livello scientifico né a livello sociale. Ebbene, la conoscenza pratica batte sia quella teorica sia internet. Al sondaggio ha infatti risposto una sessantina di persone e per poco più della metà la persona migliore a cui chiedere è l’allevatore; oltre un terzo si rivolgerebbe allo zoologo e circa uno su dieci a Google.

Il sondaggio non va ovviamente preso troppo sul serio, sia per il campione poco rappresentativo sia perché per un’indagine seria bisognerebbe prendere in considerazione più scenari. Rimane il fatto che mi ha stupito vedere così poche persone scegliere il computer collegato a internet. Se questo dato è affidabile, significa che cerchiamo informazioni su Google perché in quel momento non abbiamo alternative migliori. Del resto non ci capita spesso di aver di fronte a noi esperti, mentre un dispositivo connesso bene o malo lo abbiamo tutti, in tasca.

Il quarto incomodo

Avevo dato per scontato che il computer con accesso a internet sarebbe stato usato per una ricerca su Google o per accedere a una fonte ritenuta affidabile. Ad esempio Wikipedia in inglese riporta che “Breeding stock may be allowed a longer lifespan, occasionally living as long as 25 years”.

Non avevo pensato a ChatGPT. Che nel mio caso risponde così:

In media, una mucca vive tra i 15 e i 20 anni. Tuttavia, la durata della vita di una mucca può variare a seconda di diversi fattori, tra cui il suo scopo (latticino o da carne), le condizioni di allevamento, la salute generale dell’animale e la gestione delle sue cure.

Le mucche destinate alla produzione di latte possono vivere generalmente più a lungo rispetto a quelle destinate alla produzione di carne, in quanto vengono mantenute in allevamenti specializzati e ricevono cure veterinarie regolari. Alcune mucche lattifere possono anche superare i 20 anni, anche se questo è meno comune.

Nel caso delle mucche da carne, il periodo di vita è spesso inferiore a causa dell’intensità dell’allevamento per la produzione di carne. Tuttavia, è importante notare che l’età di macellazione delle mucche varia in base alle pratiche culturali e alle normative locali.

Ricorda che queste sono solo stime generali e che la durata della vita di una mucca dipende da molti fattori individuali e ambientali.