Skip to main content

20 Ago 2018

Lennon o McCartney? Usare la statistica per scovare l’autore

Home News Matematica & Computer

Le conferenze sono delle occasioni imperdibili per gli scienziati per potersi confrontare sul lavoro svolto nelle discipline di appartenenza ma anche momenti di condivisione dei propri interessi, al di là della professione. Così è successo che Mark Glickman, lettore in statistica presso l’Università di Harvard, e Jason Brown, professore di matematica alla Dalhousie University, abbiano iniziato a conversare del loro comune interesse per i Beatles. Tra gli argomenti preferiti dei fan vi è sicuramente l’attribuzione di alcune canzoni di cui non è ancora chiaro chi sia l’autore. Perché non chiedere una mano alla statistica per trovare una soluzione per questo mistero?

Le conferenze sono delle occasioni imperdibili per gli scienziati per potersi confrontare sul lavoro svolto nelle discipline di appartenenza ma anche momenti di condivisione dei propri interessi, al di là della professione. Così è successo che Mark Glickman, lettore in statistica presso l’Università di Harvard, e Jason Brown, professore di matematica alla Dalhousie University, abbiano iniziato a conversare del loro comune interesse per i Beatles. Tra gli argomenti preferiti dei fan vi è sicuramente l’attribuzione di alcune canzoni di cui non è ancora chiaro chi sia l’autore. Perché non chiedere una mano alla statistica per trovare una soluzione per questo mistero?

 

John o Paul, chi è l’autore di alcuni dei più famosi brani dei Fab5?
 

Ai “profani” Mark Glickman ha spiegato che per la maggior parte delle canzoni dei Beatles esiste una documentazione che dimostra l’identità dell’autore, che sia stato il ribelle John o il geniale Paul. Però, per un grande numero di altri brani, la paternità si è mostrata incerta: ad esempio non si sa chi abbia scritto “In My Life”, una traccia appartenente all’album Rubber Soul, pubblicato nel 1965 e in ventitreesima posizione nella classifica “The 500 Greatest Songs of All Time” della rivista musicale Rolling Stone. I due matematici hanno quindi pensato di poter usare tecniche prese in prestito dalla statistica per stabilire l’autore di alcuni brani non ancora attribuiti con sicurezza.

 

banner articoli sapere3

 

Stilometria e linguistica forense

 

Non è la prima volta che la matematica diviene strumento per l’individuazione dell’autore di uno scritto. La stilometria o statistica linguistica è l’applicazione del metodo statistico per l’analisi dei costrutti linguistici scritti. Lo studio della frequenza con cui sono utilizzate all’interno di un testo le unità costitutive di una lingua, ad esempio le stesse parole, possono essere un utile indizio per scoprire chi ha scritto un’opera teatrale, una lettera, un articolo o una canzone. È una disciplina applicata in ambito letterario ma anche all’interno della linguistica forense. Celebre è il caso di Unabomber: dal 1978 al 1995, Theodore John “Ted” Kaczynski causò la morte di 3 persone e il ferimento di altre 23 tramite l’invio di pacchi bomba. L’FBI, che si riferiva al terrorista con l’acronimo UNABOM (UNiversity and Airline BOMber), incontrò notevoli difficoltà nelle indagini sino a quando Kaczynski, nel 1995, inviò numerose lettere contenenti un vero e proprio un manifesto che spiegava gli obiettivi della sua attività, intitolato “La società industriale e il suo futuro”. In quel testo David Kaczynski, il fratello di Unabomber, riconobbe alcune espressioni spesso utilizzate da Ted in delle vecchie lettere da lui conservate. L’analisi linguistica fu la svolta che portò all’arresto del pericoloso criminale.

 

Come scoprire la paternità di alcuni dei brani dei Beatles

 

Glickman e Brown, con l’aiuto di Ryan Song, studente di statistica ad Harvard, hanno scomposto ogni canzone dei Beatles scritta tra il 1962 e il 1966 in cinque componenti (rappresentazioni): ciascuna di esse consisteva nella frequenza con la quale si presentava un insieme di caratteristiche musicali all’interno di ogni brano. La prima rappresentazione è la frequenza di diversi accordi solitamente suonati all’interno di un’aggregazione di accordi meno comuni, poi è stato il turno della melodia intonata dal cantante. La terza componente è stata la frequenza della transizione tra accordi, la quarta quella di coppie di note melodiche consecutive. Infine gli scienziati hanno scomposto le canzoni in “profili” di quattro note melodiche: un profilo è una sequenza di quattro note melodiche categorizzate in serie di “alti”, bassi” e “stabili”. Ad esempio, se un passaggio di quattro note melodiche presentava quattro note crescenti in termini di tono, il profilo era presentato come “alto”-“alto”-“alto”. Questa analisi ha conferito un dettaglio extra in grado di discriminare i differenti stili di composizione melodica.

 

Le impronte digitali di una canzone

 

Nel comunicato stampa ufficiale Mark Glickman ha affermato: “L’idea alla base del nostro approccio è di convertire una canzone, il cui contenuto musicale è difficile da quantificare in un modo diretto, in un set di differenti strutture di dati che sono suscettibili di stabilire una firma della canzone utilizzando un approccio quantitativo. Immaginate di scomporre un colore nei suoi componenti costitutivi, rosso, verde e blu con i rispettivi pesi. Noi stiamo facendo la stessa cosa con le canzoni dei Beatles, con più di tre componenti. In totale il nostro metodo divide le canzoni in 149 componenti costitutive“. Perché sono state usate proprio quelle 5 rappresentazioni descritte nel paragrafo precedente? Sono loro a essere le impronte digitali dei degli stili di composizione musicale, soprattutto per quanto riguarda il mondo dei Fab5: infatti è risaputo che John Lennon componesse linee melodiche piuttosto piatte, basti pensare all’attacco di “Help!”, attribuita con sicurezza a Lennon, confrontandolo con quello di “Michelle”, di Paul McCartney.

 

Applicare la statistica alle dispute autoriali

 

Nel loro lavoro, presentato alla Joint Statistical Meetings di quest’anno, Mark Glickman, Jason Brown e Ryan Song, hanno per prima cosa assunto che ciascuna delle frequenze delle 149 caratteristiche musicali all’interno di una canzone dipendessero dal suo autore. In seguito, grazie all’utilizzo della “regola di Bayes”, hanno determinato un modello probabilistico “allenato” adoperando 70 canzoni o parti di canzoni la cui paternità era conosciuta. Infine, il modello perfezionato è stato applicato ai brani il cui autore non era noto. I risultati? “In My Life”, di cui avevamo parlato nei paragrafi precedenti, presenta una probabilità di .018 di essere stata scritta da Paul McCartney. Nonostante i vuoti di memoria di quest’ultimo, dovrebbe quindi essere opera di John Lennon.
Al di là dell’aspetto ludico di questa ricerca, non deve sfuggirci l’utilità di questo tipo di applicazione in ambito forense. Anche se, ammettiamolo, giocare con musica e statistica si è rivelato un passatempo piuttosto divertente per questi scienziati.

 

Se vi interessa il connubio tra scienza e musica, non perdete la rubrica di Philip Ball “L’istinto musicale”. Nell’appuntamento dell’ultimo numero di Sapere si parla di “Illusioni musicali”.

REDAZIONE
La Redazione del sito saperescienza.it è curata da Micaela Ranieri dal 2019, in precedenza hanno collaborato Stefano Pisani e Alessia Colaianni.
DELLO STESSO AUTORE

© 2024 Edizioni Dedalo. Tutti i diritti riservati. P.IVA 02507120729