Scritto da Pino Cabras Domenica 17 Luglio 2011 00:41

Guerra e verità

videosiriacoverdi Pino Cabras – Megachip.
con intervista a Pier Paolo Murru, esperto di post-produzioni video.

Raccontiamo qui nuovamente un video, una storia che forse si è già impressa nelle vostre menti: la morte in presa diretta, il cecchino che spara al ragazzo che lo filma, voi che vi siete affacciati sulla Siria attraverso la sua paura e poi il suo buio, i giornali che scrivono che questa è «la nuova strategia repressiva del regime: sparare dritto su chi filma.» Vi proponiamo un’analisi tecnica stringente, che smonta pezzo dopo pezzo il video, scompone le sequenze, spiega i segreti dell’audio, fa tutto quello che non hanno fatto Enrico Mentana, Francesco Battistini e tutti gli altri che hanno raccolto la velina e l’hanno rilanciata. Come vedrete tutto fa pensare che il video sia una clamorosa bufala. Ma prima di analizzarla, come è giusto, va richiamato brevemente il contesto.

 

Il quadro generale: la propaganda è senza esclusione di colpi

Il contesto è quello del grande sommovimento del mondo arabo e islamico del 2011, in cui l’Occidente interviene secondo convenienza, scegliendo quali dittatori sono dei bastardi e quali invece sono pur sempre i «nostri» bastardi. I primi saranno sottoposti a un’implacabile “reductio ad Hitlerum” e accusati di ogni nefandezza, nonché soggetti a ogni tipo di attacco e di provocazione militare, diplomatica, mediatica. I secondi saranno blindati da un silenzio mediatico speculare alla campagna che invece colpisce gli altri. Chi vuole approfondire può farlo. Chi ha già approfondito ha visto operare un’instancabile macchina della menzogna, che sforna di continuo come istanze genuine centinaia di immagini, di filmati, di blog, di profili da social network che spesso si rivelano totalmente falsi. La maggior parte di questa enorme produzione sfugge alla critica, e passa per vera. È in atto un gigantesco sforzo mediatico che occulta la sua radice strategica in seno a comandi militari che lo organizzano.[1]

Il tentativo, fin qui riuscito, è quello di raccontare le vicende mediorientali con una distinzione fra buoni e cattivi che coincide con le linee di frattura degli interessi strategici dettati dall’Occidente e dalle petro-monarchie della penisola araba. Nell’ottica degli strateghi, bersagliare il mondo con messaggi e percezioni «coerenti» è denaro ben speso, tanto quanto i dollari sborsati per un cacciabombardiere. Sono armi entrambe.

Per chi ha pianificato le guerre in corso e sta preparando le prossime entro breve, è meglio azzerare il rischio che non siano accettate, ed è meglio estendere l’ombrello della pianificazione militare totale a ogni aspetto della comunicazione. La parte più succosa saranno le immagini, che dovranno trasmettere messaggi emotivamente coinvolgenti ed eticamente semplificati.

 

Il video del cecchino, un filmato da dissezionare. Intervista a Pier Paolo Murru, esperto video

Vale dunque la pena ritornare sul video del cecchino che tanto ha emozionato Mentana e Battistini.

Mi aiuta nella traduzione dall’arabo Naman Tarcha, che riesce a trascrivere i contenuti delle voci che si odono nel video. E rivedo svariate volte le immagini con l’aiuto di un esperto di post-produzioni video, Pier Paolo Murru, il quale entra molto in profondità nei dettagli.

 

 

Murru, innanzitutto cosa nota nella sequenza dal punto di vista tecnico?

«Vista la risoluzione e la qualità della sequenza analizzata, si tratta probabilmente di un video girato con un palmare/smartphone (forse un iPhone di vecchia generazione). Marca e modello non sono comunque informazioni importanti in questo caso.

L’uso di questo genere di strumenti, in questi contesti ad alto rischio, concederebbe alcuni vantaggi rispetto a quel che si sarebbe costretti a fare con una normale videocamera handy: ovvero tenerla a braccio teso (angolato o disteso), a diretto contatto fisico – attraverso il viewfinder interno (mirino) o a breve distanza per visionare l’LCD esterno. Infatti, grazie alla estrema leggerezza e compattezza degli smartphone, è possibile riprendere con margini di sicurezza ben più ampi proprio in quei casi in cui si renda necessario “rubare” sequenze video senza essere visti o comunque senza avere l’ingombro di un normale cineoperatore e relativa attrezzatura, posizionando l’apparecchio nel punto più consono allo scopo e alla situazione in cui ci si trova. Le lenti di questi sistemi sono tendenzialmente di origine medio grandangolare».

 

Da quel che mi dice, un apparecchio come quello appena descritto riesce a fare grandi cose, ma le immagini che vediamo sembrano sporche e sgranate. Come mai?

Nella sequenza l’angolo di vista è piuttosto stretto, e questo farebbe ipotizzare l’uso dello zoom digitale che giustificherebbe, in parte, l’evidente tremolio durante il movimento della mano e la qualità decisamente degradata a prescindere dalla compressione.

 

Ha analizzato il luogo di ripresa dove si sporge il video-operatore misterioso?

«L’operatore si trovava su un volume sopraelevato (un tetto o un balcone di una palazzina) che si affaccia su alcune strade circondate da altre palazzine. Si nota un parapetto di protezione alto circa 100/120cm (4/5 file di blocchi in calcestruzzo).»

videosiria01

 

Quali impressioni ricava dalla sequenza video, è normale il comportamento dell’autore del filmato?

«Alla luce di quanto dicevo prima, in relazione alle possibilità concesse da questi strumenti di ripresa, e vista la situazione che presumiamo di altissimo rischio, io mi sarei accovacciato dietro al parapetto, mettendomi in totale sicurezza, e avrei esposto solo il telefono al disopra del muro osservando da basso cosa stessi riprendendo. In questo modo avrei avuto modo di “guardarmi attorno” come farebbe un periscopio a pelo d’acqua. Ma – se fosse vero questo scenario – considerata l’alta frequenza di colpi d’arma da fuoco che si sentono nella sequenza, di certo non mi sarei sporto con la sola testa, o peggio alzato in piedi, rendendomi completamente visibile e vulnerabile all’eventuale mira e tiro dei cecchini.»

 

Il videomaker appare dunque come un temerario. Che tipo di riprese fa?

«Nel video l’operatore usa il telefonino come fosse una videocamera standard. Cioè ponendo il cellulare fra se e il soggetto e sul medesimo asse del viso. Operazione che ritengo del tutto insensata, visto il rischio a cui si andava incontro e viste le possibilità di “monitoraggio” a distanza offerte dalle riprese effettuate con piccole videocamere come i telefoni cellulari. Anche nel caso in cui avessi deciso di espormi, alzandomi in piedi dietro al parapetto, avrei almeno tenuto il cellulare lontano dal corpo, puntandolo sul soggetto da inquadrare, e tenendo bene in vista il soggetto ad occhio nudo per carpirne le reali caratteristiche e intenzioni. In questo caso, una volta riconosciuto il militare armato (a vista o attraverso l’LCD nell’inquadratura zoomata), mi sarei buttato immediatamente al suolo per mettermi in sicurezza, e al limite avrei cercato di riprenderlo successivamente con la tecnica “a periscopio”prima descritta. Personalmente non avrei nemmeno rischiato di perdere la mano per un colpo di arma da fuoco, ma evidentemente questa è una valutazione del tutto soggettiva.»

 

Ecco, il momento dell’inquadratura del marmittone armato è un momento cruciale. La mano dell’operatore, che prima era una specie di gelatina sussultante, improvvisamente è fermissima. Lei fa notare che l’operatore è estremamente esposto, e sembra abbandonare ogni precauzione che una persona di buon senso adotterebbe. Cosa accade?

«Nella sequenza in questione, l’operatore dedica l’unica sequenza steady (a mano ferma e stabile) al suo killer. Si ferma, lo individua chiaramente, lo perde di vista per alcuni istanti e lo ricerca senza alcuna titubanza. Non accenna timori, almeno non nel modo con cui continua a riprendere il soldato. Lo tiene inquadrato mentre prende la mira con tutta calma, e si fa uccidere. L’asse di mira del cecchino coincide alla perfezione con l’asse di ripresa e di conseguenza con l’asse della testa o di un altro organo vitale – tale da giustificarne la morte istantanea, o quasi. Personalmente, analizzando la posizione della canna del fucile rispetto all’inquadratura, credo che l’asse sia riferito al capo e quindi dovrei dedurne che l’operatore tenesse il cellulare proprio davanti al viso, esponendosi completamente al suo assassino.»

 

Alla fine vediamo una strana danza fra vittima e carnefice, una sorta di tempismo perfetto…

«Un altro ragionamento mi fa sottolineare quanto sia stata perfetta la sincronia fra i due soggetti, nel cercarsi e nell’esporsi l’uno all’altro – con il cecchino e l’operatore che si “mirano” a vicenda nel medesimo istante, faccia a faccia e corpo a corpo, malgrado la sequenza precedente indicasse estrema incertezza nella ripresa e il militare avesse, sino al momento della sua inquadratura, la vista occlusa da un balcone della palazzina soprastante.»

 

Veniamo al clou, la sequenza dell’«uccisione». Cosa ha notato?

«L’operatore trova il militare al minuto 00:32 del video; si vedono solo le sue gambe che in quel momento esatto potevano solo indicare la presenza di una persona appostata o nascosta. Segue una raffica di fuoco che pare molto vicina (ampiezza) ma di cui non si capisce l’esatta provenienza (segnale mono) e l’operatore perde l’inquadratura – forse per cercare la fonte degli spari ma non per mettersi in sicurezza – ma semplicemente alza un po’ più in alto la ripresa per poi tornare a cercare il militare. A 00:37 il militare fa il primo passo avanti e la camera risolleva l’inquadratura. L’operatore ritrova il suo soggetto a 00:42 e qui entrambi si fermano, l’uno in fronte all’altro – ma il cecchino ha ancora il fucile in posizione di sicurezza (con la canna puntata al suolo). Ancora l’operatore non si mette in sicurezza. Immediatamente dopo si trovano l’uno, come già detto, nel mirino dell’altro e il cecchino alza la canna del fucile e la punta sulla presunta vittima.»

videosiria02

 

L’operatore pare voler fare qualcosa (agita la camera) ma invece di mettersi definitivamente in sicurezza – torna a riprendere il tizio in grigioverde.

«Sì, e lo fa dopo quei 4 secondi che servono al militare per prendere la mira; ed ecco lo sparo, mentre l’operatore continua a riprendere.

videosiria03

 

L’uomo che riprende il video, prima di questa sequenza, tiene in mano l’apparecchio oltre il parapetto, visto che in alcuni fotogrammi immediatamente precedenti allo sparo, inquadra la strada sotto la sua posizione dove si vede la stessa ombra dell’edificio che lo ospita». (fotogramma sotto).

videosiria04

 

Il video, a questo punto, dopo lo sparo diventa buio, ma si sente ancora l’audio. Diventa meno interessante?

«Tutt’altro. È da notare come il telefono non sia precipitato in strada dopo lo sparo (malgrado la posizione dell’operatore non sia sostanzialmente cambiata), ma sia stato tenuto in mano e riportato all’interno del terrazzo, sino ad impattare al suolo.

Il primo impatto del telefono avviene (analizzando l’audio) a circa 7 decimi di secondo dallo sparo (tempo compatibile con una piccola parabola o una caduta diretta all’indietro) – innescando poi un rimbalzo stretto che dura circa 1.8 secondi. A livello video, l’unica modifica nel segnale, è sancita da un buco nero a breve distanza dallo sparo. Si tratta di totale assenza di informazioni per alcuni fotogrammi, riferibile forse all’impatto sul pavimento dell’apparecchio – anche se si percepisce un fenomeno di rimbalzo (in audio e in video) che farebbe pensare ad un urto più morbido in cui l’energia cinetica sia stata smorzata in più tempi prima del contatto finale con la pavimentazione del terrazzo. Personalmente mi sarei aspettato che il telefono si disintegrasse vista la violenza estrema e la dinamica del fatto, ma qui entra in gioco la fisica e visti i pochi elementi in gioco è difficile scartare o validare un elemento come questo.

Queste sono valutazioni generali e non sempre sostanziali che però, a mio avviso, meritano di essere considerate nell’insieme».

 

A questo punto l’analisi dell’audio diventa fondamentale, non crede?

«Vi sono diversi aspetti poco chiari nella struttura della colonna audio, ma ne esporrò i principali per evitare di entrare troppo in territori tecnici. Vediamoli però graficamente.

Gli eventi audio più importanti sono due assenze di segnale a ? dB, alcuni secondi dopo lo sparo e dopo qualche altro secondo di eventi audio:

videoaudiospettro01

Poco dopo lo sparo e la caduta al suolo del telefono (con conseguente rimbalzo stretto) si presenta il primo silenzio (indicato col segno infinito ?):

videoaudiospettro02

Meglio si nota nell’immagine seguente, dove ho indicato il primo “buco”, che avviene su una voce che si tronca di netto a 00:49 (primo segno rosso/abrupt interruption). Segue il silenziamento a 00:50 (segno giallo) di circa 5 secondi a ? dB. Segue un fading (secondo segno rosso/fade in) di altre voci che proseguono sino ad un ulteriore taglio (terzo segno rosso/fade out) che porta un altro silenzio a ? dB a 01:01 (secondo segno giallo) per poco meno di 2 secondi. Un ultimo evento (quarto segno rosso/ abrupt in) reintroduce brutalmente le voci che procedono sino alla fine della sequenza.»

videoaudiospettro03

 

La nettezza e lunghezza di questi buchi nel sonoro e la regolarità delle dissolvenze sembra abbastanza anomala. Ma vada avanti. Ci sono altri eventi rilevanti nell’audio?

«Sì. Questi altri eventi sono presenti sotto la colonna audio riferita alle vicinanze dell’operatore (dall’inizio sino allo sparo che lo mette al suolo), che hanno strutture ricorrenti. Ovvero si tratta di eventi audio che si ripetono nella medesima forma e nella medesima tonalità lungo lo scorrere del tempo. Seppure non vi sia sovrapponibilità d’onda a causa del fatto che vi sono più fonti di rumore ambientale (spari, urla, voci etc…), questi eventi vanno evidenziati in quanto appaiono e scompaiono in “abrupt waveform changes/awc“. Ossia dei cambiamenti repentini della forma d’onda, negli innesti fra eventi sonori, nell’entrata e nell’uscita di altrettante sorgenti di rumore ambientale. Senza doversi vedere tutte le campionature e senza infilarci nell’analisi dei sample, se ne può sentire distintamente uno fra il punto 00:16 e il punto 00:18, ma ve ne sono diversi lungo questa prima parte di sequenza. Così come arrivano determinati “pattern” di sottofondo (insiemi di proteste, cantilene e urla) che si ripetono per poi scomparire di netto, anche al rientro dalle attenuazioni di segnale causate dagli spari. Questa discontinuità generale si manifesta, a livello meramente uditivo, anche all’inizio della sequenza, quando la voce dietro la telecamera (nelle sue immediate vicinanze visto che si sentono chiaramente i suoni delle consonanti occlusive bilabiali, cioè i suoni delle P e delle B, che vanno a “colpire” la pastiglia del microfono) parla velocemente senza tentennare, per poi sottolineare pochi cicli di affanno respiratorio in cui l’emissione d’aria viene sparata anch’essa sul microfono producendo il classico rumore a bassa frequenza simile al wind noise (rumore del vento). Affanni che però si fermano di netto nell’immediato proseguo della sequenza. Si passa da un respiro da debito d’ossigeno che dura 3 secondi (da 00:08 a 00:11), alla totale assenza di respiro per tutto il seguito della sequenza.

Altre considerazioni sulla colonna audio, che a mio avviso meritano interesse, sono la quasi totale assenza di rapporto fra direzionalità del microfono (e dell’apparecchio di ripresa teoricamente solidale) e le caratteristiche dei suoni in relazione all’ambiente in cui questi sono stati presi in audio.»

 

Cioè il microfono e la “telecamera”, essendo – come dice – «solidali», si spostano assieme. E però i rumori che sentiamo sono slegati dai movimenti che vediamo?

«Sebbene la colonna audio sia in doppio canale/mono (i due canali destro/sinistro sono identici per cui è impossibile fare una preziosa analisi della fase per identificare le diverse sorgenti sonore nello spazio…), non si identificano sostanziali modificazioni in ampiezza dinamica e struttura, al cambiare del punto di ripresa. Questo indicherebbe che, indipendentemente dove si punti l’apparecchio e il relativo microfono, la presa audio conserva le medesime caratteristiche, anche quando l’operatore tiene l’apparecchio basso e in prossimità del parapetto al punto 00:23 (area occlusa). Più precisamente, vi sono modificazioni di volume e struttura, ma apparentemente non collegate ai movimenti/direzione espressi nella sequenza. Ovvero, sono presenti modifiche sostanziali dell’onda sonora malgrado il punto di ripresa video rimanga immutato o con poche variazioni e viceversa. In parte, questo può essere causato dall’attenuazione automatica che segue ogni evento audio particolarmente violento (come gli spari che tipicamente generano awc), ma è meno comprensibile laddove non vi siano eventi di questo genere.»

 

Non immaginavo che l’analisi dell’audio potesse svelare tanti micro-dettagli. Si possono trovare altri indizi su come viene maneggiato lo strumento di ripresa, sul fatto che sia all’aperto o al chiuso?

«In questo caso specifico possiamo anche registrare la presenza del “ticchettio” che si produce maneggiando questi apparecchi, prodotto dai microurti delle dita sulle parti in plastica del telefono.

Ma c’è di più. Immediatamente dopo la ricomparsa del segnale dai ? dB (00:54), le caratteristiche audio riferite alle sequenze audio finali si percepiscono come più soggette a riverbero ambientale, rendendole più simili ad una presa in ambienti chiusi/occlusi piuttosto che a cielo aperto come la prima parte di video. Si ascolti la sostanziale differenza fra la presa iniziale (voce introduttiva) e quella finale (voci attorno alla vittima) in cui si caratterizzano forti similitudini con quanto è ottenibile effettuando una presa audio al chiuso e con sorgenti molto vicine al microfono. In questa parte del video (telecamera al suolo) vi sono anche diversi contatti/strofinamenti con il microfono (humming/rumble a basse frequenze) senza però innescare movimento nella ripresa che appare pressoché identica sino all’ultimo fotogramma.

Le caratteristiche di tipo acustico e di riverberazione ambientale potrebbero anche essere state generate dalla posizione finale dell’apparecchio, magari in una zona occlusa e vicino a delle pareti, malgrado questa specifica caratteristica sia presente su tutte le sorgenti, compresi gli spari in strada che in questa area del filmato, comprendono veri e propri rimbalzi/eco – e code più lunghe. Volendo sforzarsi un poco oltre, forse si tratta di diverse armi posizionate in altrettante aree e forse il telefono è rimbalzato sino a dentro casa (nel caso fosse un balcone). Certo è che questo nuovo assetto audio parte dal silenzio e dai vari cut & fading di cui s’è parlato sopra – e prosegue sino alla fine – e non contiene più nessuno di quei pattern di protesta che erano presenti all’inizio, pur trovandosi molto vicino a livello strettamente temporale a quella zona del video. In definitiva vi sono due macro registri, ognuno con le proprie caratteristiche acustiche.

È comunque una pratica assai difficile quella di comprendere la posizione delle diverse sorgenti audio in relazione al punto di ripresa; nella sequenza l’unico soggetto umano visibile è il cecchino che spara un solo colpo. Tutte le altre voci, urla, spari, cantilene etc. non hanno soggetti/sorgenti a vista e le strade inquadrate appaiano del tutto deserte, malgrado l’apparente prossimità degli eventi audio che è possibile percepire nell’ascolto della sequenza audio. Anche in linea del tutto generale, non c’è molta corrispondenza fra ciò che si sente e ciò che si vede… ma in assenza di analisi di fase (impossibile a causa del segnale dual mono) è impossibile dare un parere profondo e preciso sulla questione riferita a questo aspetto.»

 

Possiamo trarre delle conclusioni da questa analisi?

«Sbilanciarsi in senso assoluto verso un’unica interpretazione, sopratutto in presenza di così tanti elementi particolari, non è cosa facile né da prendersi alla leggera. Certamente vi sono molteplici aspetti che fanno apparire l’audio come opera di mixaggio di varie fonti preregistrate e sarei disonesto se non ipotizzassi tale configurazione. Situazione che giustificherebbe in un sol colpo tutte le caratteristiche che ho riscontrato nella colonna audio e in quella video. Personalmente, vista la quantità di “sintomi”, penso si tratti di un falso, probabilmente creato a tavolino o miscelando diverse altre fonti tratte da altrettanti materiali audiovisivi.

È certo che l’opzione fictional spiegherebbe in un sol colpo tutte le caratteristiche, le contraddizioni e le manipolazioni – riscontrare nella sequenza.»

 

Le parole di Murru sono giustamente prudenti, ma altrettanto nette nell’indicare quale linea di ricerca privilegiare in base ai fondati elementi di prova raccolti.

Anche la traduzione e trascrizione delle voci che si odono nel video ha qualche stranezza. Leggiamola.

 

Cosa si dice nel video

00.02: «LA POLIZIA SPARA SUI FRATELLI CITTADINI .. NELLA VIA DI AL SHAM (a Damasco NdR), NELLA ZONA DI KARM AL SHAMI».

(Poi aggiunge la data) «1/7/2011 SENZA MOTIVO, NON C’È NÉ MANIFESTAZIONE NÉ NULLA…»

(le voci non identificate pronunciano parole di cui non si afferra precisamente il senso:

Uno: «OGGI?». Risponde l’altro: «SONO QUI DALLA MATTINA» (sembra di udire un’eco).

00.40: si sentono voci chiare di una presunta manifestazione (sebbene pochi secondi prima si dicesse «NON C’È NÉ MANIFESTAZIONE NÉ NULLA», ammesso che si parlasse del presente.

Le voci della folla urlano:

«TAKBIR»: ossia l’invito a glorificare Dio… e la folla risponde: «ALLAHU AKBAR» («Dio è più grande»)

Dopo lo sparo si ode una parola mozzata: l’inizio di «HROO…» che presumibilmente compone la prima parte di «HROOB»: che significa «SCAPPA!»

00.56: L’annuncio di morte dice: «LA PALLOTTOLA LO HA COLPITO IN TESTA?»

Cui segue un espressione di lutto: «O DIO, O DIO»

Una frase didascalicamente melodrammatica giunge dalla voce della presunta vittima «MI HA UCCISO». Nel frattempo una voce chiede : «COSA? RIPRENDO? »

 

Conclusioni

Dobbiamo chiederci come faccia il sistema dei media ad accogliere simili video come se fossero stille di oro colato, quando i precedenti delle manipolazioni informative e le caratteristiche intrinseche dei filmati dovrebbero portare a diffidarne radicalmente, per trattarli invece con le pinze. Invece vengono lanciati in prima pagina. I perché non sono rassicuranti.

Per smontare un video ho impiegato molto tempo, e sono dovuto entrare in dettagli tecnicamente complicati, per quanto illuminanti. Nel frattempo, in milioni di case, l’homo videns è stato bombardato da altre decine di filmati, servizi giornalistici, narrazioni molto semplici e molto false.
Smitizzare un video taroccato mentre accade tutto il resto mi sembra come fermare uno tsunami con un cucchiaino. Eppure mi pare un avamposto del dovere.

Le macchine della menzogna paiono invincibili, ma come insegna la vicenda Murdoch in Gran Bretagna in questi giorni, una volta raggiunta una massa critica di eventi che si oppongono a un certo sistema, anche quelle macchine possono essere sconfitte. È sperabile che accada anche per la propaganda dei tanti pappagalli di guerra.

 


[1] Nick Fielding, Ian Cobain, Revealed: US spy operation that manipulates social media, in The Guardian, 17 marzo 2011.

 

Commenta su Facebook