TESTATA GIORNALISTICA ONLINE DEL CREA, ISCRIZIONE N. 76/2020 AL REGISTRO STAMPA DEL TRIBUNALE DI ROMA DEL 29/7/2020

19.6 C
Roma
giovedì, 10 Ottobre 2024

Social media, sentimento e agroalimentare

Della stessa Rubrica

In una società liquida come la nostra i social media giocano un ruolo fondamentale nell’orientare l’opinione pubblica e per una Istituzione che, come il CREA, voglia comunicare  con i suoi molteplici target, è strategico riuscire ad analizzare la percezione social nelle sue tematiche e nei suoi ambiti di attività.

Marco Vassallo
Ricercatore CREA Politiche e Bioeconomia
Giuliano Gabrieli
Collaboratore Tecnico alla Ricerca – CREA Politiche e Bioeconomia

Proprio in tale direzione, parte in questo numero Dal CREA con Sentiment(o), L’analisi dei nostri temi sui socialla rubrica dedicata alla sentiment analysis od opinion mining, l’analisi automatica del linguaggio sui temi inerenti l’agricoltura, a partire dai social media presenti sul web. Attraverso l’estrazione di informazioni da fonti online e grazie all’applicazione di tecniche di analisi automatica del lessico, le parole vengono classificate in base al sentimento (o polarità) positivo, negativo, neutrale. Il linguaggio analizzato cambierà di volta in volta in base al tema del numero. Ma cerchiamo di saperne di più con Marco Vassallo (ricercatore) e Giuliano Gabrieli (statistico) del CREA Politiche e Bioeconomia, che credono molto in questo nuovo approccio.

In cosa consiste la sentiment analysis?

In termini molto semplici, e nella sua accezione più diretta, la sentiment analysis, l’analisi del sentimento, consiste nel classificare frasi scritte, o frammenti di testo, in positive, negative o neutrali rispetto all’argomento al quale si riferiscono, ottenendo così il “sentimento” espresso in un testo. Questa analisi avviene attraverso l’applicazione dei così detti lessici affettivi, database di parole alle quali sono state appunto assegnati dei punteggi positivi, negativi o neutrali, dette polarità. Invero, i lessici affettivi non contengono solo polarità, ma anche particolari emozioni e/o atteggiamenti come l’ironia. L’applicazione di questi lessici affettivi avviene in maniera automatica, attraverso l’utilizzo dell’informatica e sue implementazioni in modelli statistico-informatici. L’area di studio e ricerca che tratta della sentiment analysis e, più in generale, dell’elaborazione del linguaggio naturale è chiamata linguistica computazionale e coniuga (come gli stessi termini fanno già intendere) linguistica e tecniche di computazione, mediante l’utilizzo di metodi informatici e modelli statistici. Il linguaggio naturale, che tutti noi utilizziamo, viene quindi studiato per meglio comprenderlo sia a livello linguistico che di comunicazione, come nel caso della sentiment.

In questo nuovo mondo sempre più digitalizzato, dove quotidianamente si scambiano una quantità inimmaginabile di opinioni al minuto, per non dire manciata di secondi, è impensabile, a nostro avviso, non tenere conto di quanta informazione scritta venga trasmessa in maniera assolutamente gratuita su tematiche di ogni tipo, anche e soprattutto di rilevante importanza strategica.

L’analisi automatica del linguaggio naturale sul web per le tematiche centrali in Agroalimentare costituisce, quindi, sempre a nostra opinione, un passo imprescindibile che un ente di ricerca come il CREA non può ignorare, perché altrimenti rimarrebbe indietro rispetto a una evoluzione della comunicazione digitale oramai predominante.

Come è nata l’idea della sentiment analysis?

Al CREA è nata da un connubio di iniziative, i pionieri sono stati Giuliano Gabrieli e Mafalda Monda entrambi del CREA-Politiche e Bioeconomia, che per primi hanno iniziato ad applicare un’analisi sentiment alle problematiche in agricoltura sul web, veicolando poi i dati ottenuti nel bollettino trimestrale CREAgritend. Allo stesso tempo, anche io (CREA- Politiche e Bioeconomia) stavo proponendo l’analisi automatica dei testi, attraverso la Text Mining (tecniche di analisi automatica dei testi, che coinvolgono metodi statistici per estrarre informazioni da un database testuale) su interviste da focus group, sempre su tematiche agricole. Inoltre, insieme a Giuliano abbiamo vinto, nel 2017 e nel 2018, la borsa INPS (messa a bando per dipendenti pubblici) per frequentare due Master Executive, rispettivamente di secondo livello (Master in Big Data: Metodi Statistici per la Società della Conoscenza presso il Dipartimento di Scienze Statistiche della Sapienza Università di Roma) e primo livello (Master in Data Science presso il Dipartimento di Ingegneria dell’Impresa dell’Università degli Studi di Roma “Tor Vergata”), orientati proprio all’analisi dei Big Data sul web, anche di natura testuale.

Abbiamo, quindi, unito le forze ed iniziato questa avventura nella linguistica computazionale molto orientata verso la sentiment analysis, che ci ha portati innanzitutto a collaborare direttamente e in pianta stabile con il Dipartimento di Informatica della Università degli studi di Torino; alla realizzazione di un workshop, tenutosi il 19 Febbraio 2020 presso la sede centrale del CREA di Roma, sponsorizzato dall’Ufficio di Statistica del CREA e dal progetto RICA, dal titolo “Sentiment Analysis in Agricoltura: Teoria ed Applicazioni con R”; e, infine, alla creazione di un gruppo di lavoro traversale a tutto il CREA chiamato “Social Media Analytics in Agriculture – SMs-Agri” .

Come viene effettuata?

L’analisi sentiment, che attualmente applichiamo al CREA, viene effettuata attraverso l’utilizzo di un lessico affettivo per l’Italiano chiamato Sentix (Sentiment Italian Lexicon), originariamente sviluppato dal Dipartimento di Informatica della Università degli Studi di Torino e, recentemente, migliorato ed implementato dal CREA-Politiche e Bioeconomia e dal medesimo Dipartimento chiamato MAL e W-MAL (link all’secondo articolo). Tecnicamente il MAL e W-MAL vengono inseriti in una funzione del software statistico R per consentirne l’elaborazione automatica. L’analisi sentiment viene, inoltre, elaborata attraverso modelli statistico-informatici d’avanguardia, come il machine-learning, tipici della Intelligenza Artificiale. In tal senso, possiamo anticipare che, sempre insieme al Dipartimento di Informatica della Università degli Studi di Torino e dell’Università di Bari, stiamo lavorando ad un modello ibrido in grado di unire tecniche di machine-learning, con il nostro lessico affettivo morfosintattico W-MAL.

Per questo primo numero quali parole avete analizzato?

In questo numero abbiamo analizzato le opinioni su Twitter nel corso del 2021 da parte di alcuni media definiti generalisti: 79 profili tra cui 50 televisioni, 25 quotidiani, 4 settimanali italiani. La ricerca ha riguardato le parole, e i relativi argomenti: agro-biodiversità, biodiversità e agroalimentare, biodiversità e agricoltura.

In breve cosa ne è emerso?

La parola agro-biodiversità non è stata twittata da questi media, ma lo sono le altre parole ad essa relative. Da questo ne può derivare una certa difficoltà nell’uso comune di questo termine rispetto alle parole ad essa affini. In generale, intorno ai termini affini, ne è scaturito un sentimento positivo, seppur abbastanza atteso, insieme però ad una sostanziale percentuale di sentimento negativo, di denuncia per il mancato rispetto di questo fondamentale elemento per il futuro dell’agroalimentare, dell’agricoltura in genere, e per il nostro pianeta.

Leggi qui per l’articolo sul report completo.

Per saperne di più

  • Basile V. (2020). I Computer e il Linguaggio Naturale. Ithaca: Viaggio nella Scienza, 16, 151-165. http://siba-ese.unisalento.it/index.php/ithaca/article/view/23009 
  • Vassallo M., Gabrieli G., Basile V., Bosco C. (2019). The tenuousness of lemmatization in lexicon-based sentiment analysis. Proceedings of the Sixth Italian Conference on Computational Linguistics (CLiC-it 2019). http://ceur-ws.org/Vol-2481/ 
  • Vassallo M., Gabrieli G., Basile V., Bosco C. (2020). Polarity imbalance in lexicon-based sentiment analysis. Proceedings of the Seventh Italian Conference on Computational Linguistics (CLiC-it 2020). http://ceur-ws.org/Vol-2769/
Micaela Conterio
Ufficio stampa CREA

Giornalista pubblicista dalla comprovata professionalità sia come addetto stampa, con particolare riguardo ai social media (relations, strategy, event e content) e al web, sia come redattrice di articoli presso diverse redazioni di testate giornalistiche nazionali. Fotografa e scrittrice per passione.

#lafrase Il vero viaggio di scoperta non consiste nel cercare nuove terre, ma nell’avere nuovi occhi (Marcel Proust)

Gli ultimi articoli