Un grup de cercetători de la Universitatea Michigan din Statele Unite, coordonat de românca Rada Mihalcea, originară din Cluj, a dezvoltat un program menit să depisteze ştirile false cu o precizie mult mai ridicată şi cu mult mai des decât o pot face oamenii.



Cercetătoarea a detaliat pentru „Adevărul“ că ideea de a crea un algoritm care să detecteze ştirile false a venit firesc, ca urmare a proiectelor similare la care echipa ei a lucrat în ultimii ani. „Am lucrat pe segmentul detectării de minciuni de mult timp, aproape de 10 ani. Ne-am gândit că ar fi interesant să vedem cum s-ar aplica ce am făcut la problema asta a ştirilor false“, mărturiseşte românca.



Din echipa Radei Mihalcea fac parte cercetătoarea Veronica Perez-Rosas, profesorul Bennett Kleinberg, de la Universitatea din Londra (UCL), şi studenta Alexandra LeFevre.



Au lucrat pentru crearea noului algoritm aproape un an, în paralel cu alte proiecte, iar cercetarea lor ar urma să fie implementată într-o aplicaţie de telefon care ar putea fi lansată după ce va fi testată şi stabilă.



„Ştirile false apar şi dispar“



Primul pas în realizarea programului a fost întocmirea unei baze de date complexe care să conţină ştiri adevărate şi false, culese pe teritoriului Statelor Unite. Demersul „le-a mâncat“ mult timp cercetătorilor.

„Ştiri adevărate sunt uşor de găsit, dar identificarea ştilor false e mai complicată. La ştirile false e şi un fenomen interesant - apar şi dispar, nu-mi dau seama de ce“, apreciază Rada Mihalcea.

N-a stabilit o explicaţie clară a „fenomenului“, ci a observat doar că ea şi colegii săi l-au întâlnit des în cercetarea lor. Concluzia la care au ajuns: „Trebuie să fii foarte rapid ca să aduni ştiri false“.



Articolele culese au fost introduse în sistem, iar la fiecare ştire s-au analizat diverse aspecte: cum este scrisă ştirea, cât de complicat este textul, cât de sofisticate sunt cuvintele folosite, care este stilul, cât de lungi sunt propoziţiile, ce relaţii sintactice apar între subiect-verb, verb-complement direct, dar şi secvenţe de cuvinte, categorii de termeni care reflectă un aspect pozitiv sau unul negativ, cât de des apar anumite pronume personale etc.



„Avem, să zicem, 500 de ştiri false şi 500 de ştiri adevărate. La fiecare dintre aceste ştiri, algoritmul învaţă cumva să numere - aici sunt 7 pronume la persoana I, 25 de relaţii subiect-verb etc. Apoi algortimul învaţă cum să le combine într-o secvenţă stabilă. Este vorba despre conceptul de «machine learning», algoritmi de învăţare automată foarte populari acum. Le dai nişte date şi le spui asta e partea esenţială – trebuie să le spui ce să caute în text – şi apoi încep să înveţe“, explică Rada Mihalcea.

Cum funcţionează programul



Programul nu verifică validitatea informaţiilor, ci analizează doar structura. „Avem baza de date, vine o ştire, trece prin sistemul care este antrenat deja. La ştirea asta nouă despre care nu ştim nimic face exact ce a făcut şi la ştirile de dinainte: începe să numere secvenţe de cuvinte, pronume personale, relaţii sintactice, cuvinte care-s pozitive sau negative ca emoţie. Le numără şi le trece prin sistem. Având în vedere combinaţia de atribute pe care le observă - pronume, dependenţe sintactice etc. - decide ce şanse există ca acea ştire să fie falsă sau adevărată“, detaliază cercetătoarea originară din Cluj.



Munca echipei acesteia a arătat că, în ştirile false şi, în general, în minciună, se folosesc mai des cuvinte menite să inducă certitudinea, de tipul „întotdeauna“, „cu siguranţă“, „desigur“. Un alt indiciu pe care Rada Mihalcea îl consideră valabil în tentativa de „mirosire“ a ştirilor false priveşte faptul că autorii folosesc mai des pronume personale la persoana a II-a sau a III-a, decât la persoana I. „Cumva, acest tertip are ca substrat neasumarea informaţiei. Ideea e că în «fake news» sunt mai multe acţiuni prezentate la persoana a II-a şi a III-a decât în ştirile adevărate“, completează cercetătoarea.



Maşinile, mai bune decât oamenii



Programul Radei Mihalcea stabileşte ştirile false cu o acurateţe de aproximativ 75%. „Când zici 75%, înseamnă că mai sunt 25% până la 100%. Algoritmul ajută programul să se dezvolte singur, să înveţe, să fie mai bun decât oamenii“, subliniază Rada Mihalcea.



Cercetările făcute până acum arată că oamenii detectează minciunile în proporţie de 50%, iar când vine vorba despre ştiri procentul creşte la 70%.

„Nu-mi dau seama de ce, mă tot gândesc, dintr-un motiv sau altul, oamenii nu sunt buni să detecteze minciuni. De-a lungul evoluţiei, natura n-a considerat că este folositor, iar noi nu avem intuiţie când cineva minte. Un computer o face mult mai bine. Asta am observat-o nu numai noi, dar şi alţii care lucrează pe detectarea minciunilor“, adaugă românca.

Echipa din Michigan lucrează la îmbunătăţirea aplicaţiei, până în punctul în care va putea fi implementată pe smarphone-uri sau folosită de agenţiile de ştiri. Românca ia în calcul să extindă cercetarea şi în afara graniţelor Statelor Unite ale Americii.



Premiată de preşedintele Barack Obama



Rada Mihalcea (44 de ani) este profesor la Universitatea din Michigan, iar munca româncei a fost răsplătită prin mai multe distincţii prestigioase, precum „Google Awards Grant“ (2005) sau „Career Award“/Premiu pentru Carieră din partea Fundaţiei Naţionale de Ştiinţă din SUA, în 2008. Numele ei a apărut în ediţia 2008-2009 a anuarului „Who's Who of American Women“, care reuneşte cele mai importante femei americane din toate domeniile.



Are doctorate în Calculatoare (2001) şi în Lingvistică (în 2010), ultimul obţinut la Universitatea Oxford. Rada a fost inclusă în 2010 într-un top al cercetătorilor din Statele Unite ale Americii, ocazie cu care preşedintele în funcţie al SUA, Barack Obama, i-a înmânat personal o distincţie. Tot în 2010 a obţinut Premiul Academiei Române pentru merite în Ştiinţă şi Tehnologie. De patru ani este cetăţean de onoare al oraşului natal, Cluj-Napoca.

