Filozoful care învață inteligența artificială să fie „bună” - povestea Amandei Askell

0
Publicat:

În spatele unora dintre cele mai avansate sisteme de inteligență artificială nu stau doar programatori sau ingineri. Uneori, rolul cheie îl are un filozof. Este cazul Amandei Askell, cercetătoare la Anthropic, compania care dezvoltă chatbotul Claude AI. Misiunea ei este să învețe inteligența artificială cum să se comporte moral și responsabil atunci când interacționează cu oamenii

Amanda Askell FOTO Lindsay Ellary for WSJ Magazine
Amanda Askell FOTO Lindsay Ellary for WSJ Magazine

Cine este Amanda Askell

Originară din Scoția, Amanda Askell este de profesie filozof, cu studii la Universitatea Oxford și un doctorat în filozofie obținut la New York University.

Înainte de a se alătura companiei Anthropic în 2021, ea a lucrat la OpenAI (compania care a dezvoltat ChatGPT), unde s-a concentrat pe cercetarea legată de siguranța inteligenței artificiale. 

La Anthropic, Askell conduce echipa responsabilă de „alinierea personalității” modelelor AI – adică procesul prin care sistemele sunt antrenate să manifeste trăsături precum onestitatea, empatia și responsabilitatea.

De ce are o companie AI nevoie de un filozof

În dezvoltarea inteligenței artificiale moderne apar dileme morale complexe. Doar câteva dintre exemple sunt următoarele:

  • Cum ar trebui să răspundă un AI la întrebări sensibile?
  • Cum poate evita manipularea sau dezinformarea?
  • Ce înseamnă comportamentul „corect” pentru un sistem automat?

Rolul Amandei Askell este să definească aceste principii și să le integreze în modul în care funcționează un chatbot denumit Claude AI. Potrivit relatărilor din The Wall Street Journal, Amanda abordează procesul de dezvoltare al AI-ului aproape ca pe creșterea unui copil: modelul trebuie ghidat cu grijă pentru a învăța să ia decizii etice și să reziste manipulării.

,,Personalitatea" lui Claude AI și ce este Constituional AI

Una dintre contribuțiile majore ale lui filozofului este elaborarea unui set amplu de reguli și principii morale pentru AI. Acest ghid intern, descris uneori drept „personalitatea” lui Claude AI, are aproximativ 30.000 de cuvinte și stabilește modul în care sistemul ar trebui să gestioneze dileme etice sau conversații dificile.

Documentul include instrucțiuni despre:

  • comportamentul etic al AI-ului
  • modul de tratare a subiectelor sensibile
  • empatia față de utilizatori
  • evitarea răspunsurilor dăunătoare

Munca Amandei Askell este strâns legată de conceptul de Constitutional AI, o metodă de antrenare a modelelor AI bazată pe principii etice explicite.  În loc să corecteze constant greșelile modelului, cercetătorii îi oferă un set de valori și reguli – o „constituție” – după care sistemul își evaluează propriile răspunsuri. Scopul acestei metode este ca AI-ul să devină mai autonom în luarea deciziilor morale. 

Avertismentul Amandei Askell

Amanda Askell crede că pe măsură ce modelele AI devin mai avansate, ele ar putea dezvolta forme rudimentare de „identitate”.  Din acest motiv, consideră important modul în care oamenii tratează aceste sisteme. Dacă AI-urile învață din interacțiunile noastre, comportamentul utilizatorilor poate influența evoluția lor. 

Top articole

Partenerii noștri


Ultimele știri
Cele mai citite