Care sunt modelele de AI care „gândesc” precum oamenii și dezvoltă inteligență colectivă
0O cercetare recent realizată de Google asupra modelelor de inteligență artificială DeepSeek și Alibaba Cloud a descoperit că modelele puternice de raționament, capabile să „gândească”, manifestă o cogniție internă asemănătoare mecanismelor care stau la baza inteligenței colective umane.
Rezultatele, publicate joi, sugerează că diversitatea perspectivelor, nu doar dimensiunea computațională, este responsabilă pentru „inteligența” tot mai mare a modelelor AI, subliniind totodată importanța crescândă a modelelor open-source chinezești pentru cercetarea interdisciplinară de vârf din SUA, scrie South China Morning Post.
Prin experimentarea modelelor R1 de la DeepSeek și QwQ-32B de la Alibaba Cloud, cercetătorii au constatat că aceste modele de raționament generează dezbateri interne între agenți multipli, pe care le-au numit „societăți de gândire”, în care interacțiunea dintre trăsături de personalitate distincte și expertiza de domeniu conduce la capacități superioare.
„Sugestionăm că modelele de raționament stabilesc un paralelism computațional cu inteligența colectivă din grupurile umane, unde diversitatea permite rezolvarea superioară a problemelor atunci când este structurat sistematic”, au afirmat cercetătorii în articolul publicat pe portalul online cu acces deschis arXiv.
Studiul, care nu a fost supus încă evaluării colegiale (peer review), a fost realizat de patru cercetători din echipa Google „Paradigms of Intelligence”, care explorează natura inteligenței prin metode interdisciplinare.
Junsol Kim, doctorand în sociologie la Universitatea din Chicago, a condus studiul, iar Blaise Agüera y Arcas, vicepreședinte Google, este menționat ca autor final.
Modelele de raționament capabile să „gândească” pentru rezolvarea sarcinilor au devenit tipul dominant de sistem AI de bază de la introducerea seriei o a modelelor de către OpenAI, dezvoltatorul ChatGPT, în septembrie 2024.
Astfel de modele, concepute să „gândească” folosind mai multe resurse computaționale în timpul rulării, au contribuit la o creștere semnificativă a capacităților AI, reducând în același timp costul „inteligenței”, conform firmei de Artificial Analysis.
Cercetătorii Google și-au bazat concluziile pe analiza „urmelor de raționament” ale modelelor chinezești – rezultatele intermediare, pas cu pas, generate de modelele de raționament înainte de răspunsul final, care au fost prezentate pentru prima dată utilizatorilor când start-up-ul din Hangzhou, DeepSeek, a lansat primul său model de raționament R1, acum un an.
Urmele de raționament ale modelelor imită „interacțiuni sociale simulate”, inclusiv punerea de întrebări, asumarea perspectivelor și reconcilierea, au explicat cercetătorii. Atunci când modelele erau ghidate să fie mai conversaționale cu ele însele, acuratețea raționamentului lor se îmbunătățea.
Aceste descoperiri ar putea schimba modul în care modelele AI sunt conceptualizate, de la „entități solitare de rezolvare a problemelor” către „arhitecturi de raționament colectiv, în care inteligența nu apare doar din dimensiune, ci din interacțiunea structuratată a vocilor distincte”, au mai spus cercetătorii.