Dezvoltatorii unui generator de texte de tip „deepfake” decid să păstreze secrete cercetările, în vederea unor testări extinse

Publicat: 15.02.2019 05:22

Ultima actualizare: 03.08.2022 18:38

Creatorii unui sistem revoluţionar AI ce poate compune ştiri şi texte de ficţiune pornind de la un text input – supranumit „deepfake pentru text” – au decis să nu-l facă cunoscut publicului, contrar politicii organizaţiei de cercetare care a sprijinit dezvoltarea sa.

OpenAI, o companie de cercetare non-profit finanţată de Elon Musk, a luat măsura neobişnuită de a nu-şi face publice cercetările, din pricina unor potenţiale utilizări în scopuri mai puţin benefice, relatează The Guardian.

Reprezentanţii companiei au declarat că noul său model AI, numit GPT2, este atât de avansat că riscul utilizării sale în scopuri improprii este foarte ridicat, astfel că nu vor publica cercetările complete, aşa cum prevede politica organizaţiei, tocmai pentru a discuta în detaliu implicaţiile acestei inovaţii tehnologice şi a-i testa capacităţile.

În principiu, GPT2 nu este decât un simplu generator de texte. Sistemul AI funcţionează prin încărcarea unui text de la câteva cuvinte la o pagină şi comanda de a scrie următoarele fraze pe baza unor predicţii învăţate privind ceea ce este potrivit ca şi continuare. Sistemul este însă capabil să producă texte de calitate, într-o măsură mult mai mare decât s-ar fi crezut, prin prisma unei baze de date extinse ce-i permite să înţeleagă un text. Parametrii cantităţii sunt atinşi la fel de bine, textele generate fiind de o mare varietate.

În calitate de generator de noi texte GPT2 poate scrie pasaje plauzibile care se potrivesc cu textul de plecare atât în privinţa stilului, cât şi a subiectului. Spre deosebire de sistemele precedente similare, nu manifestă bizarerii precum să uite despre ce scrie în mijlocul paragrafului sau să greşească sintaxa în frazele lungi.

O testare a sistemului arată ce poate face pornind de la primul paragraf al romanului „1984” scris de George Orwell: „Era o zi rece cu soare de aprilie, iar orologiile băteau ora 13.” Sistemul recunoaşte tonul vag futurist şi stilul de scriere al unui roman, generând următoarea continuare:„Mă aflam în maşină îndreptându-mă către Seattle, locaţia noului meu job. Am pus benzină, am rotit cheia şi i-am dat drumul. Mi-am imaginat cum va fi acea zi. 100 de ani în viitor. În 2045, eram profesor la o şcoală într-un sătuc sărac din China. Am început cu istoria Chinei şi istoria ştiinţei.”

Sistemul AI se descurcă şi cu ştirile la fel de bine. Pornind de la câteva paragrafe despre Brexit, va produce un text jurnalistic plauzibil precum acesta: „La solicitarea de a clarifica relatările, unul dintre purtătorii de cuvânt ai lui May a spus: Primul-ministru a exprimat foarte clar intenţia sa de a părăsi UE cât de repede posibil, iar acest lucru va avea loc în mandatul său, după cum a confirmat Regina în discursul său de săptămâna trecută.”

GPT2 este revoluţionar din două puncte de vedere. Unul este mărimea sa, spune Dario Amodei, directorul programului de cercetare de la OpenAI, şi anume, în comparaţie cu ultimul model, este de „12 ori mai mare, iar setul de date de 15 ori mai mare şi mult mai extins.” Sistemul a fost instruit folosind o bază de date de 10 milioane de articole, selectate pe baza linkurilor de peste 3 voturi de pe platforma de ştiri sociale Reddit. Colecţia de texte ajungea la o dimensiune de 40 GB.

Al doilea este faptul că, datorită cantităţii mai mari de date, sistemul AI dispune de utilizări mai generale decât la modelele anterioare. Prin structurarea textului input, noul model poate efectua sarcini specifice precum traducerea şi sumarizarea, şi chiar să treacă teste simple de înţelegere a textului cu scoruri la fel de bune sau chiar mai mari decât modelele construite special în acest scop.

Însă cercetătorii vor să-l testeze o perioadă mai lungă de timp pentru a-şi da seama cu ce s-ar putea confrunta în viitor în cazul utilizărilor sale rău-intenţionate. „Trebuie să experimentăm cu el pentru a ne da seama ce poate şi ce nu poate să facă”, a spus Jack Clark, responsabilul pentru politicile organizaţiei. „Dacă nu poţi anticipa complet abilităţile unui model, trebuie să o pui la lucru să vezi ce poate face. Sunt oameni care se pot gândi la mult mai multe lucruri rele decât o putem face noi,” a precizat el.

În acest scop, OpenAI a conceput o versiune uşor diferită a GPT2 care poate produce un număr infinit de review-uri pozitive sau negative ale produselor comerciale. Sistemele acestea nu sunt capabile să filtreze informaţia, ceea ce este doar unul dintre potenţialele puncte slabe, pe lângă mesajele spam şi ştirile false ce pot fi generate. Fiind instruite pe baza datelor de pe internet, pot fi folosite pentru a genera tot felul de texte fanatice, teorii ale conspiraţiei etc, or trebuie văzut până la nivel sunt capabile de aceste lucruri.

Clark anunţă că scopul este să pregătească lumea pentru tehnologia mainstream de peste un an sau doi, pentru a şti ce poate face aceasta din urmă. „Regulile prin care tehnologia poate fi controlată s-au schimbat radical,” tendinţa fiind de a scădea costurile şi preţurile tehnologiilor, a atras atenţia acesta. El a spus că strategia companiei este dezvoltarea „ unui mod de gândire mai riguros” care însă nu pretinde că este cel corect.

Şi alte publicaţii precum The Conversation au atras atenţia asupra fenomenului „deepfake” cu referire la dezvoltarea tehnologiilor bazate pe inteligenţă artificială pentru a truca cu mare fineţe clipuri video sau a realiza unele deosebit de realiste, folosite îndeosebi pentru a strica reputaţia cuiva sau a fabrica ştiri false.