Universul metadatelor, într-o impresionantă reprezentare a Royal Society. Valorile sunt exprimate în petabytes, un petabyte fiind egal cu un milion de gigabytes. Sursa foto: royalsociety.org

Raportul anual despre tehnologie al Royal Society din Marea Britanie explică avântul pe care l-a luat în ultimii ani inovația în domeniul Machine Learning − acea tehnologie care permite sistemelor computerizate să analizeze uriașe seturi de date și să genereze apoi soluții bazate pe "propria experiență".

Cunoscută încă din anii '50, tehnologia Machine Learning a stagnat aproape șase decenii. Ceea ce a determinat această schimbare este explozia cantității de informații disponibile, care poate hrăni la nesfârșit nevoia de învățare a computerelor.

Se estimează că 90% dintre informațiile de la nivel global au fost generate doar în ultimii 5 ani.

Dacă, până de curând, anumite sisteme se zbăteau să obțină o oarecare acuratețe a sarcinilor, acum rezultatele pot depăși capacitățile omului. Există sisteme de recunoaștere vocală sau de recunoaștere a obiectelor care îndeplinesc o sarcină mai temeinic decât o face un individ. (Fragment din raportul Machine Learning - Puterea și promisiunile computerelor care învață din exemple)

Abordarea tradițională a programării avea la bază o serie de coduri stricte, care indicau cum trebuie să fie rezolvată o problemă, pas cu pas.

În sistemul Machine Learning , mai întâi se fixează o sarcină, iar apoi este încărcată o mare cantitate de informații cu rol de exemple (training data), din care mașinăria deduce cum a fost îndeplinită sarcina respectivă.

Sistemul învață astfel care e cea mai bună modalitate de a rezolva misiunea care i-a fost trasată.

Aflată la intersecția dintre programare, statistică și știința informației, Machine Learning e un fel de preambul al Inteligenței Artificiale − care-și propune să creeze tehnologii inteligente.

Potrivit raportului dat publicității de Royal Society, mai puțin de 10% din populație înțelege cum funcționează și ce este Machine Learning, cu toate că cei mai mulți dintre noi îi folosim zilnic aplicațiile.

O facem, de pildă, pe Facebook, când un instrument de acest tip recunoaște figurile prietenilor pe care vrem să-i "tăguim". O facem când folosim asistentul personal de pe smartphone sau când navigăm printr-un magazin online în funcție de recomandările sistemului - care ne deprinde foarte repede obiceiurile de consum.

În anumite domenii s-au produs adevărate explozii ale seturilor de exemple disponibile pe care sistemele de Machine Learning se pot perfecționa.

Spre exemplu, cercetători de la Google au "antrenat" un calculator să recunoască fotografii cu pisici, pe baza materialului de pe Youtube.

Puteți face aici testul personal, iar apoi să vă comparați viteza cu cea a computerului, care se achită de sarcină chiar dacă imaginile sunt deformate.

Cum funcționează tagging-ul?

Facebook folosește un instrument de Machine Learning capabil să recunoască figurile persoanelor, în funcție de interacțiunile noastre din social media. Imaginilor le sunt asociate informații numerice sau simbolice, astfel că, odată ce am urcat o fotografie pe internet, ni se sugerează că în ea apare cutare sau cutare persoană.

Dar recunoașterea vocală?

Procesarea limbajului și recunoașterea vocală înseamnă potrivirea sunetelor din vorbirea umană cu cuvinte sau fraze care au fost învățate dinainte. Dificultatea provine din a distinge între diferitele amprente audio ale acestor sunete.

Odată ce au fost identificate cuvintele, acestea pot fi transcrise sau, dacă e vorba de un asistent virtual, vor fi puse în practică. Acuratețea acestor sisteme era destul de proastă până de curând, însă acum sunt capabile să perceapă inclusiv intențiile omului, după undele sonore pe care le detectează.

Machine Learning reprezintă în acest moment cel mai de succes efect al creșterii spectaculoase a volumului de informații disponibile, recoltate prin intermediul internetului. Ar putea să ne sporească productivitatea, făcând ca serviciile publice să devină mai eficiente, și ar putea duce la inventarea unor servicii croite în funcție de nevoile individului.

Tocmai pentru că deține această putere, este momentul să ridicăm întrebări despre noile metode în care sunt folosite datele și despre rolul calculatoarelor inteligente în societatea. Și tocmai pentru că scala potențialelor avantaje ale acestei tehnologii este atât de mare, dar și tot mai invazivă, este timpul să ne asigurăm că va fi dezvoltată într-o manieră care să nu afecteze încrederea publicului.

Fragment din Raportul Royal Society, 2017