Amazon lanseaza Trainium, un chip special pentru machine learning
Recent, gigantii de la Amazon au dezvaluit arma secreta a inteligentei artificiale din timpurile noastre. AWS Trainium este un chip facut special pentru machine learning in cloud, care se vrea a fi accesibil ca pret si sa ofere in acelasi timp si performante considerabile.
Chip-ul vine ca un „profet”, lansandu-se putin mai devreme fata de Elastic Compute Cloud (EC2), instantele dedicate exclusiv machine learning-ului si rezultatul colaborarii dintre Amazon si Intel, cu ale sale procesoare Habana Gaudi (pe care si le-au insusit de la Habana Labs pentru suma de doua miliarde de dolari).
Reprezentantii Amazon afirma ca Trainium ofera mai multi teraflopi decat orice alta instanta de machine learning in cloud. Ca o mica explicatie, teraflopii se refera la puterea de procesare a unui chip. Asadar, un teraflop echivaleaza cu un trilion de calcule efectuate intr-o secunda.
Trainium va fi disponibil in a doua jumatate a lui 2021, in SageMaker (AWS), platforma pentru machine learning development creata de Amazon. Chip-ul va fi compatibil cu framework-uri populare, precum TensorFlow (Google), PyTorch (Facebook) si MxNet. In plus, Trainium va folosi Neuron SDK, la fel ca Inferentia, chip-ul custom, creat de companie pentru machine learning inference.
Pe blogul AWS, se mentioneaza ca „Trainium va oferi cea mai mare performanta si cele mai mici costuri in ceea ce priveste machine learning training in cloud, la fel cum Inferentia s-a ocupat de gestionarea economiei pentru machine learning inference, care reprezinta 90% din intregul cost al infrastructurii ML.”
Amazon nu a prezentat niciun rezultat de pe urma benchmark-urilor, deci nu se stie daca Trainium este mai bun sau mai slab decat tensor processing units (TPUs), creatiile rivalilor de la Google si gazduite de Google Cloud Platform.
Amazon si piata AI
Amazon pune accentul pe economie dintr-un motiv destul de important, exemplificat de rezultatele unor studii. MIT estimeaza ca machine learning-ul va ajunge curand intr-un impas, confruntandu-se cu limitele puterii de procesare. Un alt studiu arata ca softul de detectare al stirilor false (asa-zisele clickbaits), dezvoltat in cadrul Universitatii din Washington, i-a costat pe cercetatori 25 de mii de dolari pentru doar doua saptamani de training. OpenAI a investit 12 milioane de dolari in GPT-3, iar Google a spart din prima aproape 7 mii de dolari pentru fazele initiale ale lui BERT, un transformer bidirectional.
Cei de la Amazon au fost destul de interesati de sectorul inteligentei artificiale, investind constant in solutii istete. Se estimeaza ca piata globala de ML va atinge aproape 21 de miliarde de dolari in anul 2024. Luna trecuta, compania a anuntat ca nu se vor mai concentra atat de mult pe AI-urile Alexa si Rekognition, preferand sa isi indrepte atentia catre machine learning-ul bazat pe chipset-ul Inferentia.