Amazon kiristää tekoälykiihdyttimien kilpailua tuomalla markkinoille uuden Trainium3-piirin, jonka tarkoitus on tarjota suurille asiakkaille edullisempi vaihtoehto Nvidian hallitsemille AI-siruille osassa laskentatehtäviä​.

Amazonin tytäryhtiö Amazon Web Services (AWS) esitteli Trainium3-piirin yhtiön vuosittaisessa re:Invent-tapahtumassa Las Vegasissa. Yhtiön mukaan uusi siru on noin neljä kertaa aiempaa sukupolvea nopeampi ja yli neljä kertaa energiatehokkaampi, kun sitä käytetään generatiivisen tekoälyn mallien kouluttamiseen ja ajamiseen AWS:n omissa Trn3 UltraServer -järjestelmissä.

Trainium3 on Amazonin ensimmäinen kolmen nanometrin prosessilla valmistettu tekoälypiiri, ja se on suunniteltu erityisesti suurten, niin sanottujen frontier-mallien koulutukseen ja monimutkaisiin päättely- ja videotehtäviin pilviympäristössä.

​”Trainium on jo nyt miljardien dollarien liiketoiminta ja kasvaa edelleen todella nopeasti”, Amazon Web Servicesin toimitusjohtaja Matt Garman sanoi tiistaina re:Invent-tapahtumassa.

Sirun tekniset ominaisuudet korostavat skaalaa ja muistia, jotka ovat kriittisiä suurille kieli- ja multimodaalimalleille. ​

AWS markkinoi Trainium3:a ennen kaikkea hinnan ja energiatehokkuuden kautta. Yhtiön mukaan uudet UltraServerit tarjoavat yli nelinkertaisen suorituskyvyn ja yli nelinkertaisen energiatehokkuuden aiempiin Trainium2-järjestelmiin verrattuna, mikä näkyy yhtiön viestinnässä ”parhaana hinta-teho-suhteena” suurten mallien koulutuksessa Bedrock-palvelussa.

AWS:n Bedrock on Amazon Web Servicesin hallinnoitu generatiivisen tekoälyn palvelu, jonka kautta yritykset voivat käyttää erilaisia suuria kieli- ja muita perustamalleja yhden rajapinnan kautta. Palvelu tarjoaa valikoiman malleja sekä Amazonilta että ulkopuolisilta toimijoilta ja mahdollistaa niiden räätälöinnin omalla datalla esimerkiksi hienosäädön ja RAG-tyyppisten ratkaisujen avulla.

Bedrockiin on paketoitu myös työkaluja agenttien rakentamiseen, tietolähteiden liittämiseen ja sisällön turvallisuus- ja hallintaparametrien säätämiseen, joten sillä voi rakentaa tuotantokelpoisia generatiivisen tekoälyn sovelluksia ilman, että kehittäjän tarvitsee hallita taustalla olevaa infrastruktuuria.

AWS:n tavoitteena on leikata suurten asiakkaiden koulutus- ja päättelykustannuksia sekä parantaa datakeskusten tehonkulutuksen hallintaa tilanteessa, jossa tekoälykuormat kasvattavat energiatarvetta nopeasti​.

Uusi siru on osa Amazonin tekoälystrategiaa

Trainium-sarja on nousemassa merkittäväksi liiketoiminnaksi Amazonille. AWS-johto on kuvannut Trainium-pohjaista tekoälyliiketoimintaa jo monen miljardin dollarin kokoiseksi ja nopeasti kasvavaksi, kun suuret asiakkaat kuten Anthropic siirtävät seuraavan sukupolven mallien koulutusta yhä enemmän Amazonin omaan piiriin perustuviin klustereihin.

Samalla AWS jatkaa silti tiivistä yhteistyötä Nvidian kanssa ja tilaa edelleen suuria määriä GPU-kiihdyttimiä, mutta viestii selvästi haluavansa tarjota omalle ekosysteemilleen vaihtoehtoisen, vertikaalisesti integroidun polun tekoälylaskentaan.​

Uusi siru on kytketty suoraan Amazonin laajempaan tekoälystrategiaan, joka ulottuu infrastruktuurista sovellustasolle. Trainium3 toimii Bedrock-alustan nopeimpana kiihdyttimenä, ja sitä käytetään sekä mallien koulutukseen että suurivolyymiseen token-tuotantoon agenttipohjaisissa ja multimodaalisissa sovelluksissa.

Ratkaisu on suunnattu erityisesti suurille yrityksille, jotka hakevat kustannustehokasta vaihtoehtoa Nvidian huippukiihdyttimien rajallisesti saatavilla olevalle kapasiteetille ilman, että he luopuvat hyperskaalan pilvi-infrastruktuurin eduista.​

Onko Trainium3 uhka Nvidialle?

Trainium3 on ennen kaikkea strateginen, ei välitön, uhka Nvidialle. Trainium3 painaa erityisesti hintaa ja marginaaleja, mutta ei vielä Nvidian markkina-asemaa tai ekosysteemiä.

AWS arvioi, että uudet Trainium-sukupolvet voivat laskea mallien koulutus- ja inferenssikustannuksia jopa noin puoleen järjestelmistä, jotka käyttävät vastaavan tason GPU:ita, mikä tekee niistä houkuttelevia kustannusherkille yrityksille. Tämä osuu suoraan Nvidian hinnoitteluvoimaan suurimmassa asiakassegmentissä: hyperskaalaajissa, jotka ostavat tai vuokraavat satojen tuhansien piirien kapasiteetteja.

Lisäksi kyse ei ole vain yksittäisestä piiristä vaan laajemmasta trendistä, jossa isot pilvipalvelut, Amazonin lisäksi Google ja Microsoft, rakentavat omia kiihdyttimiään vähentääkseen riippuvuutta Nvidiasta.

Lyhyellä tähtäimellä Trainium3 ei kuitenkaan horjuta Nvidian ydinvahvuutta: CUDA-ekosysteemiä ja ohjelmistopinoa, joka on rakentunut vuosikymmenessä lähes standardiksi tekoälykehittäjille.

Siirtyminen Nvidian GPU:ista Trainiumiin vaatii usein mallien ja työkaluketjujen mukauttamista, mikä on monille kehittäjille ja startupeille riittävän suuri kitka jatkamaan Nvidian käytöllä, etenkin kun suorituskyky- ja kustannuserot eivät ole kaikissa kuormissa yksiselitteisesti Trainiumin eduksi.

Markkinaosuuksissa Nvidialla on edelleen ylivoimainen asema: arviot asettavat sen tekoälykiihdyttimissä reilusti yli 70 prosentin osuuteen, kun AWS:n omat piirialustat jäävät yksinumeroisiin lukuihin.

Lue myös tämä: Mahtiseitsikon tuloskasvu näyttää edelleen lupaavalta