Jaunākais Claude 4.5 — Claude Haiku 4.5 spēj apsteigt sāncenšus

Tehnoloģiju uzņēmums Anthropic ir laidis klajā jaunu, iespaidīgu modeli savā Claude 4 saimē — Claude Haiku 4.5. Šis jaunievedums tiek dēvēts par ātrāko un izmaksu ziņā efektīvāko modeli, kāds jebkad radīts, apsteidzot savus priekšgājējus gan ātruma, gan cenas ziņā. Anthropic piedāvā šo modeli par 1 ASV dolāru par miljonu ievades “tokenu” (datu vienību) un 5 miljoniem izejas “tokenu”, padarot to par pievilcīgu risinājumu daudziem izstrādātājiem.

Izcilība kodēšanā un lēmumu pieņemšanā

Iespaidīgākais ir tas, ka Haiku 4.5 demonstrē rezultātus, kas ir gandrīz pielīdzināmi daudz jaudīgākajam modelim Sonnet 4.5, īpaši programmēšanas un loģiskās domāšanas uzdevumos. Tas darbojas ievērojami ātrāk un ir trīs reizes lētāks nekā tā lielākais brālis. Anthropic īpaši uzsver, ka Haiku 4.5 ir ideāli piemērots mākslīgā intelekta (MI) pārvaldīšanai čatbotu un palīgu veidolā, kā arī pāra programmēšanai, kur divi programmētāji strādā kopā pie viena uzdevuma.

Veiktspējas mērījumi un salīdzinājums

Modeļa spējas programmatūras izstrādes jomā ir apliecinātas ar augstiem rezultātiem. Claude Haiku 4.5 ieguva 73,3% punktu SWE-bench Verified — plaši izmantotā datu kopā programmatūras izstrādes iespēju testēšanai. Lai gan tas nedaudz atpaliek no iepriekšējā testa rezultāta 77,2%, ko uzrādīja Sonnet 4.5, atšķirība ir minimāla, ņemot vērā Haiku 4.5 ātrumu un zemāko cenu. Tas ir kā veiklajam sprinterim, kurš tikko sasniedzis finiša līniju, kamēr lielākais konkurents vēl uzkarsē.

Viedāka aģentu pārvaldība un drošība

Haiku 4.5 izceļas arī ar uzlabotām spējām pārvaldīt apakš-aģentus. Tas nozīmē, ka vairāki mazāki MI modeļi var efektīvi sadarboties, lai veiktu sarežģītas uzdevumu kopas. Piemēram, Sonnet 4.5 varētu pārraudzīt sarežģītu projektu plānošanu, deleģējot atsevišķus aprēķinus vai apakšuzdevumus vairākiem Haiku 4.5 eksemplāriem, tādējādi paātrinot kopējo procesa gaitu.

Anthropic arī demonstrē ievērojamu progresu drošības jomā. Haiku 4.5 ir radījis mazāk noviržu no “izlīdzinājuma” principiem nekā iepriekšējie modeļi un citi Claude 4 saimes pārstāvji. Lai gan lielākiem modeļiem, piemēram, Sonnet 4.5 un Opus 4.1, joprojām tiek piemērots stingrāks drošības standarts AI Safety Level 3 (ASL-3), Haiku 4.5 ir sasniedzis AI Safety Level 2 (ASL-2) klasifikāciju. Tas norāda uz būtiskiem uzlabojumiem automātiskajā drošības novērtējumā.

Drošības garantijas un pieejamība

Uzņēmums apgalvo, ka šie rezultāti padara Haiku 4.5 par drošāko modeli līdz šim. Īpaši tiek samazināts risks, ka modelis varētu tikt izmantots nelikumīgām darbībām, piemēram, ieroču vai aizliegtu vielu izstrādes instrukciju ģenerēšanai. Šī rūpīgā pieeja drošībai ir acīmredzama.

Izstrādātājiem ir iespēja izmantot Claude Haiku 4.5 jau tagad, piekļūstot tam caur Claude API, Amazon Bedrock un Google Cloud platformas VertexAI. Lai nodrošinātu vienmērīgu pāreju, ir nodrošināta atpakaļejoša saderība tiem izstrādātājiem, kuri jau izmanto Haiku 3.5 un Sonnet 4 modeļus.