{"id":100744,"date":"2026-04-27T19:10:10","date_gmt":"2026-04-27T19:10:10","guid":{"rendered":"https:\/\/www.europesays.com\/ch-de\/100744\/"},"modified":"2026-04-27T19:10:10","modified_gmt":"2026-04-27T19:10:10","slug":"google-cloud-zieht-bei-ki-kosten-die-notbremse","status":"publish","type":"post","link":"https:\/\/www.europesays.com\/ch-de\/100744\/","title":{"rendered":"Google Cloud zieht bei KI-Kosten die Notbremse"},"content":{"rendered":"<p>              Google Cloud zieht bei KI-Kosten die Notbremse<\/p>\n<p>Google Cloud erweitert sein FinOps-Portfolio um neue Funktionen f\u00fcr KI-Workloads. Im Zentrum stehen automatisierte Spend Caps, die Budgetgrenzen aktiv durchsetzen, sowie ein neuer FinOps Explainability Agent, der Kostentreiber eigenst\u00e4ndig analysiert. Damit will Google die Kontrolle \u00fcber schwer kalkulierbare KI-Kosten verbessern und den Aufwand f\u00fcr deren Analyse senken.<\/p>\n<p>        Weiterlesen nach der Anzeige<\/p>\n<p>Hintergrund ist, dass KI-Workloads die Kostenstrukturen in der Cloud ver\u00e4ndern. Statt relativ stabiler Lastprofile entstehen stark schwankende Kosten \u2013 etwa durch variable Token-Nutzung, unterschiedliche Modellpreise oder den Einsatz spezialisierter Hardware wie GPUs und TPUs. Klassische FinOps-Werkzeuge liefern hier zwar Berichte und Warnungen, greifen aber nicht direkt in den laufenden Betrieb ein.<\/p>\n<p>Spend Caps stoppen API-Verkehr automatisch<\/p>\n<p>Diese L\u00fccke sollen die neuen Spend Caps schlie\u00dfen, die Google zun\u00e4chst in einer Private Preview anbietet. Administratoren k\u00f6nnen damit Budgets auf Projektebene festlegen, die das System automatisch durchsetzt. Erreicht ein Projekt das Limit, warnt Google Cloud zun\u00e4chst und pausiert anschlie\u00dfend den API-Verkehr. Die zugrunde liegenden Ressourcen bleiben dabei erhalten. Wer den Betrieb fortsetzen will, passt das Spend Cap an oder hebt es auf. Unterst\u00fctzt werden zun\u00e4chst Google AI Studio, die Gemini Enterprise Agent Platform als Weiterentwicklung von Vertex AI, Cloud Run, Cloud Run Functions sowie die Maps APIs.<\/p>\n<p>Der Nutzen zeigt sich vor allem bei experimentellen KI-Workloads. Ein fehlerhafter Prompt-Loop oder eine unoptimierte Inferenz-Pipeline kann innerhalb kurzer Zeit Millionen API-Aufrufe und entsprechend hohe Kosten verursachen. Spend Caps greifen in solchen F\u00e4llen automatisch ein, ohne dass ein Mensch h\u00e4ndisch reagieren muss.<\/p>\n<p>Explainability Agent analysiert Kostentreiber<\/p>\n<p>Erg\u00e4nzend f\u00fchrt Google den FinOps Explainability Agent ein, der direkt in das Billing-System integriert ist. Der Agent analysiert eigenst\u00e4ndig, welche Faktoren die Kosten von KI-Workloads treiben, und liefert Auswertungen auf Zuruf. Nutzer k\u00f6nnen zum Beispiel fragen, wie sich die Kosten zwischen Gemini 1.5 Pro und Gemini 1.5 Flash verteilen, welche API-Keys besonders teuer sind oder wie hoch der Anteil von Input- und Output-Tokens an den Gesamtkosten ausf\u00e4llt.<\/p>\n<p>Solche Auswertungen sind n\u00f6tig, weil sich KI-Kosten zwar formal als Produkt aus Menge und Preis beschreiben lassen, die Einflussgr\u00f6\u00dfen aber stark fragmentiert sind. Neben dem Request-Volumen spielen Token-Zahlen, Fehlerraten, Speicherzugriffe und Modellwechsel eine Rolle. Der Explainability Agent korreliert diese Faktoren automatisch und soll so die Ursachenanalyse beschleunigen \u2013 etwa bei unerwarteten Kostenanstiegen oder zur Bewertung des Return on Investment einzelner KI-Projekte.<\/p>\n<p>        Weiterlesen nach der Anzeige<\/p>\n<p>Mehr Transparenz bei Billing und Vertr\u00e4gen<\/p>\n<p>Daneben k\u00fcndigt Google erweiterte Billing-Hierarchien und ein Reporting f\u00fcr Vertragszusagen an. Die neuen Hierarchien sollen Ausgaben \u00fcber mehrere Abrechnungskonten hinweg zusammenf\u00fchren, einschlie\u00dflich sogenannter Other Eligible Services \u2013 also zus\u00e4tzlicher Produktfamilien, die Google in Enterprise-Vertr\u00e4gen neben den eigentlichen Cloud-Diensten ber\u00fccksichtigt, etwa Apigee, AppSheet, Looker, Workspace-Produkte, Mandiant oder VirusTotal. Das ebenfalls zun\u00e4chst als Private Preview angek\u00fcndigte Commitment Reporting soll zudem sichtbar machen, wie schnell Kunden ihre Commitments innerhalb eines Enterprise Agreements verbrauchen.<\/p>\n<p>Der FinOps Explainability Agent steht laut <a href=\"https:\/\/cloud.google.com\/blog\/topics\/cost-management\/introducing-spend-caps-ai-cost-visibility-next26\" rel=\"nofollow noopener\" target=\"_blank\">Googles Ank\u00fcndigung<\/a> bereits in der Cloud Console bereit. Spend Caps sowie die erweiterten Billing- und Reporting-Funktionen sind zun\u00e4chst nur in einer Private Preview verf\u00fcgbar, f\u00fcr die sich Kunden anmelden k\u00f6nnen.<\/p>\n<p>        Lesen Sie auchMehr anzeigenWeniger anzeigen<\/p>\n<p>(<a class=\"redakteurskuerzel__link\" href=\"https:\/\/www.heise.de\/news\/mailto:fo@heise.de\" title=\"Moritz F\u00f6rster\" rel=\"nofollow noopener\" target=\"_blank\">fo<\/a>)<\/p>\n<p>\n      Dieser Link ist leider nicht mehr g\u00fcltig.\n    <\/p>\n<p>Links zu verschenkten Artikeln werden ung\u00fcltig,<br \/>\n      wenn diese \u00e4lter als 7\u00a0Tage sind oder zu oft aufgerufen wurden.\n    <\/p>\n<p>Sie ben\u00f6tigen ein heise+ Paket, um diesen Artikel zu lesen. Jetzt eine Woche unverbindlich testen \u2013 ohne Verpflichtung!<\/p>\n","protected":false},"excerpt":{"rendered":"Google Cloud zieht bei KI-Kosten die Notbremse Google Cloud erweitert sein FinOps-Portfolio um neue Funktionen f\u00fcr KI-Workloads. Im&hellip;\n","protected":false},"author":2,"featured_media":100745,"comment_status":"","ping_status":"","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[14],"tags":[26759,57,46,16634,52,51,26760,5482,25668,622,623,53,56,45,44,55,54,176],"class_list":{"0":"post-100744","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-unternehmen-maerkte","8":"tag-api","9":"tag-business","10":"tag-ch","11":"tag-cloud-computing","12":"tag-companies","13":"tag-companies-markets","14":"tag-finops","15":"tag-gemini","16":"tag-google-cloud","17":"tag-it","18":"tag-kuenstliche-intelligenz","19":"tag-markets","20":"tag-maerkte","21":"tag-schweiz","22":"tag-switzerland","23":"tag-unternehmen","24":"tag-unternehmen-maerkte","25":"tag-wirtschaft"},"share_on_mastodon":{"url":"https:\/\/pubeurope.com\/@ch_de\/116478247820748333","error":""},"_links":{"self":[{"href":"https:\/\/www.europesays.com\/ch-de\/wp-json\/wp\/v2\/posts\/100744","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.europesays.com\/ch-de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.europesays.com\/ch-de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/ch-de\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/ch-de\/wp-json\/wp\/v2\/comments?post=100744"}],"version-history":[{"count":0,"href":"https:\/\/www.europesays.com\/ch-de\/wp-json\/wp\/v2\/posts\/100744\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/ch-de\/wp-json\/wp\/v2\/media\/100745"}],"wp:attachment":[{"href":"https:\/\/www.europesays.com\/ch-de\/wp-json\/wp\/v2\/media?parent=100744"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.europesays.com\/ch-de\/wp-json\/wp\/v2\/categories?post=100744"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.europesays.com\/ch-de\/wp-json\/wp\/v2\/tags?post=100744"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}