Ktoś zostawił klucz API OpenAI w publicznym repozytorium na GitHubie. Nie specjalnie — po prostu wcisnął commit z plikiem .env i zapomniał dodać go do .gitignore. Boty skanujące GitHub wyłapały klucz w ciągu minut. Tydzień później rachunek wynosił ponad 3000 dolarów.
To nie jest wymyślona historia. To standardowy scenariusz, który powtarza się regularnie w społeczności AI. I nie dotyczy tylko programistów — właściciele firm, marketerzy i konsultanci konfigurujący automatyzacje też popełniają te błędy.
Dobra wiadomość: większości z tych problemów można uniknąć kilkoma prostymi krokami. Piszę o tym co faktycznie stosuję i co polecam klientom.
Zanim zaczniesz — ustaw limity wydatków
Pierwsza rzecz, którą powinieneś zrobić po założeniu konta w OpenAI, Anthropic lub innym dostawcy: ustaw limit miesięcznych wydatków. To zajmuje 2 minuty i może uratować Cię przed nieprzyjemną niespodzianką.
OpenAI
W panelu OpenAI przejdź do Settings → Billing → Usage limits. Możesz ustawić dwa progi:
- Soft limit — dostajesz maila gdy przekroczysz kwotę. API dalej działa.
- Hard limit — API przestaje przyjmować zapytania po przekroczeniu. Zero ryzyka przekroczenia budżetu.
Ustaw hard limit na kwotę, której przekroczenie byłoby dla Ciebie bolesne. Dla większości małych firm startujących z AI to 50–200 USD miesięcznie.
Anthropic (Claude API)
W panelu Anthropic: Settings → Billing → Usage limits. Analogiczne opcje — soft i hard limit per miesiąc. Możesz też ustawić alerty dla konkretnych projektów.
Karty prepaid zamiast kredytowej
Drugi poziom zabezpieczenia finansowego: zamiast podpinać kartę kredytową z wysokim limitem, użyj wirtualnej karty prepaid. Zasilasz ją konkretną kwotą i to jest Twój absolutny limit — nawet jeśli coś pójdzie nie tak.
Dobre opcje dostępne w Polsce:
- Revolut — wirtualna karta Visa/Mastercard, możesz ustawić limit miesięczny i zamrozić kartę jednym tapnięciem
- Wise — karta wielowalutowa, wygodna dla płatności w USD bez przewalutowania
- mBank eKonto — wirtualna karta z limitem, prosta w obsłudze
Jeden klucz = jedna aplikacja
To zasada, której wiele osób nie przestrzega na początku, a później żałuje. Zamiast używać jednego klucza API do wszystkiego, generuj osobny klucz dla każdej aplikacji, skryptu lub użytkownika.
- Osobny klucz dla chatbota na stronie
- Osobny klucz dla automatyzacji Make/n8n
- Osobny klucz dla każdego pracownika
- Klucze z opisowymi nazwami w panelu
- Regularna rotacja co 90 dni
- Klucze w zmiennych środowiskowych (
.env)
- Jeden klucz do wszystkiego
- Klucz wklejony w kod źródłowy
- Klucz w repozytorium GitHub
- Klucz w mailu lub Slacku
- Klucz w plikach konfiguracyjnych bez szyfrowania
- Współdzielony klucz z zewnętrznymi firmami
Dlaczego to ważne? Jeśli masz osobne klucze, to gdy jeden wycieknie — unieważniasz tylko ten jeden. Inne aplikacje działają dalej. Jeśli masz jeden klucz do wszystkiego, wyciek to katastrofa.
Agregatory LLM — jedno miejsce, wiele modeli
Bezpośredni dostęp do API każdego dostawcy z osobna ma jeden problem: musisz zarządzać kilkoma kontami, kilkoma fakturami i kilkoma zestawami kluczy. Dla większości firm sensowniejsze jest skorzystanie z agregatora LLM — jednego miejsca, które daje dostęp do dziesiątek modeli.
Kiedy wybrać agregator?
Agregator ma sens gdy: testujesz różne modele, chcesz jednej faktury za wszystko, zależy Ci na łatwym przełączaniu między modelami bez zmiany kodu, lub budujesz produkt gdzie koszt per token jest krytyczny i chcesz wybierać najtańszy model do danego zadania.
Porównanie kosztów
| Model | Bezpośrednio | OpenRouter | Różnica |
|---|---|---|---|
| GPT-4o | $2.50 / 1M in | $2.50 / 1M in | brak |
| Claude Sonnet 4 | $3.00 / 1M in | $3.00 / 1M in | brak |
| Llama 3.3 70B | — (Meta nie sprzedaje bezpośrednio) | ~$0.20 / 1M in | tylko agregator |
| Gemini 2.0 Flash | $0.10 / 1M in | $0.10 / 1M in | brak |
Dla popularnych modeli OpenAI i Anthropic ceny są identyczne przez agregator i bezpośrednio. Agregator zarabia na własnych modelach i modelach open-source. Sprawdź CometAPI jeśli zależy Ci na tańszych modelach — różnice bywają znaczące szczególnie na mniej popularnych modelach.
Cloudflare AI Gateway — klucze bezpieczne za darmo
To prawdopodobnie najlepsze darmowe narzędzie do zarządzania kluczami AI, o którym większość użytkowników nie wie. Cloudflare AI Gateway działa jak warstwa pośrednia między Twoją aplikacją a dostawcą modelu.
Zamiast wysyłać zapytanie bezpośrednio do api.openai.com, wysyłasz je do Cloudflare. Cloudflare dodaje klucz API po swojej stronie i przekazuje zapytanie dalej. Twoja aplikacja nigdy nie widzi prawdziwego klucza.
Jak to działa w praktyce
POST https://api.openai.com/v1/chat/completions
Authorization: Bearer sk-twój-klucz-api
# Przez Cloudflare AI Gateway — klucz po stronie Cloudflare:
POST https://gateway.ai.cloudflare.com/v1/{account_id}/{gateway_name}/openai/chat/completions
cf-aig-authorization: Bearer {twój-token-cf}
Konfiguracja krok po kroku
- Załóż konto Cloudflare (jeśli nie masz) — plan Free wystarczy. Przejdź do sekcji AI → AI Gateway.
- Utwórz nowy Gateway — nadaj mu nazwę, np. "moja-firma-ai". Otrzymasz unikalny URL endpointu.
- Skonfiguruj dostawcę — dodaj klucz API OpenAI/Anthropic bezpośrednio w panelu Cloudflare, w sekcji Providers. Klucz jest szyfrowany i nie opuszcza infrastruktury Cloudflare.
- Ustaw Rate Limiting — określ maksymalną liczbę zapytań na minutę i na dzień. Ochrona przed nadużyciami nawet jeśli token CF wycieknie.
- Zmień endpoint w aplikacji — zamień URL dostawcy na URL Cloudflare Gateway. Reszta kodu bez zmian.
- Włącz Caching — identyczne zapytania mogą być serwowane z cache bez kosztowania tokenów. Przy powtarzalnych zapytaniach (np. FAQ chatbot) oszczędności mogą być znaczące.
Co zyskujesz
- Klucz API nigdy nie trafia do frontendu — nawet jeśli ktoś podejrzy kod strony, zobaczy tylko token Cloudflare
- Centralny dashboard — wszystkie zapytania, koszty i błędy w jednym miejscu
- Rate limiting — ochrona przed bombą tokenów nawet przy wycieku tokena CF
- Caching odpowiedzi — identyczne zapytania nie generują kosztów po raz drugi
- AI Security Suite — ochrona przed prompt injection i monitorowanie niebezpiecznych tematów (plan płatny)
Dobre praktyki — checklist
- Ustaw hard limit wydatków w panelu każdego dostawcy
- Podepnij kartę prepaid zamiast kredytowej z wysokim limitem
- Dodaj
.envdo.gitignorezanim zrobisz pierwszy commit - Generuj osobny klucz dla każdej aplikacji i nadaj mu opisową nazwę
- Skonfiguruj Cloudflare AI Gateway jako proxy dla aplikacji frontendowych
- Ustaw rate limiting — zarówno w panelu dostawcy jak i w Gateway
- Skanuj repozytoria pod kątem wycieków kluczy (GitHub Secret Scanning robi to automatycznie dla publicznych repo)
- Rotuj klucze co 90 dni lub po każdym podejrzanym incydencie
- Sprawdzaj billing dashboard raz w tygodniu przez pierwsze miesiące
- Dla aplikacji produkcyjnych rozważ Cloudflare Secrets lub HashiCorp Vault
Co zrobić gdy klucz wycieknie
Działaj natychmiast — każda minuta zwłoki to potencjalnie kolejne złote na rachunku.
- Unieważnij klucz — wejdź na panel dostawcy i usuń kompromitowany klucz. Priorytet absolutny, zajmuje 30 sekund.
- Sprawdź historię użycia — sprawdź logi za ostatnie godziny. Oszacuj skalę nadużycia.
- Skontaktuj się z supportem — OpenAI i Anthropic mają procedury dla takich przypadków. W uzasadnionych sytuacjach mogą zrefundować koszty wygenerowane przez nieuprawniony dostęp. Działaj szybko — im wcześniej zgłosisz, tym większa szansa na refund.
- Wygeneruj nowy klucz — i tym razem zabezpiecz go poprawnie.
- Sprawdź skąd wyciekł —
.envna GitHubie, kod w repozytorium, Slack, mail? Usuń klucz ze wszystkich miejsc.