Digio infrastruktura

Modeli AI & GPE

Zaženite agente na upravljanih mejnih modelih že danes – ali najemite zmogljivost GPE, razporedite lastne uteži in usmerite naloge Digio na zasebne končne točke v istem delovnem prostoru.

Claude, GPT, Dvojčka Izbira modela na agenta Najem GPE & BYOM
Upravljani modeli

Modeli, ki so danes na voljo v Digiu

Dodelite privzeti model na agenta ali preglasite na opravilo. Poraba se meri v žetonih Digio iz stanja vašega načrta – iste denarnice, ne glede na to, ali agent kliče Sonnet, GPT-4o ali Gemini Flash.

Antropični Claude

  • Claude Opus 4.7 Vodilno sklepanje, dolg kontekst, arhitektura in strateško delo.
  • Claude Opus 4.6 Opus prejšnje generacije za stabilno visokokakovostno analizo.
  • Claude Sonnet 4.6 Vsakodnevni voznik – kodiranje, pisanje in zanke agenta v več korakih.
  • Claude Sonnet 4.5 / 4 Hitri nivoji Sonnet s hitrim predpomnjenjem pri podprtih delovnih obremenitvah.
  • Claude Haiku 4.5 Osnutki z nizko zakasnitvijo, klasifikacija in obsežna podnaloga.

Prevedi dobesedno: OpenAI

  • GPT-5.5 / GPT-5.4 / GPT-5.2 Najnovejša družina GPT-5 za splošne in posredniške delovne obremenitve.
  • GPT-4.1 & GPT-4o Zanesljiv multimodalni klepet in uporaba orodja za proizvodne agente.
  • GPT-4o mini Stroškovno učinkovito usmerjanje za povzetke in lahke korake.
  • o3 / o3-pro / o3-mini / o4-mini Na sklepanje osredotočeni modeli za matematiko, načrtovanje in preverjanje.
  • GPT-5.3 Codex & Codex mini Generiranje kode, refaktorji in sposobnosti agenta, ki poznajo repo.

Prevedi dobesedno: Google Gemini

  • Gemini 2.5 Pro Raziskovanje dolgega konteksta in strukturirano pridobivanje.
  • Gemini 2.5 Flash Visoko zmogljivi posredniški koraki s konkurenčnimi cenami žetonov.
  • Gemini 2.0 Flash Izjemno hitri prehodi za razčlenjevanje, označevanje in paketna opravila.

Odprti in specializirani API-ji

  • DeepSeek Chat & Reasoner Velika vrednost za naloge v slogu klepeta in razmišljanja.
  • Mistral Large Možnost gostovanja v Evropi za večjezične ekipe agentov.
  • Llama 3.3 70B Model razreda odprtih uteži prek API-ja—dobro se ujema z zasebnim GPE-jem.
  • Grok 3 Realnočasovni model za agente za spremljanje novic in družbenih omrežij.
  • Sonar Pro Odgovori za raziskovalce, ki temeljijo na iskanju.
  • Command R+ RAG prijazni podjetniški klepet in poteki dela za iskanje.

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

Uporaba

Kako agenti izberejo model

Koordinator lahko priporoči Sonnet v primerjavi z Opusom v primerjavi s cenejšim modelom flash glede na vrsto naloge. Izkušeni uporabniki nastavijo privzete vrednosti za vlogo agenta – raziskava na Sonnetu, končni pregled na Opusu, množično označevanje na Haiku ali Gemini Flash.

  • Per agent — default model in agent settings; override in To do or chat when needed.

  • Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).

  • Skills stay the same — tools and integrations work across models; only latency and cost profile change.

  • Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

Najem GPU

Izposodite si GPE in zaženite svoje modele

Potrebujete natančno nastavitev, zračno kontrolno točko ali predvidljivo sklepanje cen? Dodajte namensko zmogljivost GPE v svoj delovni prostor Digio, namestite strežniški sklad, ki vam je ljubši, in usmerite agente na svojo zasebno končno točko.

Namenski primerki

Urna ali mesečna vozlišča GPU (razred A100, H100, L40S), pritrjena na vašega najemnika – izolirana od drugih strank.

Vaše teže

Naložite varovalke, GGUF ali potegnite iz svojega registra; zaženite Llama, Mistral, Qwen in natančne nastavitve po meri.

Standardna porcija

vLLM, TGI, Ollama ali slike vsebnika, ki jih vzdržujete – agenti Digio kličejo osnovni URL, združljiv z OpenAI.

Ista orkestracija

Opravila, skupinski klepet, veščine in sodelovanje nespremenjeni – vaše je le zaledje sklepanja.

Hibridno usmerjanje

Pošljite občutljive korake v zasebni GPE in uporabite Claude ali GPT za javne raziskave v enem delovnem procesu.

Kontrole podjetja

VPC peering, statični izstop, revizijski dnevniki in seznami dovoljenih modelov za regulirane ekipe.

Prinesite svoj model

Namestite in povežite model po meri

Tipična nastavitev od nič do agentov, ki kličejo vašo končno točko:

  1. Rezervni GPU

    Izberite VRAM, regijo in čas delovanja (burst ali vedno vklopljen). Shramba za uteži se pošlje skupaj s primerkom ali namesti vašo vedro.

  2. Razporedite sklad

    Zaženite strežniško sliko ali SSH, namestite gonilnike CUDA in naložite kontrolne točke. Zdravstveni pregledi potrjujejo, da je model pripravljen.

  3. Registrirajte končno točko

    V nastavitvah delovnega prostora dodajte osnovni URL, ključ API in ID modela. Digio preveri zakasnitev in obliko žetona, preden začne delovati.

  4. Dodeli agentom

    Izberite svoj zasebni model kot privzeti za izbrane agente; upravljani modeli Claude/GPT ostajajo na voljo drug ob drugem.

Najem GPE se zaračunava ločeno od naročnin na paket Digio. Obrnite se na nas za načrtovanje zmogljivosti, SLA in selitev iz obstoječe inferenčne gruče.

pogosta vprašanja

Vprašanja o modelih in GPU

Izbira upravljanih API-jev v primerjavi s samogostiteljskim sklepanjem na Digiu.

Ali plačam dvakrat – načrt plus API?

Vaša naročnina na Digio zajema infrastrukturo, agente in vključene žetone Digio. Upravljani model uporabe bremeni to stanje žetonov z dejanskimi vhodnimi/izhodnimi žetoni. Najem GPE je dodatek za stroje, ki jih nadzorujete.

Ali lahko različni agenti uporabljajo različne modele?

Da—vsak agent ima lahko svojo privzeto vrednost. Opravila in klepeti lahko preglasijo za en sam zagon, ne da bi spremenili globalno privzeto.

Kakšna je razlika med sonetom in opusom?

Opus je uglašen za trše sklepanje in daljše koherentne načrte; Sonnet je hitrejši in cenejši za vsakodnevne agentske zanke. Haiku in modeli razreda flash so najboljši za obseg podopravil.

Ali lahko izvajam samo svoj model in blokiram API-je v oblaku?

Delovni prostori podjetja lahko omejijo odhodne ponudnike modelov in usmerijo ves promet posrednikov na vašo končno točko GPE. Hibridni način je privzet za večino ekip.

Katere velikosti GPE so na voljo?

Ponudbe so odvisne od regije in povpraševanja – običajno ravni 24–80 GB VRAM za modele razreda 7B–70B in vozlišča z več grafičnimi procesorji za večje nize. Pomagamo pri določanju velikosti VRAM-a glede na vaše število parametrov in kvantizacijo.

Ali zasebna uporaba GPU še vedno porablja žetone Digio?

Orkestracija (agenti, naloge, shranjevanje) ostane v vašem načrtu. Sklepanje o vašem GPE se zaračuna kot čas GPE; po želji lahko merite uporabo v obliki žetona za interno povračilo.

Izberite upravljane modele ali prinesite svoj GPE

Začnite s Claudom in GPT danes, nato dodajte namenski GPE, ko boste pripravljeni gostiti uteži po meri – isti agenti, iste naloge, vaše sklepanje.