Konec „jen povídání“ s AI! Gemini 2.5 Computer Use začíná opravdu pracovat za vás

Gemini 2.5 Computer Use umí klikat, psát a vyplňovat weby jako člověk. Co to znamená pro firmy? Praktické scénáře, bezpečnost a jak si to vyzkoušet?

Před pár lety, co lety, ale měsíci, týdny, jsme se umělé inteligence hlavně ptali. Dnes jí zadáme cíl a ona ho splní. Google představil Gemini 2.5 Computer Use, model, který umí otevřít prohlížeč, klikat, psát, scrollovat, vyplnit formulář, prostě dělat to, co děláme my rukama a očima. Není to plugin, není to makro. Je to digitální operátor, který „vidí“ obrazovku a jedná. 

Co přesně Computer Use umí?

V oficiální dokumentaci najdete seznam 13 podporovaných akcí – od open_web_browser, navigate, click_at, type_text_at, přes key_combination, scroll_document až po drag_and_drop. Prakticky to stačí na většinu běžné práce ve webových aplikacích: rezervace, formuláře, interní portály, helpdesky, e-shopy, administrační rozhraní. 

Klíčová pointa?

„Model nepotřebuje speciální API k vašemu nástroji. Stačí, že vidí UI a dokáže se v něm rozhodovat „jako člověk“,“ upozorňuje ve svém videu na YouTube kanále náš AI specialista a lektor, Marek Bartoš.

Bezpečnost a limity (v dobrém slova smyslu)

Google k tomu přistoupil docela přísně. Citlivé úkony (např. platby, přístup do účtů) vyžadují výslovné potvrzení a allowlist domén. Jinými slovy: „Vy určíte, kam AI může, a systém si u rizikových kroků řekne o souhlas. To chrání jak firmu, tak uživatele,“ upozorňuje uznávaný AI specialista a YouTuber Marek Bartoš.

Je to rychlé a „dost dobré“?

Veřejné testy ukazují, že Computer Use patří mezi špičku v úlohách ovládání rozhraní (benchmarky typu Mind2Web apod.). Důležitější než čísla je ale spolehlivost v praxi: model zvládá multi-krokové cíle, kontext, návrat o krok zpět a „znovu-zkusit“ – zkrátka to, co skutečně potřebujete v reálné práci. 

Určitě vás zajímá, co to znamená pro firmy. Proto jsme připravili pár reálných scénářů níže:

  • Prodej a back-office: vyhledání objednávky v portálu dopravce, stažení dokladu, nahrání do DMS.
  • Nábor a HR: procházení kariérních systémů, předvyplnění opakujících se položek, kontrola statusů.
  • E-commerce: porovnání cen konkurence v e-shopech bez API, export CSV, nahrání do vašeho BI.
  • Testování webů: klikací E2E „kouč“, který projde cesty uživatele a sepíše, kde to drhne.

Propojení s vaší realitou

Pokud například ve firmě používáte podnikový informační systém typu Helios Inuvio nebo jiný ERP a vedle toho webové portály, dopravce, marketplace… Computer Use vyplní mezeru tam, kde žádné API není. A pokud už API máte, model stejně může ušetřit hodiny manuální rutiny u doplňkových kroků „kolem“.

Jak si Gemini 2.5 Computer Use vyzkoušet (rychlý návod)?

  1. Otevřete Google AI Studio a aktivujte Computer Use (preview).  
  2. Zvolte povolené domény (allowlist) a nastavte citlivé akce tak, aby vyžadovaly potvrzení.
  3. Definujte cíl (např. „najdi a stáhni faktury za poslední měsíc z portálu XY“).
  4. Spusťte běh: model si sám otevírá okna, naviguje, píše, kliká.
  5. Logy a opakování: když narazí, ví proč. Upravíte pokyn a jedete znovu—rychleji.

Tip:

Computer Use je dostupný jak v AI Studio, tak v Vertex AI pro podnikové nasazení. Pokud máte přísná IT pravidla, počítejte s allowlisty a auditovatelností kroků. 

A s čím do toho vstupujeme my s coalbrainem?

  • Online kurzy a workshopy: naučíme vás navrhovat úkoly pro agenty tak, aby skutečně doručovali výsledky – ne „hezké demo“.
  • AI asistenti na míru: stavíme agentní řešení, která propojují Computer Use s vašimi procesy (a s tím, co už používáte).
  • Hotové AI nástroje:
Přestaňte jen chatovat. Naučte se stavět vlastní AI agenty a automatizace v nástrojích jako Make.com, které budou pracovat za vás.

V praxi to vypadá asi takhle:

„Agent si projde vaše webové portály, stáhne podklady, přepíše a zkontroluje faktury, a nakonec vše vhodně vloží do systému. Vy dostanete „hotovo“ místo čtyř rozkliknutých tabů,“ vysvětluje Marek Bartoš.

Co si z dnešní AI novinky odnést?

  • AI, která jen odpovídá, je minulostí!
  • AI, která koná, je současnost. Gemini 2.5 Computer Use je přesně ten krok – z chatu do akce.  

Chcete si to opravdu osahat na vlastních procesech a ne na generickém příkladu? Mrkněte na naše kurzy a AI asistenty – připravíme pro vás funkční scénář od A do Z, včetně měření přínosu.

Diskuze

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Přejít nahoru