Gemini 2.5 Computer Use umí klikat, psát a vyplňovat weby jako člověk. Co to znamená pro firmy? Praktické scénáře, bezpečnost a jak si to vyzkoušet?
Před pár lety, co lety, ale měsíci, týdny, jsme se umělé inteligence hlavně ptali. Dnes jí zadáme cíl a ona ho splní. Google představil Gemini 2.5 Computer Use, model, který umí otevřít prohlížeč, klikat, psát, scrollovat, vyplnit formulář, prostě dělat to, co děláme my rukama a očima. Není to plugin, není to makro. Je to digitální operátor, který „vidí“ obrazovku a jedná.
Co přesně Computer Use umí?
V oficiální dokumentaci najdete seznam 13 podporovaných akcí – od open_web_browser, navigate, click_at, type_text_at, přes key_combination, scroll_document až po drag_and_drop. Prakticky to stačí na většinu běžné práce ve webových aplikacích: rezervace, formuláře, interní portály, helpdesky, e-shopy, administrační rozhraní.
Klíčová pointa?
„Model nepotřebuje speciální API k vašemu nástroji. Stačí, že vidí UI a dokáže se v něm rozhodovat „jako člověk“,“ upozorňuje ve svém videu na YouTube kanále náš AI specialista a lektor, Marek Bartoš.
Bezpečnost a limity (v dobrém slova smyslu)
Google k tomu přistoupil docela přísně. Citlivé úkony (např. platby, přístup do účtů) vyžadují výslovné potvrzení a allowlist domén. Jinými slovy: „Vy určíte, kam AI může, a systém si u rizikových kroků řekne o souhlas. To chrání jak firmu, tak uživatele,“ upozorňuje uznávaný AI specialista a YouTuber Marek Bartoš.

Je to rychlé a „dost dobré“?
Veřejné testy ukazují, že Computer Use patří mezi špičku v úlohách ovládání rozhraní (benchmarky typu Mind2Web apod.). Důležitější než čísla je ale spolehlivost v praxi: model zvládá multi-krokové cíle, kontext, návrat o krok zpět a „znovu-zkusit“ – zkrátka to, co skutečně potřebujete v reálné práci.
Určitě vás zajímá, co to znamená pro firmy. Proto jsme připravili pár reálných scénářů níže:
- Prodej a back-office: vyhledání objednávky v portálu dopravce, stažení dokladu, nahrání do DMS.
- Nábor a HR: procházení kariérních systémů, předvyplnění opakujících se položek, kontrola statusů.
- E-commerce: porovnání cen konkurence v e-shopech bez API, export CSV, nahrání do vašeho BI.
- Testování webů: klikací E2E „kouč“, který projde cesty uživatele a sepíše, kde to drhne.
Propojení s vaší realitou
Pokud například ve firmě používáte podnikový informační systém typu Helios Inuvio nebo jiný ERP a vedle toho webové portály, dopravce, marketplace… Computer Use vyplní mezeru tam, kde žádné API není. A pokud už API máte, model stejně může ušetřit hodiny manuální rutiny u doplňkových kroků „kolem“.
Jak si Gemini 2.5 Computer Use vyzkoušet (rychlý návod)?
- Otevřete Google AI Studio a aktivujte Computer Use (preview).
- Zvolte povolené domény (allowlist) a nastavte citlivé akce tak, aby vyžadovaly potvrzení.
- Definujte cíl (např. „najdi a stáhni faktury za poslední měsíc z portálu XY“).
- Spusťte běh: model si sám otevírá okna, naviguje, píše, kliká.
- Logy a opakování: když narazí, ví proč. Upravíte pokyn a jedete znovu—rychleji.
Tip:
Computer Use je dostupný jak v AI Studio, tak v Vertex AI pro podnikové nasazení. Pokud máte přísná IT pravidla, počítejte s allowlisty a auditovatelností kroků.
A s čím do toho vstupujeme my s coalbrainem?
- Online kurzy a workshopy: naučíme vás navrhovat úkoly pro agenty tak, aby skutečně doručovali výsledky – ne „hezké demo“.
- AI asistenti na míru: stavíme agentní řešení, která propojují Computer Use s vašimi procesy (a s tím, co už používáte).
- Hotové AI nástroje:
- Přepis schůzek → z audio záznamu rovnou akční úkoly a sumarizace.
- Zpracování faktur → vytažení dat, kontrola a zařazení bez ručního přepisování.

V praxi to vypadá asi takhle:
„Agent si projde vaše webové portály, stáhne podklady, přepíše a zkontroluje faktury, a nakonec vše vhodně vloží do systému. Vy dostanete „hotovo“ místo čtyř rozkliknutých tabů,“ vysvětluje Marek Bartoš.
Co si z dnešní AI novinky odnést?
- AI, která jen odpovídá, je minulostí!
- AI, která koná, je současnost. Gemini 2.5 Computer Use je přesně ten krok – z chatu do akce.
Chcete si to opravdu osahat na vlastních procesech a ne na generickém příkladu? Mrkněte na naše kurzy a AI asistenty – připravíme pro vás funkční scénář od A do Z, včetně měření přínosu.