Home Rozhovory Rozhovor s Markem Daňkom: Potenciál v e-commerce je díky AI obrovský

Rozhovor s Markem Daňkom: Potenciál v e-commerce je díky AI obrovský

by Redakce
Marek Daňko - Feed Image Editor

Představte si svět, kde každý produktový obrázek je bezchybný a každá vizuální prezentace je vytvořena na míru každé online platformě. Tento svět nejspíš není daleko – díky umělé inteligenci a startupu Feed Image Editor, který nastavuje nové standardy v automatizované úpravě produktových obrázků pro e-shopy. V našem rozhovoru s Markem Daňkom, Product Ownerem ve společnosti Feed Image Editor, se dozvíme, jak tato technologie funguje a co to znamená pro budoucnost e-commerce.

Jaké jsou podle vás nejzajímavější současné aplikace umělé inteligence v oblasti zpracování produktových obrázků?

V posledních měsících sledujeme velký boom hlavně okolo generativních nástrojů jako Midjourney, Stable Diffusion, Dall-E anebo Adobe Firefly, které umožňují vytváření nových obrázků anebo jejich modifikaci pomocí textového vstupu (promptu), případně s kombinací se vstupním obrázkem. Jsou to mocné nástroje s řadou možností, představují však jen fragment toho, co aktuálně AI při zpracování obrazových dat umožňuje.

Můžete popsat některé konkrétní příklady, kde AI výrazně zlepšila práci s produktovými obrázky?

Obecně se dá říct, že hlavním přínosem je, že AI umožňuje pokročilý postprocess produktových obrázků, který by byl jinak manuálně náročný a zdlouhavý, a že zvládá tyto úkony dělat hromadně a s kvalitním výsledkem. Konkrétním příkladem je odstranění pozadí, vylepšení kvality rozpixelovaných obrázků, odstranění vodoznaků a jiných nežádaných prvků, outpainting, rozpoznání objektů, případně generování textových popisů z obrázků, které se dají použít jako meziprodukt pro velké jazykové modely jako například GPT4 pro vygenerování popisu produktu.

Marek Daňko
Marek Daňko, Product Owner @ Feed Image Editor. Autor: Feed Image Editor

Jaké jsou stále přetrvávající výzvy nebo omezení v používání AI pro práci s produktovými obrázky?

Jedním z největších omezení je to, že generativní AI nástroje nejsou zatím schopné dodržet přesnost obrazových dat, která je v e-commerce klíčová. Příkladem může být to, že pokud vám chybí obrázek, tak s pomocí textového popisu produktu sice vygenerujete typově velmi podobný produkt, ale ne natolik, aby plně odpovídal reálnému produktu. Tím pádem je nepoužitelný.

Podobný efekt nastává, pokud se kombinací produktového obrázku na vstupu a textového promptu automaticky generuje grafická kreativa anebo ve fashion segmentu, kde vícero nástrojů nabízí možnost k produktům dokreslit modela či modelku. Je si proto třeba dávat pozor na to, co přesně tyto nástroje slibují a přistupovat k nim s rezervou.

Existují určité use casy, kde AI stále nenahradila tradiční metody práce s obrázky?

Kromě výše zmíněných příkladů jsou aktuální limity v generování konkrétního textu do obrázků a v kvalitě výstupu, která bývá limitována. Minimálně kvalita generovaného výstupu je hodně omezená výpočetní zátěží na GPU, která je značná. Na druhou stranu, je to jen pár dní, co nová verze Midjourney umožňuje upscale obrázků až do rozměru 4096 x 4096 pixelů, takže věřím, že se postupně podaří překonat i takové bariéry. 

Jakým způsobem vaše společnost využívá umělou inteligenci pro zlepšení produktových obrázků pro e-shopy?

Rozdělil bych to na 2 hlavní směry, a to na diagnostiku a editaci. V prvním případě jsme pomocí vícero AI technologií schopní hromadně detekovat obsahové a technické chyby v produktových obrázcích e-shopu, a též ověřit, či obrázky splňují povinné parametry ze strany zbožových srovnávačů a marketplaces. Diagnostiku zastřešuje naše webová aplikace Audit obrázků, která klientovi doručí mailem report do 24 hodin, a kterou nabízíme zdarma. 

Hromadnou editaci produktových obrázků zabezpečuje aplikace Feed Image Editor, která je doplňkem pro MERGADO Editor a AI tu pomáhá hlavně s odstraňováním vodoznaků, odstraňováním pozadí a vylepšením rozlišení nekvalitních obrázků. 

Feed Image Editor
Autor: Feed Image Editor

Naším hlavním produktem je zmiňovaný Feed Image Editor, který pomáhá e-shopařům s hromadnou úpravou produktových obrázků, a to v 3 hlavních krocích. Prvním je diagnostika aktuálního stavu, kde jsme schopni hromadně odhalit obsahové a technické chyby v obrázcích.

Druhým krokem je hromadná optimalizace podle požadavků inzertních portálů, a nakonec je to grafický editor, který umožňuje vytvářet grafické kreativy do inzerce na social platformách, jako je Facebook či Instagram. 

Oproti ostatním nástrojům se lišíme v tom, že všechny technologie jsou vyvíjené inhouse, včetně AI nástrojů vytvářených týmem našich AI developerů. Výhodou je plná kontrola nad algoritmy i trénovacími daty, kdy máme možnost se zaměřit jen čistě na produktové obrázky a ve výsledku tak přinášet ta nejlepší možná řešení pro naše klienty. 

Feed Image Editor
Autor: Feed Image Editor

Jaké konkrétní problémy s produktovými obrázky e-shopy nejčastěji řeší a jak vaše řešení pomáhá tyto problémy vyřešit?

E-shopy mají v obrázcích obecně mnoho chyb, ale často je začínají řešit, až když s nimi narazí v inzerci. Zbožáky a marketplaces požadují povinné parametry právě i na obrázky, a pokud je nesplní, produkty se nemusí dostat do inzerce. Záludné je to i v tom, že se tyto požadavky liší, takže je často nutné optimalizovat obrázky pro každý inzertní kanál zvlášť. Z našich dat vyplývá, že mezi nejčastější chyby patří vodoznaky v obrázcích, nepodporované pozadí, nízká kvalita obrázků, nesprávný formát, chybějící obrázky, příliš velká datová velikost obrázků a mnoho dalšího. 

S jakými cenovými srovnávači a marketplaces je vaše řešení kompatibilní?

Podporujeme většinu nejznámějších hráčů na trhu, kromě jiných zmíním Google Nákupy, Heureka, Facebook, Instagram, Pinterest, Snapchat, Zboží.cz, Alza trade, Mall by Allegro, FAVI, BIANO, GLAMI. V zásadě jsme však schopni zpracovat kterýkoliv z aktuálně více než 1000 podporovaných integrací MERGADO Editoru.

Feed Image Editor
Autor: Feed Image Editor

Jaké jsou podle vás budoucí trendy ve využívání AI pro produktové obrázky a jak se na ně vaše společnost chystá?

To asi ukáže čas, ale myslím, že jedním ze zajímavých směrů bude ještě lepší personalizace a zlepšování zákaznického zážitku. Tato sféra mi přijde zajímavá hlavně v kontextu vizuální podobnosti produktů a využití pro cílené kampaně. U nás aktuálně experimentujeme s vícero novými nástroji, detaily bych však ještě nerad prozrazoval.

Můžete nám přiblížit vaši vizi budoucnosti AI v e-commerce?

Potenciál je obrovský. Vidím mnoho možností, které by mohly ulehčit manuální repetitivní práci a víc se tak zaměřit na kreativní práci. Leží před námi však mnoho výzev, ať už výše zmíněná přesnost a konkrétnost výstupních dat, která je v e-commerce velmi důležitá, či stále nevyřešený právní rámec používání generativních AI, týkající se hlavně autorských práv obrázků používaných na trénování těchto modelů. Na řešení tohoto si budeme muset ještě počkat. 

Tento rozhovor vznikl díky partnerství AI Crunch a společnosti Feed Image Editor. Chceš se také stát naším partnerem a být tady vidět? Ozvi se nám!

Číst dále

©2024 AI Crunch