"Mít moře dat nestačí. Musí být zpracovaná tak, aby jejich přínos a hodnotu každý rozpoznal na první pohled",” Petr Kalát, BizMachine

Rozhovor s kolegou Petrem Kalátem o cestě k na první pohled snadnému zobrazení indikátorů aktivity, růstu a dostupnosti v našem Prospectoru.

V Prospectoru, online kukátku do nejpřesnější živé databáze českých, slovenských a maďarských firem, najdete na první pohled tři “budíky”, které danou firmu hodnotí. Možná si na ně vzpomenete z doby, kdy auta měla mechanické ukazatele stavu benzínu. Střelka se posouvala zprava doleva až k červené hranici s tím, jak jste benzín spotřebovávali. No a v Prospectoru tyto tři budíky fungují podobně. Střelka na první pohled ukáže, zda je firma aktivní či dostupná. Když má střelku v zeleném poli i v posledním budíku, je jasné, že navíc i roste. I když vypadají jednoduše, je za těmito indikátory skryto nespočet dat a spousta práce.
O vzniku a smyslu těchto BizMachine indikátorů jsme mluvili s našim kolegou Petrem Kalátem, který je jedním z jejich autorů.

Jaká byla vaše úvaha za vznikem BizMachine indikátorů v Prospectoru?

Máme opravdu velké množství dat. Jenže, aby ta data byla pro naše klienty užitečná, musíme jim je umět naservírovat tak, aby byla pochopitelná a srozumitelná. Když tě zajímá rychlý pohled na konkrétní firmu a otevřeš si její profil v Prospectoru, tak si nechceš stahovat excel s 300 řádky různorodých údajů, půl hodiny ho procházet a přemýšlet, co si z toho máš odnést. Potřebuješ rychle vědět, zda a jak je daná firma aktivní, nebo jestli je vůbec možné ji nějak kontaktovat. A přesně k tomu slouží naše BizMachine indikátory v Prospectoru, nejsou to jen data. Jde o data jednoduše vizuálně stravitelná.

V čem je tedy podle tebe hodnota těchto indikátorů?

Jde o skvělý způsob komunikace opravdu velkého množství dat tak, aby z nich naši klienti získali potřebnou informaci téměř instantně. Naše indikátory zohledňují přes 200 různých ukazatelů z víc než 50 různých zdrojů dat. A to jako uživatel vůbec nemusíš vidět a vědět. Na první pohled, maximálně za 2 vteřiny a bez velkého přemýšlení, totiž nasákneš obrovské množství informací. A to navíc velice srozumitelnou a uživatelsky přívětivou cestou. Firma je zelená, oranžová, nebo červená. Na první pohled super informace. Ale ono najít klíč k tomu, jak rychle vizualizovat velké množství dat tak, abys to naservírovala s jistotu, že každý bez vysvětlování pochopí, nač se dívá, trvá. Ale jak jednou takovou podobu reprezentace dat máš, zdá se to naprosto logické a jasné. 

Můžeš nám víc popsat, co vše za zdroje a data vstupuje do BizMachine indikátorů?

Vlastně skoro všechna data, která v BizMachine o firmách sbíráme hrají svou roli v našich indikátorech. Nejvíc jich vstupuje do indikátoru aktivity, který je nejúplnější a nejobsáhlejší. Vstupuje do něj na 150 signálů. Patří k nim třeba to, zda má firma funkční web, že si zaregistrovala novou pobočku, kupuje firemní auta, nebo se účastní nějaké veřejné zakázky, případně, že nějaký tendr vyhrála, nebo zda aktivně hledá lidi na portálech s nabídkami práce. Všechny tyhle informace máme. No a když je propojíme, je půlka práce hotová. Druhý krok je každý takový signál oskórovat. Tedy říct, zda má pozitivní či negativní efekt na celkovou aktivitu firmy. Takže zatímco, když nabíráš lidi, je to pozitivní bod, nefunkční web či insolvence jsou negativní markery.

A mají všechny signály stejnou váhu?

Rozhodně ne. Některé věci mají samozřejmě větší efekt a jiné menší. Do celkového skóre tak vstupuje i valuace síly daného signálu. Třeba pokud firma měla inzerát na nábor zaměstnanců před rokem, není to tak silný signál, jak když lidi hledá právě teď. Podobně je pro nás slabší signál třeba vyplněný profil na Firmy.cz, než už zmíněný aktivní inzerát na job serveru.

Můžeš ten poslední příklad trochu vysvětlit? Jaká je za tím logika?

Profil na Firmy.cz vyplníš jednou a máš ho. Nemáme jak zjistit, zda stále podnikáš a zda je správně vyplněný, aktuální a čerstvý. Navíc tě de facto nic nestojí - čas ani peníze. Ale když si platíš inzerát, musela jsi ho taky napsat, ale taky za něj zaplatit, je to pro nás mnohem silnější známka, že jsi jako firma nyní aktivní. Možná je důležité říct že ty indikátory rozhodně nejsou statické. Pokud dojde u nějaké firmy k zásadní změně, projeví se změna téměř okamžitě. Většinu našich dat totiž aktualizujeme na denní bázi. 

Aha rozumím. A hraje v indikátoru aktivity nějakou roli to, jak je celkově daná firma velká?

Asi budou některé vybrané signály korelovat s velikostí firmy. Přece jen o velkých značkách se častěji píše v médiích, mohou hledat více lidí, můžou se tam častěji dít nějaké změny a podobně. Ale nám nejde o soutěž. My nehledáme tu nejaktivnější firmu v republice. Nám jde o to sice firmy porovnat mezi sebou, ale ven nedáváme celkové skóre, nýbrž relativní porovnání s ostatními. Takže to funguje tak, že označíš všechny signály podle toho, zda mají pozitivní či negativní vliv a jak velkou roli hrají. Spočítáš to. Vyjde ti číslo, ale to nikde nezobrazuješ. Nikomu by nic neřeklo. Takže tu celkovou populaci firem znormalizuješ. To znamená, že ty firmy porovnáš do řady vedle sebe a seřadíš je na škálu, řekněme, že se pohybuješ od 0 do 100. No a tuhle škálu my pak ukazujeme střelkou budíku a barvou. Takže neříkáš tahle firma má skóre 370, to by bylo k ničemu. Je to moc? Je to málo? Řekneš, daná firma je zelená. Takže je aktivní a bude pravděpodobněji lepší cíl mých obchodních nabídek než firma, co je červená, což znamená, že má nějaké zásadnější problémy. Zkrátka ty naše budíčky nabízí snadno pochopitelná agregovaná oskórovaná data, ve kterých se vyznáš, aniž bys potřebovala nutně vidět nějaká čísla.

Ale barva není jediné, co na budíčku vidím, ne?

Barva slouží jako základní orientace. Pokud Tě zajímá detail, stačí budík rozkliknout a už vidíš maximálně 10 až 15 nejsilnějších signálů, které se na výsledném zařazení firmy do té či oné kategorie propisují. A rovnou u nich vidíš, zda šlo o plusové či mínusové body. Třeba když je firma super aktivní, ale propouští lidi, bude zelená, ale po rozkliknutí uvidíš na konci i ono propouštění s červeným mínusem. Když tě zajímá detail nebo větší hloubka, tak ti ji jednoduše a transparentně na jeden klik nabídneme. A mimochodem rovnou tak můžeš vidět, z čeho se dané skóre napočítalo. A to zase hezky demonstruje, jaká všechna data v BizMachine sbíráme a co o firmách víme.

Rozumím. Jak dlouho vlastně trvala kalibrace toho, aby data, která zobrazujete seděla a byla užitečná?

Nejlepší zpětnou vazbou pro nás jsou naši klienti. Ti naše data používají a kdyby byla zavádějící, dávají nám feedback. Některé indikátory - třeba takový indikátor dostupnosti máme zkalibrovaný díky kvantitativní zpětné vazbě z velkého call centra. Opravdu primárně posloucháme naše zákazníky a podle toho, co jim přináší hodnotu, víme, jak indikátory vyladit.

Hezky to celé popisuješ. Napadá mě už jen poslední otázka: Ty jsi autorem celé myšlenky?

Aktuálně jsem nejblíž tomu, co lze nazvat autorem indikátorů. Ale s celou myšlenkou myslím přišel Martin Nepraš, jeden z našich tří zakladatelů, už v roce 2017. Už tehdy jsme měly spousty dat a z nich vyplývala plejáda informací a my přemýšleli, jak je nejlépe vytěžit a využít. No a ve dvou či třech lidech jsme došli k nápadu na agregaci našich dat, která by vedla k tomu, že se z nich bude dát vyvodit nějaká konkrétní syntetická hodnota. A tak vznikl nápad na tyto indikátory. A mě baví, že i po těch letech ten nápad funguje. Naše indikátory jsou skvělý způsob, jak množství dat, která máme, ukázat a vizualizovat tak, aby to bylo užitečné a na první dobrou dávalo jasnou informaci o tom, jak na tom ta či ona firma je.

Petr Kalát je Data Engineer. V BizMachine s námi pracuje od března roku 2017.

Byl jedním z těch, kdo se primárně zasloužil o fungování našich BizMachine indikátorů v podobě, v jaké je dnes naši klienti znají.