Seznam chystá vlastní Facebook
Česká techonologická jednička staví největší český mediální dům. Na její nejnavštěvovanější stránce, homepage Seznamu, zároveň najdete rozsáhlý rozcestník po ostatních českých médiích. Jaké s ním má Seznam plány?
Ondřej Tolar je šéfem obsahu domovské stránky Seznam.cz skoro tři roky. Do jeho gesce tak spadá i nekonečný feed, který na domovské stránce Seznamu navazuje na klasické zpravodajské boxy Seznam Zpráv, Novinek, Super.cz a dalších webů. Ty spojuje jedno: buď spadají přímo pod hlavičkou českého technologického obra, nebo s ním úzce spolupracují.
Feed naopak sdružuje texty z webů, které Seznamu výměnou za propagaci nabízejí reklamní prostor a část výnosů z něj. I když to tak na první pohled nemusí vypadat, agregátor článků z českého internetu je nejdůležitějším počinem české mediální scény za poslední roky. Z neznámých webů jako Život v Česku nebo Přehledně24 udělal ze dne na den portály návštěvností srovnatelné třeba s Aktuálně.cz nebo webem Českého rozhlasu.
Poslední měsíce se Seznam snaží článkový feed odplevelit. A to nejen pomocí důslednější editorské práce, ale především díky umělé inteligenci. Tím ale proměna feedu nekončí, v plánu je zapojení influencerů, větší důraz na diskuze a celková proměna feedu směrem ke klasické facebookové zdi.
Návštěvníci domovské stránky se shodují s průřezem populace, a to i v politické orientaci. Pro hodně kolegů je to zajímavá zkušenost.
Nekonečný feed na domovské stránce Seznamu, do něhož se načítají články konkurenčních médií, je asi nejzásadnější novinkou českého internetu posledních let. Kdo s nápadem přišel?
Osobně jsem u toho nebyl, v Seznamu jsem teprve tři roky. Nápad se zrodil v roce 2015 během debat o tom, jak návštěvníkům nabídnout víc obsahu nad rámec našich klasických obsahových boxíků. Ty tehdy promovaly jen weby Seznamu a Novinky.cz, se kterými máme dlouhodobé partnerství. Kolegové zkrátka chtěli dostat na homepage víc publicistických článků s co nejširší tematickou základnou. Zpravodajství jsme měli díky našim webům podchycené už tehdy, proto do feedu na začátku padaly hlavně magazínové texty a zajímavosti.
Podle čeho jste weby do výběru zařazovali? A podle čeho je řadíte dnes?
Na začátku byl feed jen pro vybrané weby. Postupem času, když se ukázalo, že se jedná o životaschopný produkt, se z feedu stala široká obsahová platforma, která je otevřená úplně pro všechny. Dnes na ni najdete víc než tři sta webů. To s sebou ale přineslo řadu rizik a problémů, které teď postupně řešíme. Pro nás je důležité, že na články kliká stále víc lidí a lidé si zvykli nenavštěvovat jen odkazy v horní části webu, ale čím dál častěji sjedou níž a objevují personalizovaný obsah, který jim ve feedu nabízíme.
Máte spočítáno, kolik lidí na články ve feedu každý den „sjede“ a začnete si je prohlížet?
Zhruba 1,6 milionu uživatelů denně. Jeden uživatel zkonzumuje v průměru sedm a půl článku za den. Přehrání videí, která jsou ve feedu také, evidujeme zhruba půl milionu každý den. Za měsíc feed alespoň jednou navštíví 4,5 milionu lidí, víc než polovina tuzemské dospělé populace.
Ondřej Tolar
To jsou na české poměry úctyhodná čísla. Pro srovnání, jeden díl Devadesátek sleduje průměrně okol dvou milionů lidí.
Je to tak. Ale takhle to srovnávat úplně nejde. U Devadesátek koukají všichni na to samé, u nás se ve feedu objeví víc než 1500 článků denně.
Kdo vlastně dnes chodí na homepage Seznamu?
Hodně lidí na homepage Seznamu pořád chodí kvůli vyhledávání a své e-mailové schránce, ale většina už kliká hlavně na obsah. Obecně se návštěvníci domovské stránky shodují s průřezem populace, věkem, příjmy, vzděláním… Nejvíc uživatelů, víc než polovinu, máme mezi 25 a 45 lety. Asi čtvrtina návštěvníků je starší 55 let. A průřez populace je také v politické orientaci. Pro hodně kolegů ze Seznam Zpráv, které mají na homepage výsadní pozici, je to zajímavá zkušenost. Poprvé v životě nepíšou jenom pro specifickou skupinu čtenářů jako třeba na Aktuálně nebo v Hospodářkách. U nás se jim pravidelně stává, že odezva na jejich texty je přesně padesát na padesát, a kritických komentářů spousta.
I přesto je občas komentáře u vás radost číst…
Denně máme dvanáct tisíc aktivních diskutujících, kteří vypublikují přes šedesát tisíc příspěvků. A myslím, že velká část je psaná kultivovaně a na úrovni, i když jsou některá témata více vyhrocená, ale taková je nyní celá společnost.
Mně to číslo přijde v kontextu celkové návštěvnosti homepage malé. Je vidět, jak málo lidí dokáže formovat obraz české společnosti. Vy nově správu diskuzí nabízíte také cizím webům, které publikují články do feedu. Jak vlastně probíhá moderace a kolik lidí se čistě mazáním škodlivých komentářů zabývá?
Podle nás to není malé číslo. Jen v lednu napsali naši uživatelé přes dva miliony příspěvků a lajků máme za stejné období 25 milionů, to je skoro trojnásobek než loni touto dobou. Co se týká počtu uživatelů, jsme větší než český Twitter. Pro správu máme široký editorský tým, který pracuje na směny, abychom pokryli každou denní i noční dobu. Moderace se řídí přesně stanovenými pravidly.
Naše diskuze aktuálně využívá stovka webů a nově ji nabízíme do celého trhu, takže si naši platformu může implementovat i web, který není na domovské stránce Seznamu. Velmi intenzivně se věnujeme algoritmům, které příspěvky vyhodnocují a řadí automaticky. S tím, kam očekáváme, že se naše sociální platforma vyvine, nemáme ani jinou možnost.
Dřív se vše řešilo manuálně, teď už se snažíme nutnost lidského zásahu minimalizovat. Máme nasazenou neuronovou sít na detekci clickbaitových titulků...
Feed jste spustili, protože jste chtěli nabídnout čtenářům Seznamu víc informací z různých koutů internetu, ale určitě tu jsou i jiné motivy. Jak pracujete s daty o uživatelích? Vědět, kdo co čte nejen na Seznamu, ale na skoro celém českém internetu, musí být skvělé pro cílení reklamy, ne?
Dat o uživatelích máme v rámci Seznamu obrovské množství. V rámci feedu data využíváme k tomu, abychom neustále zdokonalovali náš doporučovací algoritmus. Zajímá nás, jaký obsah čtenáři konzumují, ale taky co chtějí aktivně odebírat, co lajkují, jaké video si otevřeli a dokoukali ho do konce a tak dále. Vstupů máme mnohem víc.
Všechny pak pomáhají utvářet profil daného uživatele tak, abychom mu co nejpřesněji dokázali nabídnout nejenom mainstreamová témata, která konzumují všichni, nějaké ty zajímavosti, zpravodajství, ale i odbornější nebo specifičtější články. Zjednodušeně algoritmus funguje tak, že když zjistíme, že se uživatel zajímá o cyklistiku, nabídneme mu víc článků o cyklistice.
Mimochodem, letos chceme na Seznamu spustit novou platformu, pracovně jí zatím říkáme Seznam Medium. Ta by měla rozšířit články ve feedu o blogové příspěvky a jiné one-man show projekty, pro než je zatím technická náročnost implementace našeho řešení vstupní překážkou. Tuhle službu bychom pak rádi nabídli i neziskovkám nebo státním institucím.
Jaký byl nejčtenější článek ve feedu?
Podrobná data čtenosti článků máme jen za poslední tři roky, starší bohužel dohledat nejdou. Nejčtenější je článek o tom, jak rychle kukačka snese vejce do cizího hnízda. V první desítce jsou pak tři zprávy ke covidu z první vlny pandemie, kdy čtenost na homepage Seznamu extrémně vyrostla v důsledku zvýšené poptávky lidí po zpravodajství. A hned tři články jsou zajímavosti z přírody či o zvířatech. Mezi nejčtenější články se probojovaly i Mapy.cz se svými novými leteckými snímky.
Takže zatím čistě mediální prostor čeká proměna směrem… k facebookové zdi?
Vlastně ano. Už teď experimentujeme s komentáři ve feedu a projekt Medium přinese kromě novinářského také nové typy uživatelského obsahu. Loni jsme navíc spustili první verzi sociálního profilu uživatelů. Nyní se vám na něm agregují vaše diskuzní příspěvky, ale můžete na něj taky sdílet vámi doporučený obsah, psát příspěvky nebo pomocí něho sledovat ostatní, kteří vás baví.
To bude klást mnohem větší nároky na vaše editory, aby zajistili, že se ve feedu neobjeví něco, co by se tam objevovat nemělo. Ostatně i u klasických mediálních webů jste si prošli velkými porodními bolestmi, než se podařilo dostat obsah ve feedu do současné podoby.
Dřív se vše řešilo manuálně, teď už se snažíme nutnost lidského zásahu minimalizovat. Máme nasazenou neuronovou sít na detekci clickbaitových titulků, v každém článku si hlídáme podíl původního obsahu, kontrolujeme, jestli článek není opsaný odjinud, a tak dál... To stejné chceme dělat i u uživatelského obsahu.
Jak to funguje v praxi? Jak rychle zjistíte, že článek už vyšel někde jinde?
Na základě obsahových duplicit vznikají clustery. Obecně lze říci, že algoritmus si vybírá pro doporučování ten článek, který je propracovanější, lépe vyzdrojovaný nebo je z webu, o kterém víme, že ho pravidelně čtete. Když chodíte na Peníze.cz, doporučíme vám s velkou pravděpodobností článek z Peníze.cz a ne od konkurence. Výhledově chceme zohlednit i robota na fulltextové vyhledávání, kterého využívá náš vyhledávací engine. Ten si dokáže s duplicitami na webech poradit.
Zmínil jste detektor clickbaitových titulků. Dokážu si představit, že hranice mezi povoleným a zakázaným je hodně rozmazaná i pro zkušeného editora z masa a kostí. Co teprve pro robota…
Robot nakonec udělá méně chyb než editor a měří všem stejně, to je nesporná výhoda. Jako clickbaitové vyskakují i titulky z našich interních redakcí a řešíme to s nimi pravidelně. Je škoda, když zabijete kvalitní obsah tím, že na něj přivedete čtenáře, který od něj čeká něco úplně jiného a po dvou sekundách odejde naštvaný pryč. Bohužel titulky některých webů vypadají spíš jako hádankářský věstník než informační zdroj.
Jak funguje detektor clickbaitových titulků?
Abychom otestovali, jak funguje odhalování nevhodných a zavádějících titulků, připravil jsem pro článek tři varianty titulků:
- Seznam chystá český Facebook
- Exkluzivně! Seznam chystá novinku, která změní život čtyřem milionům Čechů. Co to je?
- Domovská stránka Seznamu se promění. Chce víc konkurovat Facebooku
Ondra každý z nich prohnal detektorem a vrátil mi výsledek na škále od 0 do 1, kde je nula absolutně v pořádků a jednička totální clickbait. Jak to dopadlo?
Titulek Seznam chystá český Facebook si odnesl lichotivé skóre 0,026031398195773363. Pro robota je tedy průchozí a rozhodli jsme se ho použít, byť částečně clickbaitový je, protože ve čtenáři vyvolává pocit, že Seznam chystá mnohem větší projekt, než článek popisuje. Další verze: Exkluzivně! Seznam chystá novinku, která změní život čtyřem milionům Čechů. Co to je? byla psaná s cílem nechat robota vyniknout a správně neprošla. Míra clickbaitovosti (0,59314612299203873) je daleko za hranicí tolerance a ve feedu by se takový článek neobjevil. Poslední titulek Domovská stránka Seznamu se promění. Chce víc konkurovat Facebooku vyšel algoritmu s hodnotou 0,006018564570695162 jako titulkový premiant. Příště ho určitě použijeme…
Dokud budou novináři hodnocení podle čtenosti svých článků, asi tenhle problém nevymýtíte…
Osobně si myslím, že pozice na homepage Seznamu jsou tak luxusní, že by na články uživatelé klikali i bez clickbaitu. A proto, aby všichni měli rovné podmínky, jsme si dali za cíl clickbait vymýtit. Uživateli dáme lepší službu a věřím že i redakce budou na konci spokojené, protože ve finále jde především o kvalitu obsahu, nikoli o neférovou návnadu.
Některé redakce, včetně té naší, používají odlišené titulky pro svůj web a Seznam feed…
Ano. V minulosti to bývalo zvykem, ale nyní jsme se rozhodli tuto praxi ukončit. Nebudeme spoléhat na to, co nám daný web pošle, ale budeme si pro titulky sahat přímo na původní web.
Nepovede to k tomu, že budou všichni používat clickbaitové titulky i na vlastních webech?
Věřím, že seriózní weby to dělat nebudou a ostatní odchytí náš detektor clickbaitu.
Facebook zvýhodňoval články, na které lidi reagovali negativně. U nás naopak plusové body získávají komentáře s pozitivní zpětnou vazbou.
Vloni jste se rozhodli, že do feedu pustíte jen ta zpravodajská média, která mají nadprůměrný rating Nadačního fondu nezávislé žurnalistiky. Proč?
Nejde o to mít nadprůměrný rating, jde o to nepropadnout v hodnocení. Právě proto, abychom feed očistili od webů, které to nedělaly úplně čistě. Webové stránky, které jen opisovaly zprávy od ostatních, aniž by generovaly vlastní témata a velmi často při převzetí pozměnily i vyznění textu, už ve feedu nenajdete. Pro všechny zpravodajské weby platí povinnost mít rating NFNZ a ty s nízkým hodnocením naše algoritmy čtenářům nedoporučují.
A proč jste vybrali právě rating Nadačního fondu nezávislé žurnalistiky.
My s Nadačním fondem nezávislé žurnalistiky pracujeme dlouhodobě. Jejich kritéria jsou veřejně známá, transparentní a vychází ze zahraničních zkušeností. Každý web má možnost na svém hodnocení zapracovat a zlepšit tak, aby se ve feedu mohl objevit. Zároveň ale pracujeme i s jinými žebříčky, třeba Konspiratori.sk a dalšími, které řeší dezinformační weby.
Je potřeba se zaštiťovat vnější autoritou? Dat máte v Seznamu skoro nekonečně…
Seznam je pořád primárně technologická platforma, která je otevřená pro všechny. Nechceme být tím, kdo řekne: Tento článek se nám nelíbí. Byli bychom ve střetu zájmů.
To samé říká Mark Zuckerberg. Jak to dopadá, všichni vidíme. Není čas vzít odpovědnost do vlastních rukou?
Vždyť právě to děláme. Využíváme externí partnery, nezávislé žebříčky, to vše s jasným cílem prostředí kultivovat. Ať už ve feedu, nebo v diskuzích. Facebook například zvýhodňoval články, na které lidi reagovali negativně, to my ze zásady neděláme. Naopak plusové body získávají komentáře s pozitivní zpětnou vazbou. Často se setkáváte s názory, se kterými osobně nesouzníte, ale to neznamená, že to není relevantní poznámka v rámci veřejné diskuze. Například ve chvíli, kdy se v diskuzi objeví názor, který zpochybňuje, jestli se lidé mají povinně očkovat, můžeme s takovým názorem nesouhlasit, ale ten člověk na něj má právo. Pokud je někdo útočný či sprostý, tak ho samozřejmě zablokujeme. A plánujeme naše algoritmy rozšířit o detekci dezinformačních narativů.
Ani webům, ani diskutérům nechceme a nebudeme diktovat, o čem mají psát. Budeme se ale snažit našim uživatelům zobrazovat co nejkvalitnější obsah s co největší přidanou hodnotou. A k tomu nám dopomáhají právě nezávislá kritéria a žebříčky, které nastavují benchmark.
Kam dál? Internet na Finmagu:
- Pro někoho jsem všeználek, co nic nevytváří, říká Mikýř
- Když si lednička pokecá s vysavačem. 5G sítě změní svět i společnost
- Čas promrhaný na internetu není promrhaný
- Tajemství čínských webových stránek
- „Zadarmo drahé“ – jak vydělává Google nebo internetové porno, když nic nestojí
Když je škola soukromou hrou… Čtěte v aktuálním Finmagu
Je čas upravit slavný slogan Komenského. Alternativní formy vzdělávání v Česku bodují a soukromé školy často udávají směr i veřejným školám.
ŠKOLA JE BYZNYS
Do montessori škol Duhovka investovali manželé Janečkovi přes 300 milionů. • Jan Kala do škol Heuréka vložil zase peníze ze svého podílu v eBance. • Proč jsou přesvědčeni, že to bylo to nejlepší, co mohli udělat?
BYZNYS JE HRA
Kdy odejít? ptá se dnes celá generace podnikatelů. • Jak se povedlo Jaroslavě Valové předat SIKO dětem? • Kdy se Zbyněk Frolík rozhodl svěřit Linet manažerům? • A proč v Dino Toys převzali vedení vnuci zakladatele?
Související témata
Nejčtenější články
Aktuální číslo časopisu
Když je škola soukromou hrou… Čtěte v aktuálním Finmagu