logo

Seznam pro vývojáře

Seznam Newsfeed

Seznam pro vývojářeSeznam NewsfeedJak data načítáme

Jak data načítáme

1. RSS výdej

První načtení článku provedeme z výdeje RSS společně s položkami k jednotlivým článkům, které jsou u tohoto článku v RSS k dispozici.

2. Aktualizace v článcích

Pokud dojde k úpravám článku, jsme schopni tyto změny (titulek, popis a obrázek) za určitých podmínek načíst. V tomto případě už načítáme zdrojový kód (dostupný pod URL článku), nikoli z RSS. Hlídejte prosím priority jednotlivých položek ve zdrojovém kódu. Titulek a popis načítáme jen z JSON-LD, obrázek prioritně z JSON-LD a pokud není k dispozici, zkoušíme načíst obrázek z jiných sekcí. Problém může např. nastat při absenci JSON-LD, když nesprávný náhledový obrázek použije tag og:image (viz open graph), protože pak má dle priorit obrázků obrázek tagovaný og:image přednost před hlavním náhledovým obrázkem (získaným při prvním načtení z RSS, viz předchozí bod 1). Tím by vzniklo nežádoucí chování z pohledu správného publikování dat. Volte ve zdrojovém kódu článku takové tagy, které nebudou přetěžovat prioritu ostatních tagů (pokud to není záměr).

Pro aktualizace se zachováním co největší flexibility na obou stranách doporučujeme použít sekce JSON-LD.

3. Přístup robotem

Ke stahování článků používáme našeho robota. Abyste ale poznali že jsme to my, identifikuje se hlavičkou:

User-Agent: SeznamHomepageCrawler/<version>

kde <version> se mění podle aktuálně nasazené verze.

Pokud omezujete přístup na váš server (např. přes CloudFlare), je pro bezproblémové načtení vašich článků potřeba abyste měli povoleny vyjímky pro tyto rozsahy IP adres: