HTTP Archive

Według źródła: „The HTTP Archive tracks how the Web is built.”

HTTP Archive archiwizuje internet. Dosłownie.

Jak niektórzy zauważyli ostatnimi czasy zajmują mnie znowu tematy związane z wysokopoziomowym spojrzeniem na WWW. W pewnym projekcie będę miał do oceny portal (wg. biznesu duży, dla mnie taki raczej średni). W każdym bądź razie muszę mieć twarde dowody i argumenty, żeby móc jakoś bronić wymagania biznesu.

HTTP Archive jest to repozytorium informacji o wydajności sieci WWW. Zbierane są informacje takie jak rozmiar stron, nieudane żądania i wykorzystywane technologie. Dzięki tym informacjom możemy zobaczyć trendy w budowie stron internetowych i mamy zestaw danych do prowadzenia badań wydajności i budowy witryn w sieci internetowej.

Zbiór ten oparty jest na danych z 1 miliona witryn. URL’e pochodzą z Alexa Top 1,000,000 Sites
Sama usługa Alexa jest również ciekawa i być może doczeka się tu jakiego opisu. Mała próbka: Alexa Top Sites in Poland – ciekawa lektura, bardzo ciekawa

Jeśli adres interesującej Cię witryny jest wśród analizowanych przez usługę, możesz zobaczyć jak wyglądają jej statystyki dla konkretnego badania. Badania wykonywane są 2 razy w miesiącu: 1 i 15 dnia miesiąca.

HTTP Archive
Oczywiście oprócz danych konkretnych witryn mamy wykresy i histogramy trendów i mnóstwo statystyk.

Dostęp do danych zebranych przez HTTP Archive możliwy jest również przez usługę Google BigQuery – jak już się dobiorę to oczywiście opiszę co i jak. Na zachętę zapraszam do poprzedniego wpisu o Google BigQuery

#miroburnchallenge 13/30

HTTP Archive

Dodaj komentarz

This site uses Akismet to reduce spam. Learn how your comment data is processed.